수리통계 분석 코딩 실습

3. 호텔 크롤링 - 네이버 예약 본문

카테고리 없음

3. 호텔 크롤링 - 네이버 예약

얼려먹는 요구르트 2024. 8. 15. 19:53
✔️ 네이버를 통한 호텔예약 크롤링 방법

1. 네이버 예약 홈페이지를 선택한 이유

예약 홈페이지의 사이트가 여타 사이트와 유사하며 다른 예약 사이트의 가격도 접속이 가능함. 

무엇보다, 크롬을 통한 크롤링이 안정적으로 접근이 가능해 선택

 

2. 현재 구현 내용

[1] 여행장소, 여행 일정(시작,끝), 성인 인원수를 포함해 검색 가능

체크 표시된 부분만 추가 수정 필요

 

[2] 각 호텔의 구체적인 정보를 접속할 수 있는 url 추출 후 json 파일로 저장

 

hotel_url를 이용해 아래 추가사항 수정 필요

 

[+] 추가 사항

 

0) 네이버 호텔의 경우 url 접근이 단순함 -> url 변수명 변경을 통한 검색은? 

 

1) 어린이 명수 추가에 대한 검색 - 어린이의 경우 네이버 호텔예약 사이트는 연령대 선택을 추가로 클릭해야하므로, 해당 내용을 포함해서 검색되도록 크롤링 코드를 추가해야함. 

 

2) 검색 목록에서 호텔 사이트를 직접 접속해 각 호텔에 대한 자세한 정보를 크롤링해오는 코드를 추가로 작성해야함. 

→ 현재는 각 호텔에 접근하는 url만 추출된 상황

* html parser를 이용해서 페이지 접근 후 크롤링 예정 

다만, 탭 변경시 [요약]에 들어오면 가격비교, 사진, 관련글, 이용후기, 위치, 시설정보 탭을 재 접속할 수 없으므로, 크롤링 방식을 어떤식으로 할지 고민해야함.