Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 행정동표시
- dependency modeling
- soa환불
- 태블로행정동
- soa시험예약
- 이공계 대학원 연수 프로그램
- random effect model
- 태블로
- 한-캐대학원
- 태블로맵
- 민원데이터
- explicit random effect model
- 맵지도
- 천안시 데이터 분석
- torch.nn.Linear
- soa자리선택
- rstudio 설치 오류
- rstudio이전버전 설치
- rstudio 이전버전
- 한국캐나다대학원연수
- 대학원연수프로그램
- wishart-gamma
- 맵지도시각화
- 행정동시각화
- iris대학원
- 모수추정
- soa시험
- soa날짜
- 태블로에러
- 태블로맵지도시각화
Archives
- Today
- Total
수리통계 분석 코딩 실습
3. 호텔 크롤링 - 네이버 예약 본문
✔️ 네이버를 통한 호텔예약 크롤링 방법
1. 네이버 예약 홈페이지를 선택한 이유
예약 홈페이지의 사이트가 여타 사이트와 유사하며 다른 예약 사이트의 가격도 접속이 가능함.
무엇보다, 크롬을 통한 크롤링이 안정적으로 접근이 가능해 선택
2. 현재 구현 내용
[1] 여행장소, 여행 일정(시작,끝), 성인 인원수를 포함해 검색 가능
[2] 각 호텔의 구체적인 정보를 접속할 수 있는 url 추출 후 json 파일로 저장
[+] 추가 사항
0) 네이버 호텔의 경우 url 접근이 단순함 -> url 변수명 변경을 통한 검색은?
1) 어린이 명수 추가에 대한 검색 - 어린이의 경우 네이버 호텔예약 사이트는 연령대 선택을 추가로 클릭해야하므로, 해당 내용을 포함해서 검색되도록 크롤링 코드를 추가해야함.
2) 검색 목록에서 호텔 사이트를 직접 접속해 각 호텔에 대한 자세한 정보를 크롤링해오는 코드를 추가로 작성해야함.
→ 현재는 각 호텔에 접근하는 url만 추출된 상황
* html parser를 이용해서 페이지 접근 후 크롤링 예정
다만, 탭 변경시 [요약]에 들어오면 가격비교, 사진, 관련글, 이용후기, 위치, 시설정보 탭을 재 접속할 수 없으므로, 크롤링 방식을 어떤식으로 할지 고민해야함.