일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 제임스 클리어
- 영화
- 네이버 웹툰
- 산책
- geopandas
- 액션
- 아주 작은 습관의 힘
- 완결
- QGIS
- 완결 웹툰
- 빅데이터 분석기사
- 네이버 완결 웹툰
- 커피
- 사랑
- 로맨스
- 서귀포
- 애니메이션
- pandas
- python
- 진심
- 가족
- 넷플릭스
- 빅데이터 분석기사 필기
- 만화 영화
- 네이버
- 습관
- 웹툰
- 제주도
- 이범선
- 이기적 출판사
- Today
- Total
목록Data Science/여행 종합 추천 시스템 : 이지트립 (6)
JuJuKwakKwak
1. 아이디가 있고, 아이디별로 리뷰를 달은 사이트를 찾지 못했다. -> 식신 사이트에 아이디도 많고, 리뷰도 많다. 다음에는 이 사이트를 크롤링 해도 좋을 듯하다. 2. 시간이 부족해서 맛집만 크롤링했다. -> 기회가 된다면, 숙소까지도 크롤링해서 맛집과 같이 추천하고 싶다. -> '여기 어때' 사이트가 좋을 듯하다. 3. 지속적인 커뮤니케이션이 중요하다. -> 조금이라도 이슈가 발생하면 공유해야 한다. -> 계속 방향을 점검하는 시간이 있어야 한다.
MF기반 잠재 요인 협업 필터링¶ In [1]: import pandas as pd import numpy as np from sklearn.metrics import mean_squared_error from tqdm import notebook In [2]: def get_rmse(R, P, Q, non_zeros): error = 0 # 두개의 분해된 행렬 P와 Q.T의 내적 곱으로 예측 R 행렬 생성 full_pred_matrix = np.dot(P, Q.T) # 실제 R 행렬에서 널이 아닌 값의 위치 인덱스 추출하여 실제 R 행렬과 예측 행렬의 RMSE 추출 x_non_zero_ind = [non_zero[0] for non_zero in non_zeros] y_non_zero_ind = [no..
1페이지 크롤링¶ In [1]: # 필요한 라이브러리를 임포트하기 import sys # 시스템 import os # 시스템 # 데이터 다루기 import pandas as pd import numpy as np # selenium 크롤링 from selenium import webdriver from selenium.webdriver import ActionChains as AC from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By # 크롬 드라이버 import c..
1개씩 크롤링¶ In [1]: # 필요한 라이브러리를 임포트하기 import sys # 시스템 import os # 시스템 # 데이터 다루기 import pandas as pd import numpy as np # selenium 크롤링 from selenium import webdriver from selenium.webdriver import ActionChains as AC from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By # 크롬 드라이버 import ch..
데이터 수집 - 네이버, 카카오맵, 구글 - 망고플레이트, 트립어드바이저 데이터 정제 - 불필요한 단어 제거 - 가중 평점을 만들어 평점을 통일 데이터 모델링 - CBF : 식당 유형에 따른 추천시스템. 예) 한식을 주로 이용한다면, 다른 한식 집을 추천한다. - CF : 각 사이트를 사용자로 가정하여, 사용자-식당 간 상호 데이터를 활용한 추천시스템 예) '철수'는 A식당에 높은 평점을 줬다. '영희'도 A식당에 높은 평점을 줬다. '영희'가 높은 평점을 준 다른 식당을 '철수'에게 추천한다.
1. 여행 때 숙소, 맛집을 잘못 고른 경험이 있다. -> 네이버 검색 위에 뜬 거 골랐지만, 가격 대비 별로 였다. 2. 꼼꼼히 검색하는 것이 힘들고 귀찮아서 그냥 맨 위에 있는 거 골랐다. -> 검색 결과와 리뷰가 너무 많아서 비교하기 힘들다. 3. 나름 평점도 높고 리뷰도 많았는데 왜 별로 였을까? -> 사이트 광고, SNS 마케팅 많이 한 곳일 수록 위로 노출되는 것 같다. 따라서 여러 사이트에 있는 맛집과 숙소 검색 결과를 수집해서 추천해보자.