JuJuKwakKwak

[2] 데이터 수집, 정제, 모델링 본문

Data Science/여행 종합 추천 시스템 : 이지트립

[2] 데이터 수집, 정제, 모델링

jujukwakkwak 2022. 5. 27. 18:36

데이터 수집

- 네이버, 카카오맵, 구글

- 망고플레이트, 트립어드바이저

 

데이터 정제

- 불필요한 단어 제거

- 가중 평점을 만들어 평점을 통일

 

데이터 모델링

- CBF : 식당 유형에 따른 추천시스템. 예) 한식을 주로 이용한다면, 다른 한식 집을 추천한다.

- CF : 각 사이트를 사용자로 가정하여, 사용자-식당 간 상호 데이터를 활용한 추천시스템

  예) '철수'는 A식당에 높은 평점을 줬다. '영희'도 A식당에 높은 평점을 줬다.

       '영희'가 높은 평점을 준 다른 식당을 '철수'에게 추천한다.