TIL

Day 37

jay3108 2022. 2. 14. 23:19

TIL 013

데이터 분석 부트캠프 37일차

1. 파이썬 추천 패키지 suprise

  • 이미지 195
  • 추천 알고리즘 클래스
    • SVD : 행렬 분해를 통한 잠재 요인 협업 필터링 (MF)
    • KNNBasic : 최근접 이웃 협업 필터링
    • BaselineOnly : 사용자 Bias와 아이탱 Bise 감안한 SGD 베이스라인 알고리즘 (예측 평점 등)
  • 내장 데이터셋 (ml-100k)을 이용한 실습 : CF
  • 글로우 픽 데이터를 이용한 실제 프로젝트 연습 : CF

2. 추천 시스템 구축 팀 프로젝트

  • Brainstorming
    • metacritic 크롤링 해서 닌텐도 스위치 타이틀 추천
    • 교보문고 베스트셀러 크롤링 후 추천시스템과 비교 (키워드 픽 유용)
    • 디퓨저, 향수 추천? 키워드 찾을 수 있을까... 라벨링 어려움
    • Tripadvisor : 태그가 많지 않음 .. 역시 라벨링 이슈 발생
  • 교보문고 베스트셀러 데이터를 이용한 추천 시스템 구축 선정
    • 크롤링 코드 작성 중