TIL

Day 36

jay3108 2022. 2. 8. 23:54

TIL 012

데이터 분석 부트 캠프 36일차

1. 아이템 기반 최근접 이웃 협업 필터링 (CF-KNN(item))

  • 협업 필터링 방식 (Collaborative Filtering) : 사용자 행동 양식만을 기반으로 추천을 수행하는 것 → 친구들에게 물어보는 것!
  • 축적된 사용자 행동 데이터를 기반으로 사용자가 아직 평가하지 않는 아이템을 예측하여 평가 하는 것
  • 최근접 이웃 방식 (KNN)과 잠재 요인 방식(MF)로 나뉨 → 사용자-아이템 평점 행렬 데이터 기반!
  • 사용자 기반 : 당신과 비슷한 관객들이 다음 영화도 관람
  • 아이템 기반 : 이 영화를 본 다른 관객들은 다음 영화도 관람 (일반적으로 정확도가 더 높음)
  • 실습 : github

2. MF 기반 잠재 요인 협업 필터링

  • 사용자-아이템 평점 매트릭스 속의 잠재 요인을 추출하여 추천 예측을 하는 기법 → 넷플릭스 경연대회 우승
  • 행렬 분해(Matrix Factorization) : 다차원 행렬을 SVD와 같은 차원 감소 기법으로 분해하는 것
  • 행렬 분해 과정은 아직 이해못했음 : 과정은 별도 포스팅 예정
  • 실습 : github

참고 자료

  • 박태훈 왓챠대표 : 국내외 OTT동향과 왓챠의 전략

개인 공부

  1. 추천 시스템을 이용한 미니 프로젝트 구상
    • 메타크리틱을 크롤링하여 장르별 닌텐도 스위치 타이틀 추천 : CF 추천 알고리즘
    • CF 외에 다른 알고리즘의 경우 사용자별 평점 데이터가 있어야 한다. 그런 데이터셋이 영화나 영상자료 말고 얼마나 될라고...
  2. ADSP 자격증 공부
    • 1장 데이터의 이해,
    • 2장 데이터의 가치와 미래
    • 3장 가치창조를 위한 데이터 사이언스와 전략 인사이트