리스크 컨설턴트 성장기
프로필 배경
프로필 로고

리스크 컨설턴트 성장기

    • 분류 전체보기 (157)
      • About. (1)
      • Risk Management (1)
        • Credit Risk (1)
      • Data Science (46)
        • python (41)
        • R (2)
        • SQL (2)
        • SAS (0)
      • STAT & MATH (3)
        • calculus (3)
      • Jay's Project (19)
        • wanted 채용 공고 분석 (8)
        • 포켓몬 소드&실드 리뷰 분석 (6)
        • 교보문고 책 추천시스템 구현 (5)
      • Algorithm (0)
      • Archive (8)
      • TIL (42)
      • Code Cloud (34)
        • python (34)
        • R (0)
      • Trouble Shooting (3)
      • 일상 (0)
  • mode_edit_outline글작성
  • settings환경설정
  • 홈
  • 태그
  • 방명록
[교보문고 베스트셀러 분석 / 추천시스템] 4. 추천시스템 (CBF)

[교보문고 베스트셀러 분석 / 추천시스템] 4. 추천시스템 (CBF)

CBF 추천 알고리즘으로 가장 기본적인 형태이다. CBF(Contents Based Filtering)는 데이터가 가지는 속성(Content)를 기반으로 또 다른 유사한 데이터를 추천해주는 알고리즘이다. 이 때 유사함이란 특정한 유사도(similiarity)를 기준으로 측정된 거리를 말하며 가까운 거리일수록 추천할만한 유사 데이터라고 해석한다. 데이터 전처리 CBF 알고리즘의 특성 상 keyword 항목이 데이터 안에서 중복되는 횟수가 적은 경우에는 추천시스템의 성능이 매우 떨어질 수 있다. 예를 들면 대다수가 액션 장르인 영화 데이터셋에서 오컬트 장르의 영화를 추천받기 원하는 경우와 같다. 따라따라서 조금 더 상위 개념의 keyword인 카테고리(분야)를 추가하여 데이터 사이에 겹치는 keyword를 ..

  • format_list_bulleted Jay's Project/교보문고 책 추천시스템 구현
  • · 2022. 7. 25.
  • textsms
[교보문고 베스트셀러 분석 / 추천시스템] 2. 데이터 수집

[교보문고 베스트셀러 분석 / 추천시스템] 2. 데이터 수집

타겟 데이터 본 프로젝트는 교보문고의 분야별 베스트셀러에 대한 분석과 추천시스템 구현을 목적으로 한다. 따라서 프로젝트에 필요한 타겟 데이터는 다음과 같다. 교보문고 분야별 베스트 셀러의 정보 (목록, 출판사 등) 해당 도서의 키워드 (일본소설, 치유, 사회문제, 대화) 해당 도서 평점과 평점에 참여한 유저의 정보 해당 도서의 리뷰 (추후의 NLP 적용를 위한 플러스 알파) 교보문고는 분야별 베스트셀러 목록을 excel 파일로 제공한다. 따라서 베스트셀러의 데이터를 일일이 크롤링 해야하는 수고를 덜어 작업이 훨씬 순조로웠다. 베스트셀러 도서의 키워드 역시 제공한다. 키워드픽이라는 항목으로 도서의 분류, 혹은 내용에 대한 키워드를 선정하여 고객들이 구매 전 미리 알아볼 수 있도록 했다. 미리 실물 책을 읽..

  • format_list_bulleted Jay's Project/교보문고 책 추천시스템 구현
  • · 2022. 7. 21.
  • textsms
[교보문고 베스트셀러 분석 / 추천시스템] 0. 프로젝트 개요

[교보문고 베스트셀러 분석 / 추천시스템] 0. 프로젝트 개요

프로젝트 개요 주제 : 코로나 시대 베스트셀러 특성 분석 / 교보문고 베스트 셀러 데이터를 활용한 추천시스템 구현 기여도 : 20% (총원 5명) 담당 부분 : 데이터 수집 (크롤링 코드 개발), 시각화 및 데이터 분석, 추천시스템 (CBF, CF) 프로젝트 진행기간 : 2022/02/09 ~ 2022/02/14 결과 : 추천시스템 프로젝트 발표회 2등 (데이터 분석 부트캠프 과정) 상세 내용 코로나시대 분야별 베스트셀러 분석 및 시각화 책 추천시스템 구현 : CBF (Contents Base Filtering), CF (Collaborative Filtering) Workflow 프로젝트 기획 코로나 시대 출판시장의 트렌드 및 특성 분석 교보문고 분야별 베스트셀러의 키워드 분석을 통한 인사이트 도출 책..

  • format_list_bulleted Jay's Project/교보문고 책 추천시스템 구현
  • · 2022. 7. 21.
  • textsms
  • «
  • 1
  • »
공지사항
전체 카테고리
  • 분류 전체보기 (157)
    • About. (1)
    • Risk Management (1)
      • Credit Risk (1)
    • Data Science (46)
      • python (41)
      • R (2)
      • SQL (2)
      • SAS (0)
    • STAT & MATH (3)
      • calculus (3)
    • Jay's Project (19)
      • wanted 채용 공고 분석 (8)
      • 포켓몬 소드&실드 리뷰 분석 (6)
      • 교보문고 책 추천시스템 구현 (5)
    • Algorithm (0)
    • Archive (8)
    • TIL (42)
    • Code Cloud (34)
      • python (34)
      • R (0)
    • Trouble Shooting (3)
    • 일상 (0)
최근 글
인기 글
최근 댓글
태그
  • #wordcloud
  • #어간추출
  • #KoNLPy
  • #텍스트데이터분석
  • #책 분석
  • #gridsearch
  • #데이터분석가
  • #Crawling
  • #decisionclassfier
  • #nlp
  • #Wanted
  • #Okt
  • #리뷰분석
  • #머신러닝
  • #matplotlib
  • #크롤링
  • #seaborn
  • #그리드서치
  • #시각화
  • #파이썬
  • #리뷰데이터
  • #자연어처리
  • #selenium
  • #감성분석
  • #sklearn
  • #CBF
  • #추천시스템
  • #python
  • #키워드 픽
  • #데이터분석
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바