리스크 컨설턴트 성장기
프로필 배경
프로필 로고

리스크 컨설턴트 성장기

    • 분류 전체보기 (157)
      • About. (1)
      • Risk Management (1)
        • Credit Risk (1)
      • Data Science (46)
        • python (41)
        • R (2)
        • SQL (2)
        • SAS (0)
      • STAT & MATH (3)
        • calculus (3)
      • Jay's Project (19)
        • wanted 채용 공고 분석 (8)
        • 포켓몬 소드&실드 리뷰 분석 (6)
        • 교보문고 책 추천시스템 구현 (5)
      • Algorithm (0)
      • Archive (8)
      • TIL (42)
      • Code Cloud (34)
        • python (34)
        • R (0)
      • Trouble Shooting (3)
      • 일상 (0)
  • mode_edit_outline글작성
  • settings환경설정
  • 홈
  • 태그
  • 방명록

<bound method WebDriver.close of <selenium.webdriver.chrome.webdriver.WebDriver (session="3a4bf36ce87ebcae4980be2a37e05aca")>>

>

  • format_list_bulleted Trouble Shooting
  • · 2022. 1. 8.
  • textsms

리스트 비교 후 서로 다른 항목만 가져오기

allshort_list = [] for i in short_list : if i not in collapsed_list : allshort_list.append(i)

  • format_list_bulleted Code Cloud/python
  • · 2022. 1. 8.
  • textsms

BoW (Bag of Words)

BoW : 텍스트를 수치 특성 벡터로 표현하는 모델 bag = count.fit_transform(docs) #BoW 모델의 어휘사전을 구축하고 docs의 각 문자를 희소한 특성 벡터로 변환 # tf(t,d) : d 문서에 등장한 t 단어의 횟수 # 특벙 벡터에 나타나는 단어 빈도의 순서는 어휘사전의 알파벳 순서를 따름 tf-idf : 특성 벡터에서 자주 등장하는 단어의 가중치를 낮추는 기법 (자주 등장하는 단어는 오히려 유용x)

  • format_list_bulleted Archive
  • · 2022. 1. 7.
  • textsms

[pandas] 행/열 전체 객체에 적용 df.apply()

df['review'] = df['review'].apply(preprocessor) https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=wideeyed&logNo=221559041280 [Python][Pandas] Apply 함수란? Pandas Dataframe(데이터프레임, 2차원) 타입의 객체에서 호출할 수 있는 apply함수에 대해서 알아봅니다... blog.naver.com

  • format_list_bulleted Code Cloud/python
  • · 2022. 1. 7.
  • textsms

[numpy] np.random.permutation()

https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=shwotjd14&logNo=221862285781 Python numpy.random.permutation() 사용 버전: Python 3.7.6 사용 프로그램: Atom 1.45.0 x64 파이썬 numpy.random.permutation()에 대해서 ... blog.naver.com

  • format_list_bulleted Code Cloud/python
  • · 2022. 1. 7.
  • textsms

[python] 데이터 시각화 파이 차트

https://mirandaherr.tistory.com/38 [100일 챌린지] 파이썬 pandas 파이 차트 그리기 (옵션 추가) #036 아래 자료를 이용하여 파이 차트를 그려보겠다. 1. 파이 차트 그리기 pie 함수에 데이터를 넣어주면 된다. plt.pie() 2. 동그란 원 그리기 plt.axis('equal') 위 함수를 이용하면 원이 더 동그래진다. 3. 레 mirandaherr.tistory.com

  • format_list_bulleted Code Cloud/python
  • · 2022. 1. 7.
  • textsms

[pandas] DataFrame ValueError: If using all scalar values, you must pass an index

https://rfriend.tistory.com/482 [Python] pandas DataFrame: ValueError: If using all scalar values, you must pass an index 에러 해결 방법 이번 포스팅에서는 Python pandas DataFrame을 만들려고 할 때 "ValueError: If using all scalar values, you must pass an index" 에러 해결 방안 4가지를 소개하겠습니다. 아래의 예처럼 dictionary로 키, 값.. rfriend.tistory.com https://yeol2.tistory.com/9 Dictionary → DataFrame 변환하기 KNN 공부하면서 plot을 이용해 가장 accuracy가..

  • format_list_bulleted Code Cloud/python
  • · 2022. 1. 7.
  • textsms

Day 17

크롤링 마무리 1. 웹 페이지에서 데이터추출하기 정규표현식으로 스크레이핑 [python] 정규표현식을 이용한 웹 페이지 스크레이핑 XML(RSS) 스크레이핑 2. HTML 스크레이핑 (라이브러리활용) XPath와 CSS 셀렉터 lxml BeautifulSoup 3. RSS 스크레이핑 4. API를 이용한 공공데이터 포털 크롤링 개인공부 1. K-mooc 강의 미분적분학 1강 데이터 과학을 위한 R 프로그래밍 1강 2. DAYCON 펭귄 몸무게 예측 코드 공부

  • format_list_bulleted TIL
  • · 2022. 1. 6.
  • textsms
[python] 정규표현식을 이용한 웹 페이지 스크레이핑

[python] 정규표현식을 이용한 웹 페이지 스크레이핑

meta 태그에서 인코딩 방식 추출하기 html meta태그 안에 인코딩 방식이 지정되어 있다. 각 페이지 별로 인코딩 방식이 다를 수 있기 떄문에 해당 url을 통해 html 자료를 스크래이핑 한후 meta 태그 부분을 선별해내어 인코딩 방식이 무엇인지 알아낸다. urllib.request 패키지를 통해 스크레이핑할 url을 가져오고 bytes 자료형으로 변환하여 읽어준다. 실습은 한빛출판사 웹 페이지를 대상으로 한다. import sys from urllib.request import urlopen # urlopen() 함수는 HTTPResponse 자료형의 객체를 반환합니다. f = urlopen('http://www.hanbit.co.kr/store/books/full_book_list.html'..

  • format_list_bulleted Data Science/python
  • · 2022. 1. 5.
  • textsms

[python] 정규표현식 .*? 해석

https://qaos.com/article.php?sid=2432 QAOS.com | 정규식에서 *? 또는 +?의 의미 정규식에서 *? 또는 +?의 의미 게시일: 2006/06/29 | 글쓴이: doa | 12692 번 | 프린트 | 메일 사실 정규식은 유닉스에서만 사용할 수 있는 기능이었다. 그러나 펄의 정규식이 보편화되고 정규식의 강력함 qaos.com

  • format_list_bulleted Data Science/python
  • · 2022. 1. 5.
  • textsms
  • «
  • 1
  • ···
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • ···
  • 16
  • »
공지사항
전체 카테고리
  • 분류 전체보기 (157)
    • About. (1)
    • Risk Management (1)
      • Credit Risk (1)
    • Data Science (46)
      • python (41)
      • R (2)
      • SQL (2)
      • SAS (0)
    • STAT & MATH (3)
      • calculus (3)
    • Jay's Project (19)
      • wanted 채용 공고 분석 (8)
      • 포켓몬 소드&실드 리뷰 분석 (6)
      • 교보문고 책 추천시스템 구현 (5)
    • Algorithm (0)
    • Archive (8)
    • TIL (42)
    • Code Cloud (34)
      • python (34)
      • R (0)
    • Trouble Shooting (3)
    • 일상 (0)
최근 글
인기 글
최근 댓글
태그
  • #자연어처리
  • #텍스트데이터분석
  • #머신러닝
  • #decisionclassfier
  • #추천시스템
  • #데이터분석
  • #책 분석
  • #wordcloud
  • #matplotlib
  • #seaborn
  • #리뷰분석
  • #Crawling
  • #sklearn
  • #크롤링
  • #gridsearch
  • #그리드서치
  • #리뷰데이터
  • #KoNLPy
  • #파이썬
  • #nlp
  • #감성분석
  • #selenium
  • #시각화
  • #Okt
  • #데이터분석가
  • #어간추출
  • #CBF
  • #Wanted
  • #python
  • #키워드 픽
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바