리스크 컨설턴트 성장기
프로필 배경
프로필 로고

리스크 컨설턴트 성장기

    • 분류 전체보기 (157)
      • About. (1)
      • Risk Management (1)
        • Credit Risk (1)
      • Data Science (46)
        • python (41)
        • R (2)
        • SQL (2)
        • SAS (0)
      • STAT & MATH (3)
        • calculus (3)
      • Jay's Project (19)
        • wanted 채용 공고 분석 (8)
        • 포켓몬 소드&실드 리뷰 분석 (6)
        • 교보문고 책 추천시스템 구현 (5)
      • Algorithm (0)
      • Archive (8)
      • TIL (42)
      • Code Cloud (34)
        • python (34)
        • R (0)
      • Trouble Shooting (3)
      • 일상 (0)
  • mode_edit_outline글작성
  • settings환경설정
  • 홈
  • 태그
  • 방명록

Day 32

Git, Github 특강 3일차 1. Branch Branch : git 버전 관리의 핵심 1.1 Branch란? 여러 갈래로 작업 공간을 나누어 독립적으로 작업할 수 있는 Git의 도구 장점 브랜치는 독립공간이므로 원본(master)에 대해 안전함 하나의 작업이 곧 하나의 브랜치이므로 체계적인 개발 가능 Git은 브랜치를 만드는 속도가 빠르고 용량이 적게든다. 1.2 git branch 브랜치 조회, 생성, 삭제 등의 명령어 # 브랜치 목록 확인 $ git branch # 원격 저장소의 브랜치 목록 확인 $ git branch -r # 새로운 브랜치 생성 $ git branch # 특정 커밋 기준으로 브랜치 생성 $ git branch # 특정 브랜치 삭제 $ git branch -d # 병합된 브랜..

  • format_list_bulleted TIL
  • · 2022. 1. 27.
  • textsms

Day 30

what/why Git&Github 공부할 때 포트폴리오로 기능함과 동시에 실제 업무 시에 반드시 활용하게 됨 개발자들의 협업을 위한 도구 1. Git을 이용한 버전 관리 Git : (분산) 버전관리 프로그램 / Github : 서비스 버전 관리 : 컴퓨터 소프트웨어의 특정 상태를 관리하는 것? 실무에서 협업에 쓰인다!! 2. 포트폴리오 작성 기능 - 오늘부터 TIL 잔디 심기!! 3. Bash는 어디서 열었는지 항상 체크할것 4. 명령어 명령어 start . / open . 상대경로 = 내 위치 기준 / 절대경로 = 어디든 상관없는 위치 1. date = 시간 알려준다 2. ~ : 루트, 홈 디렉토리 3. ls (list segments) : 현재 디렉토리 내의 폴더 & 파일을 보여줌 -> ls -a ..

  • format_list_bulleted TIL
  • · 2022. 1. 26.
  • textsms
데이터 인코딩 (Data encoding)

데이터 인코딩 (Data encoding)

머신러닝 알고리즘에서는 문자열 데이터를 사용할 수 없으므로 모든 데이터를 숫자로 표현해야 한다. 범주형 데이터를 다루기 위해서는 모두 숫자값으로 변환해야 한다. 대부분의 머신러닝 라이브러리 또한 범주형 자료형이 정수로 인코딩 되어 있을 것으로 기대한다. 따라서 범주형 자료의 인코딩 방법을 정리해본다. 1. map을 이용한 인코딩 인코딩 값을 부여하는 순서가 중요한 경우에 사용한다. 이밖에 인코딩 방법들은 우열을 표현하지 못하거나 숫자, 알파벳, 한글 순으로 순서가 정해져 있으므로 직접 번호를 부여하는 map 방식도 자주 사용된다. dacon 집값 예측 데이터 셋 중에 Kitchen Qual 피처를 통해 실습한다. import pandas as pd df = pd.read_csv('C:/Users/Jay/..

  • format_list_bulleted Data Science/python
  • · 2022. 1. 23.
  • textsms

Day 29

데이터 분석 부트캠프 파이썬 머신러닝 완벽 가이드 ch3. 평가 정확도(Accuracy) : 레이블 값이 불균형한 불포를 가질 때, ML 모델의 적합한 평가 지표가 될 수 없음 오차행렬(Confusion Matrix) : 정확도 개념의 한계 정밀도(Precision) : TP/(FP + TP) → 임계값이 낮을수록 높아진다 재현율(Recall) : TP/(FN + TP) →임계값이 높을수록 높아진다 F1 스코어 : 정밀도와 재현율의 trade-off 관계의 절충 지표 → 두 값이 비슷할 떄 높은 F1 스코어 기록 ROC곡선, AUC 스코어 : ML 이진 분류 모델의 예측 성능 평가 시 중요한 지표 (1에 가까울수록 좋음) 분류 실습 : 산탄데르 은행 만족도 예측 트리 기반 모델 사용 : XGBoost 와..

  • format_list_bulleted TIL
  • · 2022. 1. 21.
  • textsms

사이킷런 데이터 데이터프레임으로 sklearn.utils.Bunch to dataframe

from sklearn.datasets import load_iris import pandas as pd data = load_iris() df = pd.DataFrame(data=data.data, columns=data.feature_names) df.head()

  • format_list_bulleted Code Cloud/python
  • · 2022. 1. 20.
  • textsms

python 모듈 라이브러리 워닝 무시

# 워닝 무시 import warnings warnings.filterwarnings('ignore')

  • format_list_bulleted Code Cloud/python
  • · 2022. 1. 20.
  • textsms

Day 28

LightGBM XGBoost 와의 차별점 : 크게 느껴지지는 않지만... 다 빠른 학습, 예측 수행 시간, 더 작은 메모리 사용량 카테고리형 피처를 자동을 변환하고 최적 분할 기능 제공 → 인코딩을 직접하지 않아고 카테고리형 피처 변환 GPU 지원 트리분할 방식 : 리프중심으로 균형 분할보다 오류를 줄이는 방향으로 트리를 분할 사이킷런 래퍼가 XGBoost에 있으면 파이썬 래퍼를 가져다가 쓴다 → 주로 쓰는 방법으로 자연스럽게 익히기 visual studio build tools 설치

  • format_list_bulleted TIL
  • · 2022. 1. 20.
  • textsms

주피터 노트북 티스토리에 올리기

https://hanawithdata.tistory.com/entry/Jupyter-notebook-%ED%8B%B0%EC%8A%A4%ED%86%A0%EB%A6%AC%EC%97%90-%EC%98%AC%EB%A6%AC%EA%B8%B0?category=875919 Jupyter notebook 티스토리에 올리기 1. 노트 위에 코드 넣고 실행해주기 - 출력되는 폼을 조정해준다고 한다. from IPython.core.display import display, HTML display(HTML(" ")) 2. note > file > print pageview 클릭 3. 마우스 오른쪽클릭 ->.. hanawithdata.tistory.com

  • format_list_bulleted Archive
  • · 2022. 1. 20.
  • textsms

pandas 특정 컬럼 값 갯수 세기

# 긍정/부정 데이터 셋 확인 df.groupby('label').size()

  • format_list_bulleted Code Cloud/python
  • · 2022. 1. 20.
  • textsms

SGD Classifier

https://inuplace.tistory.com/516 [scikit-learn 라이브러리] SGDClassifier (선형분류) 계산값을 기반으로 계산값이 0보다 작으면 -1, 0보다 크면 1로 분류한다. 이진 선형 분류기는 선, 평면, 초평면을 이용해 2개의 클래스를 구분하는 분류기이다. SGDClassifier SGDClassifier(alpha, average, cla inuplace.tistory.com

  • format_list_bulleted Data Science/python
  • · 2022. 1. 20.
  • textsms
  • «
  • 1
  • ···
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • ···
  • 16
  • »
공지사항
전체 카테고리
  • 분류 전체보기 (157)
    • About. (1)
    • Risk Management (1)
      • Credit Risk (1)
    • Data Science (46)
      • python (41)
      • R (2)
      • SQL (2)
      • SAS (0)
    • STAT & MATH (3)
      • calculus (3)
    • Jay's Project (19)
      • wanted 채용 공고 분석 (8)
      • 포켓몬 소드&실드 리뷰 분석 (6)
      • 교보문고 책 추천시스템 구현 (5)
    • Algorithm (0)
    • Archive (8)
    • TIL (42)
    • Code Cloud (34)
      • python (34)
      • R (0)
    • Trouble Shooting (3)
    • 일상 (0)
최근 글
인기 글
최근 댓글
태그
  • #크롤링
  • #데이터분석
  • #gridsearch
  • #책 분석
  • #wordcloud
  • #리뷰데이터
  • #어간추출
  • #seaborn
  • #텍스트데이터분석
  • #키워드 픽
  • #KoNLPy
  • #리뷰분석
  • #selenium
  • #데이터분석가
  • #CBF
  • #Crawling
  • #python
  • #nlp
  • #파이썬
  • #decisionclassfier
  • #sklearn
  • #Okt
  • #추천시스템
  • #matplotlib
  • #그리드서치
  • #감성분석
  • #Wanted
  • #머신러닝
  • #시각화
  • #자연어처리
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바