데이터 분석 boot camp day 33
1. 머신러닝까지 중간평가
2. 조별 간이 프로젝트 진행해보기
Dacon 영화 관객 예측 대회 연습
- Dacon 영화 관객 예측 대회 연습
- Dacon_practice repository로 따로 저장하자!
- feature engineering의 중요성 : 범주형 피쳐 인코딩, 결측값 처리 → 접근하는 아이디어가 생각보다 중요하다.
- pycaret 설치 및 document 공부 : pycaret document
- 결국 ML/DL 알고리즘 모두 data-driven 이므로 전처리 단계와 피쳐 엔지니어링이 지금은 더 중요한 것 같다.
3. 대기업 화학회사 Computer Vision 현직자 특강
- 아직 CV는 커녕 딥러닝을 공부하지 않아서 알아듣기 힘들었다...
- 꾸준히 대회에 도전하는 열정과 공부하는 태도가 존경스러웠다. 대회 성과도 정말 좋으신데 그러실 수 밖에 없을 정도...
- Github 주소
개인 공부
1. Dacon 집값 예측 대회 제출
- 186/428 : sample_submision만 제출한 사람을 제외하면 의미 없는 등수
- Dacon 대회 제출 repo
- 회귀 ML로는 처음 제출한 파일! : pandas_profiling 적용 / linear regression 적용 / pycaret 불완전하게 사용