리스크 컨설턴트 성장기

open() 함수로 텍스트 파일 읽기/쓰기/추가하기/만들기

1. 파일 읽기 파이썬에서는 텍스트 파일을 다루기 위해 open() 함수 사용 f= open("파일명","파일 열기 모드") f.close 파일 열기 모드 -> r : 읽기모드 / w : 쓰기모드 / a : 추가 모드 - 파일의 마지막에 새로운 내용 추가 # 읽기 모드로 "dream.txt" 텍스트 파일 열기 f = open("dream.txt", "r") # 파일 객체 f에 파일 정보 저장 contents = f.read() # read() 함수로 해당 파일의 텍스트를 읽어서 변수에 저장 print(contents) # 저장된 변수 출력 f.close() # close() 함수로 파일 종료 I have a dream a song to sing to help me cope with anything if ..

format_list_bulleted Data Science/python
· 2021. 12. 24.
textsms

예외 처리 구문 : try-except 구문

1. try-except문 파이썬 예외 처리의 기본구문 try: 예외 발생 가능 코드 except 예외 타입: 예외 발생 시 실행되는 코드 # 얘만 알고 있으면 됨 : 크롤링할 때 쓰임 for i in range(10): try: print(10 / i) except ZeroDivisionError: print("Not divided by 0") Not divided by 0 10.0 5.0 3.3333333333333335 2.5 2.0 1.6666666666666667 1.4285714285714286 1.25 1.1111111111111112 2. raise문 try-except문과 달리 필요할 때 예외를 발생시키는 코드 에러가 발생헀을 때, 입력이 잘못된 것을 알려 주면서 종료하는 것 raise ..

format_list_bulleted Data Science/python
· 2021. 12. 24.
textsms

DAY 9

10장 객체지향 프로그래밍 : 객체, 클래스, 인스턴스 등 11장 모듈과 패키지 모듈(module) : 이미 작성된 프로그램 인터페이스(interface) : 함수에서 매개변수를 입력하는 약속 / 모듈간의 연결을 위한 약속 패키지 : 모듈의 묶음 / from 모듈을 패키지부터 호출하는 명령어 생소한 개념이었다. 객체지향 프로그래밍은 별도로 정리하여 블로그에 남기긴 하였는데 수박 겉햝기라는 느낌을 지울 수가 없다. 컴퓨터공학 전반의 지식들은 얕게라도 다양하게 알아두려는 노력을 해야겠다. 어차피 다 못 외우니까 블로그에 두고 라이브러리화 시키는 것이 1차 목표.

format_list_bulleted TIL
· 2021. 12. 24.
textsms

파이썬 스타일 코드 2

1. 람다함수 함수의 이름 없이, 함수처럼 사용할 수 있는 익명의 함수 - 앞에는 매개변수의 이름, 뒤에는 매개변수가 반환하는 결과값 작성 - 람다는 직관적이지 않기 때문에 추천되는 방법은 아니다. 코드를 알아볼 수 있는 정도만 공부한다. # 일반적인 함수 def f(x, y): return x + y f(1, 4) # 람다 함수 f = lambda x,y : x+y print(f(1,4)) 2. 맵리듀스 1) map() 함수 : 연속데이터를 저장하는 시퀀스 자료형에서 요소마다 같은 기능을 적용할 때 사용 - list를 붙여야 리스트로 반환 (generator 개념 강화) - 람다, map 함수보다 리스트 컴프리헨션이 권장되고 있음 # 람다함수와 맵함수 이용 ex = [1,3,5,7,9] a = lamb..

format_list_bulleted Data Science/python
· 2021. 12. 23.
textsms

객체 지향 프로그래밍

객체 지향 프로그래밍(OOP : Object Oriented Programming) 기능을 묶은 하나의 단일 프로그램을 객체라는 코드에 넣어 다른 프로그래머가 재사용할 수 있게 하는 기법 1. 객체, 인스턴스, 클래스 객체(Object) : 실생활에 존재하는 물건 또는 개념 속성 : 객체가 가지고 있는 변수 행동 : 객체가 실제로 작동할 수 있는 함수, 메서드 클래스(Class) : 객체를 생성하는 설계도 인스턴스(Instance) : 여러 속성을 클래스에 담아 실제 생성되는 구체적인 객체 2. 클래스 구현하기 클래스 선언 : 클래스 예약어 클래스 이름 (상속받는 객체명) → class SoccerPlayer(object) 속성의 선언(속성) : __int__ ()함수 : 이 클래스에서 사용할 속성(변수..

format_list_bulleted Data Science/python
· 2021. 12. 23.
textsms

Day 8

교재 : 데이터 과학을 위한 파이썬 프로그래밍 - 7장 : 자료구조 → list, stack, que, tuple, dictionary 등등의 자료형태와 각각의 기초 함수 정리 - 8장 : 파이썬 스타일 코드 1 → split(), join(), list comprehension, enumerate(), zip() - 9장 : 파이썬 스타일 코드 2 → 람다함수, 맵리듀스, 별표(asterisk) 활용, 선형대수학 기초 다음주 화요일에 test 예정 Python : 데이터 과학을 위한 파이썬 프로그래밍(1~9장), 초보자를 위한 파이썬 300제 Pandas : 10minutes for pandas + a / pandas 연습 튜토리얼 95제 / 101pandas tips for beginners tita..

format_list_bulleted TIL
· 2021. 12. 22.
textsms

pandas 데이터프레임에 컬럼 추가/제거 df['column'] ="Value" df.drop('column', axis=1, inplace=)

Dataframe에서 컬럼을 추가하고 제거하는 방법 정리하기. * 초기 Dataframe 1. 데이터프레임에 컬럼 추가 1) 모든 행이 같은 값을 가지는 열 추가 : 임의의 초기 값을 갖는 열을 추가할 때 유용함 df['column'] ="Value" 기존 data frame에 모든 행이 UK를 가지는 Country 칼럼을 추가 df['Country'] = "UK" 2) 각가 다른 값을 가지는 array를 dataframe에 column으로 추가 height = np.random.randint(150,200, size=891) : numpy 난수 발생 메서드를 이용하여 891개 항목의 array 생성 (numpy 난수 생성 참고 https://codetorial.net/numpy/random.html) ..

format_list_bulleted Data Science/python
· 2021. 12. 22.
textsms

파이썬 스타일 코드

파이썬 스타일 코드 : 파이썬에서 제공하는 함수, 문법들을 이용해서 코딩하는 것 - 종류 : split 함수, join 함수, list comprehension, enumerate 함수, zip함수, map함수, reduce함수 1. 문자열의 분리와 결합 : text 데이터 분석에 중요한 함수 split() : 문자열을 분리해서 리스트로 반환 join() : 리스트의 각 값을 결합하여 문자열로 반환 2. 리스트 컴프리헨션(list comprehension) : 리스트 안에 for문을 포함하여 간결하고 빠르게 for문 수행-> 가독성 good → 리스트와 for문 및 조건문을 함께 작성하여 가독성을 높인다 1) 필터링(filtering) : if문과 함께 사용하는 리스트 컴프리헨션 2) 중첩 반복문 3) ..

format_list_bulleted Data Science/python
· 2021. 12. 22.
textsms

자료구조 정리

자료 구조 : 특징이 있는 정보를 효율적으로 저장 및 반환하는 작업 파이썬의 자료구조 : 리스트/스택/큐/튜플/세트/딕셔너리/collections 모듈 등이 있음 데이터 엔지니어링, 사이언스 분야에서는 심도 깊은 이해가 필요한 분야 스택(stack) - LIFO ->Last In First Out : 마지막에 들어간 데이터가 가장 먼저 나오는 형태 - append(item) : 맨 끝에 항목 저장 - pop(index) : 인덱스를 인자로 데이터 추출(삭제) / default는 맨 마지막 항목 추출 * "_" 기호 : 해당 반복문에서 생성되는 값은 코드에 사용 하지 않음 -> 매개변수의 의미 없음 큐(que) - FIFO : 먼저 들어간 데이터가 가장 먼저 나오는 형태 - 스택과 반대 튜플(tuple) ..

format_list_bulleted Data Science/python
· 2021. 12. 22.
textsms

2. Selection

1. Getting : 컬럼 데이터 나타내기 - df['칼럼명'], df.칼럼명 : 하나의 칼럼을 series 형태로 가져오기 - df[['칼럼명1'],['칼럼명2]] : 다수의 칼럼을 data frame 형태로 가져오기 - df[0:2] : 행 인덱스로 데이터 프레임 슬라이싱 2. loc[] : Selection by label - 데이터프레임의 행이나 컬럼에 label이나 조건식으로 접근 - 행과 열의 lable을 통해 data frame 선택가능 * 행의 index를 이용, 아래의 titanic 자료는 행의 index가 행의 순서와 같기 떄문에 df.loc[0:3] 가능 -> 즉 0:3은 행의 순서가 아니다 * 아래의 자료는 행의 index가 dates 라는 날짜로 지정했기 때문에 오류가 발생한다...

format_list_bulleted Data Science/python
· 2021. 12. 22.
textsms