'Data Science' 카테고리의 글 목록 (5 Page)

01. 데이터 불러오기 및 데이터 확인

1. 데이터 로드 - df = pd.read_확장자 (대상, sep, encoding) - sep 인자 : \t 기준으로 구분 - encoding : "euc-kr" 한글 / UTF-8 DataUrl = 'https://raw.githubusercontent.com/Datamanim/pandas/main/lol.csv' df = pd.read_csv(DataUrl,sep='\t') 2. 상위, 하위 데이터 출력 - df.head() : 기본은 5개 - df.tail() : 기본은 5개 3. 데이터 구조 파악 - df.index : 인덱스 정보파악 df.index RangeIndex(start=0, stop=51490, step=1) - df.shape : 행과 열의 갯수 파악 df.shape (51490..

format_list_bulleted Data Science/python
· 2021. 12. 21.
textsms

리스트(list)

1. 리스트 생성 : 대괄호 [] 사용 movie_rank=["닥터 스트레인지", "스플릿", "럭키"] movie_rank ['닥터 스트레인지', '스플릿', '럭키'] 2. 리스트에 원소추가 - append(item) 리스트의 마지막에 원소추가 / append 메소드는 리스트의 원본 변경 -> 재귀함수x , 단계로 나눠써야함 movie_rank=["닥터 스트레인지", "스플릿", "럭키"] movie_rank = movie_rank.append("배트맨") print(movie_rank) None movie_rank=["닥터 스트레인지", "스플릿", "럭키"] movie_rank.append("배트맨") print(movie_rank) ['닥터 스트레인지', '스플릿', '럭키', '배트맨'] - ..

format_list_bulleted Data Science/python
· 2021. 12. 19.
textsms

문자열(string) (2)

1. upper 메서드 : 대문자 변경 2. lower 메서드 : 소문자 변경 3. capitalize 메서드 : 첫글자 대문자 변경 4. startswith, endswith 메서드 : 시작글자 끝글자 확인(Bool) -> 크롤링 및 전처리 활용 / 인자가 두개일 때 : 괄호추가 file_name = "2020_보고서.xlsx" file_name.startswith("2021") False file_name.endswith(("xlsx","xls")) True 5. split 메서드 : 문자열 나누기 a = "hello world" print(a.split(" ")) a ['hello', 'world'] 'hello world'

format_list_bulleted Data Science/python
· 2021. 12. 19.
textsms

문자열(string) (1)

1. 문자열 인덱싱 - 인덱싱 : 위치 지정, 0부터 시작/ -1은 맨뒤부터 시작 letters ='python' print(letters[0],letters[2]) p t 2. 문자열 슬라이싱 - 문자열에서 여러 글자를 나눠서 가져오는 것을 슬라이싱. - 음수 값은 문자열의 뒤에서부터 인덱싱 또는 슬라이싱함을 의미. license_plate = "24가 2210" print(license_plate[4:]) print(license_plate[-4:]) 2210 2210 - 슬라이싱에서 시작 인덱스를 생락하면 0으로 간주 - 끝 인덱스를 생략하면 문자열의 끝을 의미 - [시작 index : 끝 index(미만 개념) : setp index: 건너뜀을 의미(-1은 역으로 출력)] string = "홀짝홀..

format_list_bulleted Data Science/python
· 2021. 12. 19.
textsms

자료형 변환

1. 자료형 정리 - 숫자자료형 : int(정수), float(실수), complex(복소수) - 불린형 : boolean (True or Flase : 대문자 주의) - 군집형 : str(문자열), list, tuple, dic(딕셔너리), set 2. str(), int(), float() 으로 각 자료형으로 변환 가능 - int() : 숫자형태의 문자열에 컴마가 있는 경우 바로 변환불가 -> replace 메서드로 제거 상장주식수 = "5969782550" int(상장주식수) 5969782550 상장주식수 = "5,969,782,550" int(상장주식수) --------------------------------------------------------------------------- Valu..

format_list_bulleted Data Science/python
· 2021. 12. 19.
textsms

print 함수

1. 여러 데이터 출력 : - 쉼표로 출력, 쉼표 다음은 공백 하나 생성 - +로 문자열 연결, 공백은 없음 print("오늘은","일요일") 오늘은 일요일 print("오늘은"+"일요일") 오늘은일요일 2. 탭과 줄바꿈 - \t는 탭, \n은 줄바꿈 print("안녕하세요.\n만나서\t\t반갑습니다.") 안녕하세요. 만나서반갑습니다. 3. sep - 출력 값 사이에 공백대신 sep인자 출력 print("naver","kakao","samsung",sep=";") naver;kakao;samsung 4. end =" " 와 ; - 출력을 완료한 뒤의 내용을 수정 (default는 개행 )- 이어서 프린트하기 - 코드 한줄에 이어 쓰기 print('first');print("second");print("t..

format_list_bulleted Data Science/python
· 2021. 12. 19.
textsms