Data Science/python

2. Selection

jay3108 2021. 12. 22. 09:10

1. Getting : 컬럼 데이터 나타내기

- df['칼럼명'], df.칼럼명 : 하나의 칼럼을 series 형태로 가져오기

- df[['칼럼명1'],['칼럼명2]] : 다수의 칼럼을 data frame 형태로 가져오기

- df[0:2] : 행 인덱스로 데이터 프레임 슬라이싱

2. loc[] : Selection by label 

 - 데이터프레임의 행이나 컬럼에 label이나 조건식으로 접근

 - 행과 열의 lable을 통해 data frame 선택가능 

 * 행의 index를 이용, 아래의 titanic 자료는 행의 index가 행의 순서와 같기 떄문에 df.loc[0:3] 가능 

     -> 즉 0:3은 행의 순서가 아니다

 * 아래의 자료는 행의 index가 dates 라는 날짜로 지정했기 때문에 오류가 발생한다. 

 * 행의 index인 label로 selecting

 

3. iloc[] : Selection by position

 - 데이터프레임의 행이나 컬럼에 인덱스(위치값)으로 접근

 - 행과 열 모두 위치값으로 인수를 넣어줘야 함

  * 열의 label로 자료를 seledc 할 수 없다