Data Science/python

pandas 데이터프레임에 컬럼 추가/제거 df['column'] ="Value" df.drop('column', axis=1, inplace=)

jay3108 2021. 12. 22. 17:22

Dataframe에서 컬럼을 추가하고 제거하는 방법 정리하기.

* 초기 Dataframe

train.csv
0.06MB

1. 데이터프레임에 컬럼 추가

 1) 모든 행이 같은 값을 가지는 열 추가 : 임의의 초기 값을 갖는 열을 추가할 때 유용함

  df['column'] ="Value" 

 

  기존 data frame에 모든 행이 UK를 가지는 Country 칼럼을 추가

  df['Country'] = "UK"

 

 2) 각가 다른 값을 가지는 array를 dataframe에 column으로 추가

  height = np.random.randint(150,200, size=891) : numpy 난수 발생 메서드를 이용하여 891개 항목의 array 생성

  (numpy 난수 생성 참고 https://codetorial.net/numpy/random.html)

 컬럼명 Height 로 dataframe에 열 추가

  df['Height'] = height

 

2. 데이터프레임에서 컬럼 제거

drop() 메서드를 사용하되 컬럼을 제거하려면 axis=1(columns) 인수를 지정해야 함

또한 기존의 dataframe은 변경되지 않으므로 새로운 변수로 받아야 한다. 기존 df를 변경하려면  inplace=True 인수를 넣어야함

 df1 = df.drop('Height', axis=1) → 컬럼명으로 제거

 df1 = df.drop(df.columns[12], axis=1) →