열 추가/수정하기
- 데이터프레임[컬럼] = 추가할데이터
- 데이터프레임[컬럼] = 수정할데이터
컬럼이 존재하면 추가, 존재하지 않으면 수정된다.
가공할 데이터 준비
import pandas as pd
df = pd.read_csv('data/scores.csv')
df.head()
"""
name kor eng math
0 Aiden 100.0 90.0 95.0
1 Charles 90.0 80.0 75.0
2 Danial 95.0 100.0 100.0
3 Evan 100.0 100.0 100.0
4 Henry NaN 35.0 60.0
"""
열 추가하기
# 학생 번호 추가하기 (1부터 시작하여 1씩 증가)
df['no'] = range(1,len(df)+1)
# sum 추가
df['sum'] = df['kor']+df['eng']+df['math']
열 수정하기
# 학생 번호 수정하기 (100부터 시작하여 1씩 증가)
df['no'] = df['no']+99
열 삭제하기
- 데이터프레임.drop(columns=삭제할컬럼리스트, inplace=True)
- 존재하지 않는 열은 삭제할 수 없다.
# no, sum 컬럼 삭제하기
df.drop(columns=['no','sum'], inplace=True)
#df = df.drop(columns=['no','sum'])
컬럼명 바꾸기
컬럼명 한번에 바꾸기
- 데이터프레임.columns = 컬럼명리스트
컬럼명리스트의 항목 수는 컬럼 수와 동일해야한다.
df.head(1)
"""
name kor eng math
0 Aiden 100.0 90.0 95.0
"""
#'이름','국어','영어','수학'
df.columns=['이름','국어','영어','수학']
"""
이름 국어 영어 수학
0 Aiden 100.0 90.0 95.0
1 Charles 90.0 80.0 75.0
2 Danial 95.0 100.0 100.0
3 Evan 100.0 100.0 100.0
4 Henry NaN 35.0 60.0
"""
# 전체컬럼수와 컬럼명 리스트의 항목 수가 다르면 error
df.columns=['이름','국어','영어']
특정 컬럼명 바꾸기
- 데이터프레임.rename(columns={'현재컬럼명1':'바꿀컬럼명1','현재컬럼명2':'바꿀컬럼명2',...})
# 이름-->성명
df = df.rename(columns={'이름':'성명'})
"""
성명 국어 영어 수학
0 Aiden 100.0 90.0 95.0
1 Charles 90.0 80.0 75.0
2 Danial 95.0 100.0 100.0
3 Evan 100.0 100.0 100.0
"""
'파이썬 > 파이썬 pandas' 카테고리의 다른 글
[pandas] 데이터에 함수 적용하기 apply (0) | 2023.05.11 |
---|---|
[pandas] 행 변경하기 append, loc, drop, index, rename (0) | 2023.05.11 |
[pandas] 행번호, 열번호로 데이터 추출하기 iloc[], iloc[[]], iloc[:], iloc[-1] (0) | 2023.05.11 |
[pandas] 인덱스로 데이터 추출하기 loc[], loc[, ], loc[, []] (0) | 2023.05.11 |
[pandas] 컬럼명으로 데이터 추출하기 (0) | 2023.05.11 |