본문 바로가기

파이썬/파이썬 pandas13

[pandas] 행 변경하기 append, loc, drop, index, rename 가공할 데이터 준비 import pandas as pd df = pd.read_csv('data/scores.csv') df.index = range(100,3100,100) df.head(3) """ namekorengmath 100Aiden100.090.095.0 200Charles90.080.075.0 300Danial95.0100.0100.0 """ 마지막에 행 추가하고 인덱스 다시 지정하기 데이터프레임.append(추가할데이터, ignore_index=True) 추가할 데이터는 딕셔너리 형태로 전달 : {컬럼1:값1, 컬럼2:값2,...} 데이터프레임의 끝에 행 추가 기존 인덱스는 무시하고, 인덱스가 새롭게 생성된다. new_value = {'name':'Python','kor':80,'eng'.. 2023. 5. 11.
[pandas] 열 변경하기 columns, rename 열 추가/수정하기 데이터프레임[컬럼] = 추가할데이터 데이터프레임[컬럼] = 수정할데이터 컬럼이 존재하면 추가, 존재하지 않으면 수정된다. 가공할 데이터 준비 import pandas as pd df = pd.read_csv('data/scores.csv') df.head() """ namekorengmath 0Aiden100.090.095.0 1Charles90.080.075.0 2Danial95.0100.0100.0 3Evan100.0100.0100.0 4HenryNaN35.060.0 """ 열 추가하기 # 학생 번호 추가하기 (1부터 시작하여 1씩 증가) df['no'] = range(1,len(df)+1) # sum 추가 df['sum'] = df['kor']+df['eng']+df['math'].. 2023. 5. 11.
[pandas] 행번호, 열번호로 데이터 추출하기 iloc[], iloc[[]], iloc[:], iloc[-1] 행번호로 행 데이터 추출하기(iloc) 데이터프레임명.iloc[행번호] 데이터프레임명.iloc[행번호리스트] 데이터프레임명.iloc[행번호슬라이스] 음수를 사용하면 행번호를 뒤에서부터 센다. 시리즈 형태로 추출하기 # 첫번째 행 추출하기 df.iloc[0] name Aiden kor 100.0 eng 90.0 math 95.0 Name: i0, dtype: object 데이터프레임 형태로 추출하기 # 첫번째 행 추출하기(데이터프레임) df.iloc[[0]] 행번호 슬라이스로 추출하기 # 1~3행 추출하기 df.iloc[1:4] # 1,3,5행 슬라이스 df.iloc[1:6:2] # 1행 추출하기 df.iloc[1:2] # 짝수 행번호의 데이터 추출하기 df.iloc[::2] 음수 행번호로 추출하기 # 마.. 2023. 5. 11.
[pandas] 인덱스로 데이터 추출하기 loc[], loc[, ], loc[, []] 데이터 준비하기 import pandas as pd df = pd.read_csv('data/scores.csv') df.index = 'i'+df.index.astype('str') df.head() """ namekorengmath i0Aiden100.090.095.0 i1Charles90.080.075.0 i2Danial95.0100.0100.0 i3Evan100.0100.0100.0 i4HenryNaN35.060.0 인덱스로 행 데이터 추출하기 데이터프레임명.loc[인덱스] : 시리즈 형태로 추출한다. 하나의 인덱스만 사용 가능하다. 데이터프레임명.loc[인덱스리스트] : 데이터프레임 형태로 추출한다. 한개 이상의 인덱스를 사용할 수 있다. 시리즈 형태로 추출하기 # 인덱스가 i3인 행 추출하여 .. 2023. 5. 11.
[pandas] 컬럼명으로 데이터 추출하기 데이터 준비하기 import pandas as pd df = pd.read_csv('data/scores.csv') df.head(3) """ namekorengmath 0Aiden100.090.095.0 1Charles90.080.075.0 2Danial95.0100.0100.0 컬럼명으로 데이터 추출하기 시리즈 형태로 추출하기 데이터프레임명['컬럼명'] / 데이터프레임명["컬럼명"] : 컬럼명은 1개만 지정할 수 있으며 대괄호 1개를 사용한다. 데이터프레임명.컬럼명 : 컬럼명에 공백이나 특수문자가 섞여있을 때는 사용할 수 없다. # 'name'컬럼 추출하기 s_name = df['name'] s_name.head(3) """ 0 Aiden 1 Charles 2 Danial Name: name, dty.. 2023. 5. 11.
[pandas] 데이터 확인하기 데이터 미리보기 가장 앞의 n행 보기 데이터프레임.head(n) 시리즈.head(n) n을 생략하면 5개의 행을 출력한다 df.head(3) """ namekorengmath 0Aiden100.090.095.0 1Charles90.080.075.0 2Danial95.0100.0100.0 가장 뒤의 n행 보기 데이터프레임.tail(n) n을 생략하면 5개의 행을 출력한다 df.tail() """ namekorengmath 25Vanessa95.070.095.0 26Viviana100.080.0100.0 27VikkieNaN50.0100.0 28Winnie70.0100.070.0 29Zuly80.090.095.0 랜덤 보기 랜덤 n개 데이터 보기 데이터프레임.sample(n) n을 생략하면 1개의 샘플을 출.. 2023. 5. 11.