언어/파이썬

데이터추가/병합/저장/집계/비어있는값넣기/정렬/종류확인

앨리스.W 2021. 1. 16. 14:54

<데이터추가하기>

데이터프레임명['칼럼명'] =data값

ex) data['수학'] = 100  => 수학칼럼에 100값을 추가(모든행에 100이 삽입, 여러개 넣고 싶으면 리스트활용)

 

 

<데이터 병합하기>

=> pd.merge()

기준이 되는 테이블 정하는 법 : left, right, outer(다합치기), inner(공통된부분만 합치기)

pd.merge(A,B, how ='left'(기준이되는 테이블 지정), left_on ="A 칼럼명"/left_index=True(인덱스 기준),                     right_on = "B컬럼명"/right_index=True)

***left_on과 left_index는 같이 쓰면안되고 둘중에 하나만 가능하다.

                                                                

<데이터 저장하기>

데이터프레임명.to_excel('파일경로+파일명.xlsx',index=False)  =>인덱스를 저장하지 않는 옵션

 

<데이터집계하기>

데이터프레임.pivot_table(index='칼럼명',colums='칼럼명',values='칼럼명',aggfunc='계산방식')

***aggfunc 옵션 : sum,count, mean ..등

 

<비어있는 데이트에 값 넣기>

데이터프레임.fillna() =>()안에 넣고 싶은 값 넣으면 된다.

 

<정렬하기> 

name_df.sort_values(by = '칼럼명',ascending=False)((.head()도 가능))((.index))

=> ascending을 사용하면 내림차순으로 정렬된다. 없으면 오른차순

 

<컬럼별 데이터 종류 확인하기>

데이터프레임['칼럼'].unique()   => 칼럼안에 있는 종류를 알 수 있음

데이터프레임['칼럼'].value_conunts()  => 빈도수를 알 수 있음

반응형