<데이터추가하기>
데이터프레임명['칼럼명'] =data값
ex) data['수학'] = 100 => 수학칼럼에 100값을 추가(모든행에 100이 삽입, 여러개 넣고 싶으면 리스트활용)
<데이터 병합하기>
=> pd.merge()
기준이 되는 테이블 정하는 법 : left, right, outer(다합치기), inner(공통된부분만 합치기)
pd.merge(A,B, how ='left'(기준이되는 테이블 지정), left_on ="A 칼럼명"/left_index=True(인덱스 기준), right_on = "B컬럼명"/right_index=True)
***left_on과 left_index는 같이 쓰면안되고 둘중에 하나만 가능하다.
<데이터 저장하기>
데이터프레임명.to_excel('파일경로+파일명.xlsx',index=False) =>인덱스를 저장하지 않는 옵션
<데이터집계하기>
데이터프레임.pivot_table(index='칼럼명',colums='칼럼명',values='칼럼명',aggfunc='계산방식')
***aggfunc 옵션 : sum,count, mean ..등
<비어있는 데이트에 값 넣기>
데이터프레임.fillna() =>()안에 넣고 싶은 값 넣으면 된다.
<정렬하기>
name_df.sort_values(by = '칼럼명',ascending=False)((.head()도 가능))((.index))
=> ascending을 사용하면 내림차순으로 정렬된다. 없으면 오른차순
<컬럼별 데이터 종류 확인하기>
데이터프레임['칼럼'].unique() => 칼럼안에 있는 종류를 알 수 있음
데이터프레임['칼럼'].value_conunts() => 빈도수를 알 수 있음
'언어 > 파이썬' 카테고리의 다른 글
판다스로 기본 통계 구하기 (0) | 2021.01.24 |
---|---|
함수/구구단 출력하기 (0) | 2021.01.20 |
판다스 : 데이터 불러오기/ 데이터 선택하기 (0) | 2021.01.16 |
반복문-for/조건문-if/문자열 포메팅/strip (0) | 2021.01.15 |
자료형 (0) | 2021.01.15 |