[Pandas] 전처리

2019. 9. 16. 21:19IT/Pandas : 데이터

df.dropna()

하나라도 NA가 있는 행을 제거. 조건에 따라 다양한 방식으로 설정 가능

df1.dropna()   /   df1.dropna(how='all')

좌 : Null값이 하나라도 있으면 행 삭제 / 우 : 모든 값이 Null이면 행 삭제

f1.dropna(thresh=2)   /  df1.dropna(subset=['Gender'])

좌 : Null값이 2개 이상이면 행 삭제 / 우 : Gender 칼럼의 Null값만 삭제

출처 : http://www.datasciencemadesimple.com/drop-rows-with-nan-na-drop-missing-value-in-pandas-python-2/

 

 

 

df.sort_value()

데이터를 정렬합니다.

data.sort_values("Name", axis = 0, ascending = True, 
                 inplace = True, na_position ='last') 

 

name 기준으로 오름차순 정렬

출처 : https://www.geeksforgeeks.org/python-pandas-dataframe-sort_values-set-1/

 

 

 

 

 

'IT > Pandas : 데이터' 카테고리의 다른 글

[pandas] 인코딩, 확인, 조회, 불러오기  (1) 2020.02.27
[Pandas] DataFrame  (0) 2019.09.16
[Pandas] plot 그래프  (0) 2019.09.16
[Pandas] merge 병합  (0) 2019.09.16
[Pandas] 데이터 형태  (0) 2019.09.16