pd.merge(dfA[['col1','col2']], dfB[['col1','col2']], on='key') 2개의 데이터프레임에서 원하는 칼럼만 추출하여 결합 df = pd.merge(df,df2[['Key_Column','Target_Column']],on='Key_Column', how='left') 출처 : https://stackoverflow.com/questions/17978133/python-pandas-merge-only-certain-columns pd.merge(how='left') 결합하는 방법의 종류. 총 4가지 방법이 있음 result = pd.merge(user_usage, user_device[['use_id', 'platform', 'device']], on='use_i..
dtypes 데이터프레임에 각 칼럼들의 데이터 형태를 조회 df.dtypes 출처 : https://pbpython.com/pandas_dtypes.html pd.to_datetime 문자열 정보를 날짜 형태로 변경 raw_data['Mycol'] = pd.to_datetime(raw_data['Mycol'], format='%d%b%Y:%H:%M:%S.%f') 또는 df[["col1", "col2", "col3"]] = df[["col1", "col2", "col3"]].apply(pd.to_datetime) 출처 : https://stackoverflow.com/questions/26763344/convert-pandas-column-to-datetime rename(columns={'A':'B'})..
skiprows 원하는 행부터 불러올 때. 아래 예제는 5줄까지 무시하고 다음 행부터 불러옴 pd.read_csv('../input/sample_submission.csv',skiprows=5,nrows=10) 출처 : https://stackoverflow.com/questions/47917943/how-to-select-several-rows-when-reading-a-csv-file-using-pandas names 불러올 때 칼럼 이름을 지정한 이름으로 변경 d = pd.read_csv('test.csv', header=0, names=['NEW1', 'NEW2', 'NEW3'], usecols=['NEW2', 'NEW3']) 출처 : https://stackoverflow.com/question..