파이썬으로 데이터 분석을 할 때 판다스라는 데이터 전용 라이브러리를 많이 사용합니다. 그런데 가끔씩 엑셀 데이터를 불러올 때 오류가 나는 경우가 있습니다. 주로 파일 자제 문제보다는 인코딩 문제가 많은데 해결 방법을 정리합니다. 사용 데이터 - 농수축산물 표준품목코드 url : https://tinyurl.com/sqldjy2 해당 사이트에 들어가면 농수축산물 표준품목코드를 받을 수 있습니다. 해당 파일을 MAC에서 열면 글자가 깨지는 것을 볼 수 있습니다. recipe = pd.read_csv(RECIPE_FILE) recipe.head() 해당 파일을 판다스로 그냥 불러오면 오류가 납니다. - 오류 메세지 : 'utf-8' codec can't decode byte 0xba in position 0:..
윈도우와 맥의 한글 깨짐 문제 맥과 윈도우는 인코딩이 달라서 한글을 쓸 경우 깨짐 현상이 있습니다. 그래서 동일한 이름이라도 서로 다르게 인식하는 문제가 있습니다. 이번에는 해당 맥과 윈도우에서 동일한 한글로 변환해주는 기능을 알아보았습니다. - 인코딩 문제인줄 알고 2시간동안 열심히 찾아보았지만 하나같이 제대로 적용되지 않음 - 그런데 알고보니 인코딩 문제가 아니라 파일 형식의 문제였음 - 코드 한 줄로 해결! 문제 현상 분명 동일한 파일명이지만 길이와 바이러니를 찍어보면 다르게 나옴. - 위 두개의 파일은 동일한 파일명이지만 길이가 mac에서 작업한 것은 48, 윈도우에서 작업한 것은 26으로 나옴 해결 방법! 해결 방법은 무척 간단하다. unicodedata 모듈에서 normalize 기능을 불러와..