[python] mac, windows, 파일, 인코딩, 합치기, 변환
2020. 2. 20. 11:28ㆍIT/파이썬
윈도우와 맥의 한글 깨짐 문제
맥과 윈도우는 인코딩이 달라서 한글을 쓸 경우 깨짐 현상이 있습니다. 그래서 동일한 이름이라도 서로 다르게 인식하는 문제가 있습니다. 이번에는 해당 맥과 윈도우에서 동일한 한글로 변환해주는 기능을 알아보았습니다.
- 인코딩 문제인줄 알고 2시간동안 열심히 찾아보았지만 하나같이 제대로 적용되지 않음
- 그런데 알고보니 인코딩 문제가 아니라 파일 형식의 문제였음
- 코드 한 줄로 해결!
문제 현상
분명 동일한 파일명이지만 길이와 바이러니를 찍어보면 다르게 나옴.
- 위 두개의 파일은 동일한 파일명이지만 길이가 mac에서 작업한 것은 48, 윈도우에서 작업한 것은 26으로 나옴
해결 방법!
해결 방법은 무척 간단하다. unicodedata 모듈에서 normalize 기능을 불러와서 'NFC'로 바꾸어 주면 된다.
from unicodedata import normalize
name = normalize('NFC', name)
- name에 파일명을 입력해주면 된다.
name에 해당 코드를 적용한 결과 동일한 길이, 동일한 바이러니로 변환되어 완전히 같은 문자열이 되었다.
'IT > 파이썬' 카테고리의 다른 글
[파이콘] 라이트닝 토크 (0) | 2019.08.18 |
---|---|
[파이콘] 이수호 - Python Daemonize: 파이썬으로 악마를 만들어보자 (0) | 2019.08.18 |
[파이콘] 김재윤 - 법률을 디버깅하다(Debugging law) (0) | 2019.08.18 |
[파이콘] 윤소영 - 실시간 의료 인공지능 데이터 처리를 위한 Django Query Optimization (0) | 2019.08.18 |
[파이콘] 이홍주 - 집에서 만든 머신러닝 기반 자동번역기 (NO 딥러닝) (0) | 2019.08.18 |