IT/파이썬(15)
-
[python] mac, windows, 파일, 인코딩, 합치기, 변환
윈도우와 맥의 한글 깨짐 문제 맥과 윈도우는 인코딩이 달라서 한글을 쓸 경우 깨짐 현상이 있습니다. 그래서 동일한 이름이라도 서로 다르게 인식하는 문제가 있습니다. 이번에는 해당 맥과 윈도우에서 동일한 한글로 변환해주는 기능을 알아보았습니다. - 인코딩 문제인줄 알고 2시간동안 열심히 찾아보았지만 하나같이 제대로 적용되지 않음 - 그런데 알고보니 인코딩 문제가 아니라 파일 형식의 문제였음 - 코드 한 줄로 해결! 문제 현상 분명 동일한 파일명이지만 길이와 바이러니를 찍어보면 다르게 나옴. - 위 두개의 파일은 동일한 파일명이지만 길이가 mac에서 작업한 것은 48, 윈도우에서 작업한 것은 26으로 나옴 해결 방법! 해결 방법은 무척 간단하다. unicodedata 모듈에서 normalize 기능을 불러와..
2020.02.20 -
[파이콘] 라이트닝 토크
라이트닝 토크는 그날의 프로그램이 모두 끝나고, 모든 참석자가 모여 5분 이내의 가벼운 이야기를 하는 행사입니다. 라이트닝 토크는 아래와 같은 주제로 이야기됩니다! - 2018 라이트닝 토크 : https://archive.pycon.kr/2018/program/lightning_talk/ 홍연의 사회자. 둘째날 발표 세션까지 다 끝나. 잘 들었나요? ----- 소프트웨어 엔지니어의 플러스 마이너스 - 강재성 기술고문 이력서 받고 공유하고 싶은 이야기 아쉬움을 많이 느껴. 더 잘 쓸 수 도 있을텐데 이력서 중 일부. 다른 회사 이름 X 필기합격만 4개.. 안좋은 인상 워드프로세서도 마이너스로 적용 운전면허도 꼭 필요한게 아니라면... 보는 사람이 궁금하면 안됨. 영어라면 어느정도인지 관심분야 적는 경우도..
2019.08.18 -
[파이콘] 이수호 - Python Daemonize: 파이썬으로 악마를 만들어보자
비기너 백엔드 프로그래머 지망생입니다. 문화를 사랑하고 전문가를 지향합니다. 최근의 백그라운드 프로그램은 많은 영역에서 사용되고 있습니다. 웹 서버부터 시스템 감시 툴까지 다양한 영역에서 사용되고 있는 백그라운드 프로그램은 데몬이라는 프로세스 개념을 기본으로 동작합니다. 본 세션은 *nix 계열 운영체제 사용자이면서, 서비스나 데몬 등을 사용하여 보았고. 이를 만들어 보고 싶은 사람들을 대상으로 합니다. 따라서 본 발표는 다음과 같은 지식을 선수합니다. 필수: *nix계열 운영체제 사용 경험(linux, BSD, macOS) *nix계열의 파일 시스템 개념 파이썬 기초 문법 파이썬 패키징 선택: 프로세스에 대한 기본적인 이해 https://www.pycon.kr/program/talk-detail?id=..
2019.08.18 -
[파이콘] 김재윤 - 법률을 디버깅하다(Debugging law)
Python으로 입법을 연구합니다. 전) 국회 법제실, 예산정책처 서울대학교 행정대학원 박사과정 재학 중 더 좋은 법률을 만들기 위해 Python으로 법률을 분석한 사례를 공유합니다. 사용 라이브러리: pandas, requests, urllib, beautiful soup, re, networkx, community, matplotlib 법률을 잘 몰라도 듣는데 어려움이 없습니다. 0. 도입: '법률'이라는 프로젝트 70년간의 초장기 프로젝트, 입사와 퇴사를 반복하는 개발자 코드의 길이는 2,500만 글자 Python으로 '법률' 프로젝트에 조금이나마 커밋해봅시다. 1. 법률간 충돌 자동검사 입법상 착오로 법률간 인용연결이 끊어지는 경우(404!) Python으로 법률의 에러를 찾아봅니다. 조문별 웹크..
2019.08.18 -
[파이콘] 윤소영 - 실시간 의료 인공지능 데이터 처리를 위한 Django Query Optimization
A의료인공지능 기업 AITRICS에서 backend와 frontend 개발을 하고 있는 윤소영입니다. 새로운 것을 배우는 것에 관심이 많습니다. Web service 구현 시 속도 최적화는 모든 개발자들이 마주하는 필수적인 부분입니다. 딥러닝을 이용한 서비스가 점점 늘고, 처리해야 하는 데이터의 양이 점점 늘어나면서 많은 양의 데이터 처리 성능 최적화의 중요성도 점점 늘고 있습니다. 제가 현재 일하고 있는 의료 인공지능 회사에서도 역시, Django로 대용량의 의료 정보 데이터를 실시간으로 받아 빠르게 저장하고 업데이트를 해줘야 하는 경우가 많습니다. 저는 먼저 Django ORM이 무엇인지에 대해 설명하고, 이러한 데이터를 처리할 때 마주했던 문제점들을 소개한 후, 이 문제점들을 어떻게 해결했는지를 발..
2019.08.18 -
[파이콘] 이홍주 - 집에서 만든 머신러닝 기반 자동번역기 (NO 딥러닝)
오늘날 자동번역기술이 상당한 수준에 이르렀습니다. 그중 딥러닝 기술을 활용한 자동번역(Machine Translation) 기술이 최근 개발자들에게 널리 소개되기도 했지만, 불과 얼마전까지도 우리들은 확률에 기반한 머신러닝 기술로 만들어진 자동번역기를 편리하게 이용했었습니다. 이 발표는 확률에 기반한 머신러닝 알고리즘을 구현하여 일종의 자동번역기를 만드는 방법에 대해 소개합니다. 이 자동번역기는 로마자(알파벳)로 입력한 문자열을 한글 문자열로 변환하여 출력합니다. (ex. Obama => 오바마) 얼핏 머신러닝 기술 없이도 rule-base 로 만들 수 있을 것 같지만, rule-base 로 해결하기 어려운 문제점들이 있습니다. 첫째, "hangul", "hangeul", "hanguel" 등 여러가지 ..
2019.08.18