크롤링할 때 자주 쓰는 것 중 하나가 바로 셀레늄입니다. 이번에는 셀레늄의 세팅 방법을 정리합니다. 해당 과정은 컴퓨터에 파이썬이 설치되어 있어야 합니다. 1. pip 설치 셀레늄 설치는 무척 간단합니다. 윈도우+r -> 실행 -> cmd 입력. 터미널이 실행되면 'pip install selenium'를 입력하면 설치됩니다. 2. 웹 드라이버 설치 2-1. 크롬 브라우저 버전 확인 셀레늄은 가상환경과 비슷한 크롬 브라우저를 사용합니다. 그래서 웹 드라이버를 다운로드하여야 합니다. 우선 지금 사용 중인 크롬의 버전을 확인합니다. 아래 사이트에 들어가거나 크롬 메뉴에서 정보를 클릭합니다. 지금 사용하는 크롬의 버전은 80.0.3987이라는 걸 알 수 있습니다. - 설정 -> 도움말 ->크롬 정보 확인 - ..
파이썬으로 데이터 분석을 할 때 판다스라는 데이터 전용 라이브러리를 많이 사용합니다. 그런데 가끔씩 엑셀 데이터를 불러올 때 오류가 나는 경우가 있습니다. 주로 파일 자제 문제보다는 인코딩 문제가 많은데 해결 방법을 정리합니다. 사용 데이터 - 농수축산물 표준품목코드 url : https://tinyurl.com/sqldjy2 해당 사이트에 들어가면 농수축산물 표준품목코드를 받을 수 있습니다. 해당 파일을 MAC에서 열면 글자가 깨지는 것을 볼 수 있습니다. recipe = pd.read_csv(RECIPE_FILE) recipe.head() 해당 파일을 판다스로 그냥 불러오면 오류가 납니다. - 오류 메세지 : 'utf-8' codec can't decode byte 0xba in position 0:..
이미지를 불러오는 기능을 만들어보았습니다. 웹상에 있는 이미지를 불러와서 이미지 너비를 조절하는 기능입니다. 자세한 사항은 아래 링크에서 확인할 수 있습니다. - https://wikidocs.net/38038 위키독스 온라인 책을 제작 공유하는 플랫폼 서비스 wikidocs.net import sys import urllib.request from PyQt5.QtWidgets import QApplication, QWidget, QLabel, QVBoxLayout from PyQt5.QtGui import QPixmap from PyQt5.QtCore import Qt class Qpixmap_App(QWidget): def __init__(self): super().__init__() self.ini..
윈도우와 맥의 한글 깨짐 문제 맥과 윈도우는 인코딩이 달라서 한글을 쓸 경우 깨짐 현상이 있습니다. 그래서 동일한 이름이라도 서로 다르게 인식하는 문제가 있습니다. 이번에는 해당 맥과 윈도우에서 동일한 한글로 변환해주는 기능을 알아보았습니다. - 인코딩 문제인줄 알고 2시간동안 열심히 찾아보았지만 하나같이 제대로 적용되지 않음 - 그런데 알고보니 인코딩 문제가 아니라 파일 형식의 문제였음 - 코드 한 줄로 해결! 문제 현상 분명 동일한 파일명이지만 길이와 바이러니를 찍어보면 다르게 나옴. - 위 두개의 파일은 동일한 파일명이지만 길이가 mac에서 작업한 것은 48, 윈도우에서 작업한 것은 26으로 나옴 해결 방법! 해결 방법은 무척 간단하다. unicodedata 모듈에서 normalize 기능을 불러와..