파이썬의 bs4 그리고 requests를 활용해서 크롤링을 할 때에, 한글 인코딩 문제로 아래와 같은 에러가 발생할 수 있다.
본인은 conda 가상 환경에서 python 3.6 버전을 이용해서 cgv의 상영 시간표를 크롤링하다가 이러한 에러를 만났다.
UnicodeEncodeError: 'cp949' codec can't encode character '\xa0' in position 162673: illegal multibyte sequence
인코딩과 관련된 문제는 대부분 한글과 관련해서 발생하는 문제이다.
코드 상단에 아래와 같은 코드를 추가해주면 해결할 수 있다.
1 2 3 4 | import sys import io sys.stdout = io.TextIOWrapper(sys.stdout.detach(), encoding = 'utf-8') sys.stderr = io.TextIOWrapper(sys.stderr.detach(), encoding = 'utf-8') |
'Programming Language > Python' 카테고리의 다른 글
tkinter를 활용한 간단한 GUI 프로그램 (0) | 2019.08.27 |
---|---|
python 데이터 타입, 자료형 및 기본적인 내용 (0) | 2019.08.26 |