pytesseract ocr 구현1 [딥러닝 첫걸음] 파이썬 OCR 라이블러리 - pytesseract로 OCR 해보기(이미지 문자 읽기) 이미지에 있는 문자를 문자열로 반환하는 코드를 파이썬으로 짜보도록 하자. OCR은 Optical Character Recognition의 약자로 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것을 뜻한다. 오늘 파이썬에서 사용할 라이브러리는 pytesseract이다. 테서랙트(Tesseract)는 다양한 운영 체제를 위한 광학 문자 인식 엔진이다. 이 소프트웨어는 Apache License, 버전 2.0,에 따라 배포되는 무료 소프트웨어이며 2006년부터 Google에서 개발을 후원했다. Colab을 사용할 것이고, Colab에서 기본적으로 지원되는 라이브러리가 아니기 때문에 설치가 필요하다. Colab이 아니라 PC에서 작업 중이라면 코드 내용.. 2021. 3. 11. 이전 1 다음 반응형