본문 바로가기
개발 이야기/머신러닝, 딥러닝

[딥러닝 첫걸음] Colab에서 tesseract-ocr 라이브러리 사용하려면

by AI 동키 2021. 3. 11.
반응형

Colab에서 OCR 기능을 가진 tesseract-ocr 라이브러리를 사용하기 위해서는 우선 설치가 필요합니다.

파이썬에서 사용하는 pytesseract 패키지도 함께 설치해 줍시다.

로컬환경에서 Jupyter notebook을 이용하고 있다면 또 다른 이야기가 됩니다. 참고해 주시기 바랍니다.


Colab에서 tesseract 설치하기

 

아래와 같이 Colab 코드블럭에 설치 명령어를 입력하세요.

!sudo apt install tesseract-ocr
!pip install pytesseract

 

 

설치가 완료되었네요.

 

잘 불러와지는걸 확인했습니다.


 

이제 pytesseract를 이용하여 OCR을 실행하는 방법을 실습 해봅시다.

2021.03.11 - [언어/Python] - [딥러닝 첫걸음] 파이썬 OCR 라이블러리 - pytesseract로 OCR 해보기(이미지 문자 읽기)

 

[딥러닝 첫걸음] 파이썬 OCR 라이블러리 - pytesseract로 OCR 해보기(이미지 문자 읽기)

이미지에 있는 문자를 문자열로 반환하는 코드를 파이썬으로 짜보도록 하자. OCR은 Optical Character Recognition의 약자로 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계

lapina.tistory.com

 

반응형

댓글