본문 바로가기

파이썬 pdf 변환2

파이썬 오류_PDFInfoNotInstalledError: Unable to get page count. Is poppler installed and in PATH? 오류 pdf2image 라이브러리를 사용하면서 발생한 오류이다. 이는 pdf2image가 poppler와 PIL등의 wrapper이기 때문에 poppler가 설치 안되어있을 때 발생한다. 좀 같이 설치해주면 얼마나 좋을까? 어쨋든 해결 방법은 간단하다. 윈도우10, anaconda를 사용한다면 아래와 같이 poppler를 설치해주면 해결 된다. conda install -c conda-forge poppler 설치해준다. 해결 되었다. 이 pdf2image 라이브러리를 사용하여 파이썬에서 PDF 파일을 이미지로 변환하는 방법은 아래에서 참고! 2021.05.17 - [언어/Python] - [파이썬] 여러장의 PDF 문서를 이미지로 변환하기 : 이걸로 끝남 (pdf2image) [파이썬] 여러장의 PDF 문서.. 2021. 5. 18.
[파이썬] 여러장의 PDF 문서를 이미지로 변환하기 : 이걸로 끝남 (pdf2image) 오늘은 여러장으로 된 PDF 문서를 이미지 형태로 변환하는 Python 라이브러리와 코드를 알아보겠습니다. 차근차근 따라해보면 바로 써먹을 수 있을 것입니다. 작업 환경은 Colab 이며, 사용할 라이브러리는 pdf2image 입니다. pdf2image는 pdf 파일을 PIL Image 객체로 변환해주는 Wrapper입니다. 즉, 최초 변환된 형태는 PIL 이미지 객체로 PIL 명령어를 통해 추가 활용이 가능하며, 이미지 파일이 아니므로, Numpy형태나 jpg 형태로 사용하려면 후속 작업이 필요합니다. A python (3.6+) module that wraps pdftoppm and pdftocairo to convert PDF to a PIL Image object 자세한 내용은 공식문서를 참고해 .. 2021. 5. 17.
반응형