[파이썬] PDF 문서를 이미지로 변환 - pdf2image
2020. 10. 22. 18:30ㆍ자동화
728x90
※ PDF 문서를 이미지로 변환하는 것은 pdf2image 모듈을 이용한다.
https://pypi.org/project/pdf2image
convert_from_path( ) 함수는 추출된 이미지의 PIL 객체 리스트를 반환한다.
▶ scan.pdf 화일에서 이미지를 추출한 후, 첫 이미지만 jpg 화일로 저장한 것이다.
( 해상도 : 600dpi, 페이지 지정 : 10page )
from pdf2image import convert_from_path
images = convert_from_path('scan.pdf', fmt='jpg', output_folder='임시폴더', dpi=600, first_page=0, last_page=9)
images[0].save('first_page.jpg')
▶ 임시폴더에 pdf 파일을 복사한 후 실행하면, 문서를 이미지로 변환한다.
import os, glob
from pdf2image import convert_from_path
path = "./임시폴더"
file = glob.glob(path + '/*.pdf')[0]
if os.access(file, os.F_OK) == True:
images = convert_from_path(file, fmt='jpg', output_folder='임시폴더')
for image in images:
print(image.filename)
▷ 다음은 실행한 결과이다.
반응형
'자동화' 카테고리의 다른 글
[파이썬] PDF 문서에서 텍스트 추출 - Tika (0) | 2020.10.27 |
---|---|
[파이썬] PDF 문서 병합 / PDF 파일들을 하나로 합치기 - PyPDF2 (0) | 2020.10.26 |
[파이썬] 파워포인트 / 워드 문서를 PDF 파일로 변환하는 방법 ( ppt to pdf / doc to pdf ) - 자동화 (0) | 2020.10.25 |
[파이썬] 유튜브 영상 / 자막 다운로드 - pytube (0) | 2020.10.25 |
[파이썬] 웹페이지를 PDF화일로 변환하는 방법 ( web to pdf / HTML to pdf ) - pdfkit (0) | 2020.09.10 |