자동화
[파이썬] PDF 문서를 이미지로 변환 - pdf2image
파이썬 서퍼
2020. 10. 22. 18:30
728x90
※ PDF 문서를 이미지로 변환하는 것은 pdf2image 모듈을 이용한다.
https://pypi.org/project/pdf2image
pdf2image
A wrapper around the pdftoppm and pdftocairo command line tools to convert PDF to a PIL Image list.
pypi.org
convert_from_path( ) 함수는 추출된 이미지의 PIL 객체 리스트를 반환한다.
▶ scan.pdf 화일에서 이미지를 추출한 후, 첫 이미지만 jpg 화일로 저장한 것이다.
( 해상도 : 600dpi, 페이지 지정 : 10page )
from pdf2image import convert_from_path
images = convert_from_path('scan.pdf', fmt='jpg', output_folder='임시폴더', dpi=600, first_page=0, last_page=9)
images[0].save('first_page.jpg')
▶ 임시폴더에 pdf 파일을 복사한 후 실행하면, 문서를 이미지로 변환한다.
import os, glob
from pdf2image import convert_from_path
path = "./임시폴더"
file = glob.glob(path + '/*.pdf')[0]
if os.access(file, os.F_OK) == True:
images = convert_from_path(file, fmt='jpg', output_folder='임시폴더')
for image in images:
print(image.filename)
▷ 다음은 실행한 결과이다.
반응형