[파이썬] PDF 문서를 이미지로 변환 - pdf2image

2020. 10. 22. 18:30자동화

728x90

 

 

 

 

 

 

※ PDF 문서를 이미지로 변환하는 것은 pdf2image 모듈을 이용한다.

 

 https://pypi.org/project/pdf2image

 

pdf2image

A wrapper around the pdftoppm and pdftocairo command line tools to convert PDF to a PIL Image list.

pypi.org

 convert_from_path( ) 함수는 추출된 이미지의 PIL 객체 리스트를 반환한다.

 

 

 


 

scan.pdf 화일에서 이미지를 추출한 후,  첫 이미지만 jpg 화일로 저장한 것이다.

    ( 해상도 : 600dpi, 페이지 지정 : 10page )

 


from pdf2image import convert_from_path

images = convert_from_path('scan.pdf', fmt='jpg', output_folder='임시폴더', dpi=600, first_page=0, last_page=9)
images[0].save('first_page.jpg')

 

 

 

 

▶ 임시폴더에 pdf 파일을 복사한 후 실행하면,  문서를 이미지로 변환한다.

 


import os, glob
from pdf2image import convert_from_path
    
path = "./임시폴더"
file = glob.glob(path + '/*.pdf')[0]

if os.access(file, os.F_OK) == True:
    images = convert_from_path(file, fmt='jpg', output_folder='임시폴더')
    
    for image in images:
        print(image.filename)
        

 

 

▷ 다음은 실행한 결과이다.

 

 

 

 

반응형