[파이썬] PDF 문서 병합 / PDF 파일들을 하나로 합치기 - PyPDF2

2020. 10. 26. 21:42자동화

728x90

 

 

 

※ PDF 문서를 병합하는 것은 PyPDF2 모듈을 이용한다.

 

PyPDF2는 PDF 파일의 페이지를 분할, 병합, 자르기 및 변형 할 수있는 순수 Python PDF 라이브러리로, PDF 파일에 사용자 정의 데이터, 보기 옵션 및 암호를 추가 할 수 있다.

PDF에서 텍스트와 메타 데이터를 검색하고 전체 파일을 함께 병합 할 수 있다.

 

 

   PyPDF2.PdfFileMerger (strict=True)

   : PdfFileMerger는 여러 PDF를 단일 PDF로 병합하며, 연결, 슬라이스, 삽입 또는 위의 조합이 가능하다.

 

       append (fileobjbookmark = Nonepages = Noneimport_bookmarks = True )

        : 지정된 페이지 번호의 출력 파일로 병합

 

 

   PyPDF2.PdfFileReader (stream)

   : PdfFileReader 개체를 초기화하며, 이 작업은 PDF 스트림의 상호 참조 테이블을 메모리로 읽어 온다.

 

 

 


▶ 임시폴더에 pdf 파일들을 복사한 후 실행하면, 문서들을 합쳐서 하나의 파일로 만든다.

 

from PyPDF2 import PdfFileMerger, PdfFileReader
import os, glob

path = "./임시폴더"
filenames = glob.glob(path + '/*.pdf')

if not filenames: 
    print(">> 임시폴더에 병합할 PDF파일을 넣으세요 !")
    
else:
    merger = PdfFileMerger()
    for filename in filenames:
        merger.append(PdfFileReader(open(filename, 'rb')))
        print(filename)
        
    merger.write(path + "/merge_files.pdf")
    print(">> PDF 합치기 완료")
    

 

 

 

▷ 다음은 실행한 결과이다.

 

 

 

 

 

 

반응형