[파이썬] PDF 문서 병합 / PDF 파일들을 하나로 합치기 - PyPDF2
2020. 10. 26. 21:42ㆍ자동화
728x90
※ PDF 문서를 병합하는 것은 PyPDF2 모듈을 이용한다.
PyPDF2는 PDF 파일의 페이지를 분할, 병합, 자르기 및 변형 할 수있는 순수 Python PDF 라이브러리로, PDF 파일에 사용자 정의 데이터, 보기 옵션 및 암호를 추가 할 수 있다.
PDF에서 텍스트와 메타 데이터를 검색하고 전체 파일을 함께 병합 할 수 있다.
PyPDF2.PdfFileMerger (strict=True)
: PdfFileMerger는 여러 PDF를 단일 PDF로 병합하며, 연결, 슬라이스, 삽입 또는 위의 조합이 가능하다.
append (fileobj, bookmark = None, pages = None, import_bookmarks = True )
: 지정된 페이지 번호의 출력 파일로 병합
PyPDF2.PdfFileReader (stream)
: PdfFileReader 개체를 초기화하며, 이 작업은 PDF 스트림의 상호 참조 테이블을 메모리로 읽어 온다.
▶ 임시폴더에 pdf 파일들을 복사한 후 실행하면, 문서들을 합쳐서 하나의 파일로 만든다.
from PyPDF2 import PdfFileMerger, PdfFileReader
import os, glob
path = "./임시폴더"
filenames = glob.glob(path + '/*.pdf')
if not filenames:
print(">> 임시폴더에 병합할 PDF파일을 넣으세요 !")
else:
merger = PdfFileMerger()
for filename in filenames:
merger.append(PdfFileReader(open(filename, 'rb')))
print(filename)
merger.write(path + "/merge_files.pdf")
print(">> PDF 합치기 완료")
▷ 다음은 실행한 결과이다.
반응형
'자동화' 카테고리의 다른 글
[파이썬 ] 데이터프레임 엑셀 시트 / 차트 만들기 - pandas / xlsxwriter 모듈 (0) | 2021.01.14 |
---|---|
[파이썬] PDF 문서에서 텍스트 추출 - Tika (0) | 2020.10.27 |
[파이썬] 파워포인트 / 워드 문서를 PDF 파일로 변환하는 방법 ( ppt to pdf / doc to pdf ) - 자동화 (0) | 2020.10.25 |
[파이썬] 유튜브 영상 / 자막 다운로드 - pytube (0) | 2020.10.25 |
[파이썬] PDF 문서를 이미지로 변환 - pdf2image (0) | 2020.10.22 |