자동화(9)
-
[파이썬] 유튜브 영상 / 자막 다운로드 - pytube
pytube는 YouTube 비디오를 다운로드하기 위한, 가볍고 종속성이 없는 라이브러리이다. pytube: 2.7 / 3.4 / 3.5 / 3.6 / 3.7 pytube3: 3.6 / 3.7 / 3.8 → pip install pytube3 ▶ 영상 다운로드 from pytube import YouTube url = 'https://www.youtube.com/watch?v=ecF1y2bI2T4' yt = YouTube(url) stream = yt.streams.all()[0] stream.download(output_path='C:/test') # 영상 다운로드 yt.streams.all() 실행 시, 해상도 관련 전체 목록을 볼 수 있으며, yt.streams.all()[0] 은 그중 첫 번째 항..
2020.10.25 -
[파이썬] PDF 문서를 이미지로 변환 - pdf2image
※ PDF 문서를 이미지로 변환하는 것은 pdf2image 모듈을 이용한다. https://pypi.org/project/pdf2image pdf2image A wrapper around the pdftoppm and pdftocairo command line tools to convert PDF to a PIL Image list. pypi.org convert_from_path( ) 함수는 추출된 이미지의 PIL 객체 리스트를 반환한다. ▶ scan.pdf 화일에서 이미지를 추출한 후, 첫 이미지만 jpg 화일로 저장한 것이다. ( 해상도 : 600dpi, 페이지 지정 : 10page ) from pdf2image import convert_from_path images = convert_from_p..
2020.10.22 -
[파이썬] 웹페이지를 PDF화일로 변환하는 방법 ( web to pdf / HTML to pdf ) - pdfkit
pdfkit 모듈은 wkhtmltopdf 유틸리티를 이용하여 , 웹페이지 또는 저장된 HTML문서를 PDF문서로 변환하는 래퍼 모듈이다. 따라서, wkhtmltopdf가 설치되어 있어야 하고 경로가 configuration에 지정되어야 한다. https://wkhtmltopdf.org/downloads.html wkhtmltopdfAll downloads are currently hosted via GitHub releases, so you can browse for a specific download or use the links below. Do not use wkhtmltopdf with any untrusted HTML – be sure to sanitize any user-supplied HTM..
2020.09.10