2020. 10. 25. 10:08ㆍ자동화
pytube는 YouTube 비디오를 다운로드하기 위한, 가볍고 종속성이 없는 라이브러리이다.
pytube: 2.7 / 3.4 / 3.5 / 3.6 / 3.7
pytube3: 3.6 / 3.7 / 3.8 → pip install pytube3
▶ 영상 다운로드
from pytube import YouTube
url = 'https://www.youtube.com/watch?v=ecF1y2bI2T4'
yt = YouTube(url)
stream = yt.streams.all()[0]
stream.download(output_path='C:/test') # 영상 다운로드
yt.streams.all() 실행 시, 해상도 관련 전체 목록을 볼 수 있으며,
yt.streams.all()[0] 은 그중 첫 번째 항목을 의미.
▶ 자막 다운로드
caption = yt.captions['en'] # 영문자막 선택하기
if caption == None:
caption = yt.captions.all()[0]
caption.download(title=yt.title, output_path='C:/test') # 자막 다운로드
yt.captions.all() 실행 시, 자막 관련 전체 목록을 볼 수 있으며,
yt.captions.all()[0] 은 그중 첫 번째 항목을 의미.
yt.title : 영상 제목
yt.author : 영상 게시자
yt.views : 조회 수
yt.rating : 평점
yt.length : 영상 길이(초)
yt.age_restricted : 연령 제한 여부)
yt.description : 영상 설명
yt.thumbnail_url : 섬네일 URL
yt.streams.filter(file_extension = 'mp4').all( ) # 영상만 선택하기
yt.streams.filter(only_audio = True).all() # 음성만 선택하기
→ 영어 공부용으로 자막을 다운로드해 이용하면 좋다.
※ 공유되는 영상들은 모두 저작권을 가지고 있는 영상입니다.
이를 다운로드 받아 무단으로 배포하거나 저작권자의 허락 없이 임의로 수정하여 사용할 경우, 법적 책임을 물을 수 있습니다.
cf) KeyError: 'assets' 발생시,
pip3 uninstall -y pytube3
pip3 install git+https://github.com/nficano/pytube
'자동화' 카테고리의 다른 글
[파이썬] PDF 문서에서 텍스트 추출 - Tika (0) | 2020.10.27 |
---|---|
[파이썬] PDF 문서 병합 / PDF 파일들을 하나로 합치기 - PyPDF2 (0) | 2020.10.26 |
[파이썬] 파워포인트 / 워드 문서를 PDF 파일로 변환하는 방법 ( ppt to pdf / doc to pdf ) - 자동화 (0) | 2020.10.25 |
[파이썬] PDF 문서를 이미지로 변환 - pdf2image (0) | 2020.10.22 |
[파이썬] 웹페이지를 PDF화일로 변환하는 방법 ( web to pdf / HTML to pdf ) - pdfkit (0) | 2020.09.10 |