분류 전체보기(38)
-
[파이썬] 구글 번역 - googletrans
Googletrans 는구글 번역 API(Google Translate API)를 구현한 파이썬 라이브러리입니다. (Googletrans 공식 문서) from googletrans import Translator translator = Translator() tran = translator.translate("안녕하세요", src='auto', dest='zh-cn') print(tran.text, tran.pronunciation) 무료이지만, 하루에 사용할 수 있는 횟수가 제한되어 있습니다. The maximum character limit on a single text is 15k ▶ 사용할 수 있는 언어 import googletrans googletrans.LANGUAGES
2020.10.28 -
[파이썬] PDF 문서에서 텍스트 추출 - Tika
Tika REST Server 를 사용하여 Tika 를 사용할 수 있도록 하는 Apache Tika 라이브러리의 Python 포트이다. TikaJAXRS - TIKA - Apache Software Foundation 배너의 맨 끝으로 배너의 맨 처음으로 TikaJAXRS 메타 데이터의 끝으로 건너뛰기 작성자 : ASF Infrabot, 최근 변경 : Tim Allison - 2월 25, 2020 메타 데이터의 시작으로 이동 This page has moved to TikaServer cwiki.apache.org 이 라이브러리를 사용하려면 tika-python이 백그라운드에서 Tika REST 서버를 시작하므로, 시스템에 Java 7 이상이 설치되어 있어야 한다. from tika import pars..
2020.10.27 -
[파이썬] PDF 문서 병합 / PDF 파일들을 하나로 합치기 - PyPDF2
※ PDF 문서를 병합하는 것은 PyPDF2 모듈을 이용한다. PyPDF2는 PDF 파일의 페이지를 분할, 병합, 자르기 및 변형 할 수있는 순수 Python PDF 라이브러리로, PDF 파일에 사용자 정의 데이터, 보기 옵션 및 암호를 추가 할 수 있다. PDF에서 텍스트와 메타 데이터를 검색하고 전체 파일을 함께 병합 할 수 있다. PyPDF2.PdfFileMerger (strict=True) : PdfFileMerger는 여러 PDF를 단일 PDF로 병합하며, 연결, 슬라이스, 삽입 또는 위의 조합이 가능하다. append (fileobj, bookmark = None, pages = None, import_bookmarks = True ) : 지정된 페이지 번호의 출력 파일로 병합 PyPDF2.P..
2020.10.26 -
[파이썬] heroku 웹호스팅 - Flask
Heroku는 간단하게 무료로 호스팅 할 수 있도록 해주는 서비스로, 해당 도메인으로 몇 시간 동안 요청이 없을 경우, 수면상태로 전환하여 초기접속이 약간 늦어지는 편이다. ▶ heroku 가입 및 설치 * PC에 git 설치 * heroku 전용 CLI 설치 devcenter.heroku.com/articles/getting-started-with-python#set-up Getting Started on Heroku with Python | Heroku Dev Center This tutorial will have you deploying a Python app (a simple Django app) in minutes. Hang on for a few more minutes to learn how ..
2020.10.26 -
[파이썬] 파워포인트 / 워드 문서를 PDF 파일로 변환하는 방법 ( ppt to pdf / doc to pdf ) - 자동화
comtypes를사용하면 순수 Python에서 사용자 지정 및 디스패치 기반 COM 인터페이스를 정의, 호출 및 구현할 수 있습니다. Windows, 64 비트 Windows 및 Windows CE에서 작동합니다. ▶ 파워포인트 문서를 PDF 파일로 변환 ( ppt → pdf ) import sys import os import comtypes.client input_folder_path = "문서 읽어들일 폴더" output_folder_path = "PDF 출력 폴더" input_file_paths = os.listdir(input_folder_path) for input_file_name in input_file_paths: if not input_file_name.lower().endswith((..
2020.10.25 -
[파이썬] 유튜브 영상 / 자막 다운로드 - pytube
pytube는 YouTube 비디오를 다운로드하기 위한, 가볍고 종속성이 없는 라이브러리이다. pytube: 2.7 / 3.4 / 3.5 / 3.6 / 3.7 pytube3: 3.6 / 3.7 / 3.8 → pip install pytube3 ▶ 영상 다운로드 from pytube import YouTube url = 'https://www.youtube.com/watch?v=ecF1y2bI2T4' yt = YouTube(url) stream = yt.streams.all()[0] stream.download(output_path='C:/test') # 영상 다운로드 yt.streams.all() 실행 시, 해상도 관련 전체 목록을 볼 수 있으며, yt.streams.all()[0] 은 그중 첫 번째 항..
2020.10.25