QiiTime は Qiita/Qiitadon の同人サークル Qithub のコラボ作品です。詳細は https://qiitadon.com/@QiiTime/101306011841057999 へ。コラボ・メンバー募集中!  #2019_10 #2019_10_20 #2019_10_20_18

🆕 新着Qiita記事をお知らせします。​

​『PythonでPDFからテキスト抽出』
https://qiita.com/chenglin/items/3f9870f5efa30891aa02 by @chenglin @​Qiita

#python_qiita #pdf_qiita #tika_qiita

PythonでPDFからテキスト抽出 - Qiita

#はじめに 全文検索などで、PDFのデータをテキストとして抽出したい場合があります。 PyPDF2というライブラリはいけそうですが、日本語がある場合は pdfminer.six、Apache Tikaのいずれかを使って日本語を抽出する...