PDFをLLMで解析する前処理のパーサーは何が良いのか?(pdfminer, PyMuPDF, pypdf, Unstructured)
https://qiita.com/cyberBOSE/items/142cdf91e0ee20b3114f?utm_campaign=popular_items&utm_medium=feed&utm_source=popular_items

#qiita #Python #pdfminer #PyMuPDF #pyPDF #Unstructured

PDFをLLMで解析する前処理のパーサーは何が良いのか?(pdfminer, PyMuPDF, pypdf, Unstructured) - Qiita

現状の LLM は PDF ファイルを直接処理出来ない為、予めなんらかのプレーンテキスト形式に変換する必要があります。(PDFを読める各チャットアプリも内部的には何らかの手段でプレーンテキスト形式…

Qiita