
Viele PDFs haben zuwenig Metadaten, könnten mehr gebrauchen. Jedoch gibt es auch das Gegenteil, wenn sie zuviel haben und man sie gern putzen möchte, damit sie nicht unwillkürlich zuviel verraten. Wie zum Beispiel beim Journalismus und hier insbesondere für den Quellenschutz. Die 58. Ausgabe des Online-Recherche Newsletters stellt mehrere Tools vor, um das zu erledigen. … „PDFs putzen“ weiterlesen

The fastest PDF library for Python and Rust. Text extraction, image extraction, markdown conversion, PDF creation & editing. 0.8ms mean, 5× faster than industry leaders, 100% pass rate on 3,830...
boss: we want to train a ServiceBot on our #documentation
me: here you go <gives #PDFs>
boss: ServiceBot says these PDFs are too big
me: isn't parsing vast amounts of #data to answer questions and distill salient takeaways supposed to be a key feature of these #LLM bots?
boss:
me: ;)
boss: >:(
me: =D
Veil – Dark mode PDFs without destroying images, runs in the browser