Extracting embedded images from a PDF

Surprisingly, the best way (that I’ve found) to do this is to use The Unarchiver, a free app from MacPaw (the folks behind SetApp and many other things). It seems to faithfully extract the images as-is, including ICC profiles (which might technically be separate from the image within the PDF, but nonetheless are crucial to the image being extracted correctly).

The primary reason to extract […]

https://wadetregaskis.com/extracting-embedded-images-from-a-pdf/
Extracting embedded images from a PDF – Wade Tregaskis

Morphik – Open-source RAG that understands PDF images, runs locally

https://github.com/morphik-org/morphik-core

#HackerNews #Morphik #OpenSource #RAG #PDFImages #LocalRun

GitHub - morphik-org/morphik-core: Open source multi-modal RAG for building AI apps over private knowledge.

Open source multi-modal RAG for building AI apps over private knowledge. - GitHub - morphik-org/morphik-core: Open source multi-modal RAG for building AI apps over private knowledge.

GitHub

PDF-Images: Bilder aus PDFs exportieren

Wieso kannte ich das bisher noch nicht? Warum mußte ich erst diesen Beitrag aus meinem Feedreader fischen? Das freie, kleine Programm PDF-Images von Sven Thoennissen ist uralt und wurde 2015 das letzte Mal aktualisiert, aber es läuft auch heute noch problemlos selbst auf aktuellen Macs mit macOS Big Sur. Es bietet ein schlichtes Drag-and-Drop-Fenster, auf das Ihr Eure PDF-Datei schieben könnt. http://blog.schockwellenreiter.de/2021/02/2021022001.html #PDFImages #MacOnly

PDF-Images: Bilder aus PDFs exportieren – Schockwellenreiter