Mit NAPS2 lassen sich unter Linux sehr bequem analoge Dokumente direkt vom Scanner samt OCR Texterkennung als PDF erstellen.

In Kombination mit einem Tool wie Recoll kann man so alle Dokumente digital lokal verwalten und hat sämtliche Metadaten direkt in den Dateien, nicht in der DB eines komplexen Dokumentenmanagementsystems.

Vorteil: Kleiner Footprint, keinerlei Server, auch kein lokaler Server notwendig, kein Docker, kein Podman, keine Linux Shell im Einsatz.
Das Backup und Langzeitsicherung der digitalisierten Dokumente ist damit so simpel gehalten wie möglich und gleichzeitig durch das PDF Format mit eingebetteter, unsichtbarer Textebene auch maximal kompatibel mit allen Betriebssystemen.

https://www.naps2.com/
https://www.recoll.org/index.html  (nur notwendig, wenn euer System nicht bereits eine gute textindizierende Suche mitliefert)

#ocr #paperless #scanner #dokumentenmanagement

NAPS2 - Scan documents to PDF and more

NAPS2 is free scanner software made easy. Scan to PDF, edit your documents, and use advanced features like OCR. Available on Windows, Mac, and Linux.

@st3fan gscan2pdf ist ähnlich einfach.
https://gscan2pdf.sourceforge.net/

Bietet aus meiner Sicht noch 2 Vorteile, welche ich auf die Schnelle bei NAPS2 nicht gesehen habe:
- das OCR-Ergebnis kann überprüft und bei Bedarf korrigiert werden
- liegen Dokumente als Bilddatei vor, so können diese in gscan2pdf geöffnet, mit OCR bearbeitet und als PDF inkl. erkanntem Text gespeichert werden.

@db_geek Danke - ja, das habe ich selbst lange Jahr genutzt. Konnte es jetzt aber mit Linux Mint auf die Schnelle nicht zum Laufen bekommen (Grobe Lösung dazu: Privates PPA nutzen: https://launchpad.net/~jeffreyratcliffe/+archive/ubuntu/ppa )

Bin dann auf NAPS2 gestoßen und fand es einfacher im Handling. Die OCR Ergebnisse sind mittlerweile so gut, so lange das Ausgangsmaterial ok ist, dass ich da nicht mehr Hand anlege oder nachprüfe.

PPA for Jeffrey Ratcliffe : Jeffrey Ratcliffe

gscan2pdf packages and dependencies

Launchpad

@st3fan

Bei Manjaro Linux hatte ich bislang noch keine Probleme mit dem gscan2pdf-Paket, welches von Arch Linux kommt.

Aber ja, Perl kann mitunter auch etwas zickig sein.
Kenne ich auch noch aus meiner Gentoo-Zeit, wenn auf eine neue Major-Version von Perl gewechselt wurde.
Dann mussten sämtliche abhängigen Pakete neu kompiliert werden.