Ich bin ja sonst nicht so der Typ für #Software und Empfehlungen....

Aber das hier ist ein absolutes Muss, wenn Du massenhaft pdf-Dateien nachträglich mit einem Text-Layer versehen willst.

Massenhaft scannen in eine Datei und während der Texterkennung automatisch trennen lassen mit ist nur ein Highlight...

Muss man haben!
Github:
https://github.com/digidigital/OCRthyPDF-Essentials

#ocrthypdf #ocr #ocrmypdf #ubuntu #foss

I just split a double-page pdf scan into singlepages with #muPDF -tool, kicked out some empty pages with #pdfArranger and forced the #OCR with #OcrThyPdf - and although this sounds super complicated, it was not - and I feel like a wizard.

now... i still have to read it.......