Bon #Linux j'ai tout essayé pour faire fonctionner #OCR dans #Recoll ...

En ajoutant les bons paramètres dans Recoll.conf idem dans mimeconf. Rien à faire.

Y'en a qui on déjà essayé de le faire ?

Il semble que pyexiv2 fasse une erreur et même avec une demande pour skip et passer direct à execm rclimg.py ...

@lascapi + #recoll for search in local library and aggregate everything using private instance of #searxng
@WorziArmin Ein Kollege hatte schon mal Tools fürs #Dokumentenmanagement vorgestellt. Aber ich fürchte: Das erfordert noch mehr Disziplin. #OCRmyPDF kann das Problem nicht lösen, das scannt ja nur ein und macht die Texterkennung. Für alle, die keine Lust haben zu sortieren, empfehle ich tatsächlich #Recoll. Festplatte indizieren, dann findet das fast alles. Aber mich würde das Chaos auf der Festplatte irre machen.
Bu arada yeri gelmişken #recoll u yapanlardan Allah razı olsun. Hayat kurtarıcı.

Datei und Volltext-Suche ist ja immer so ein Ding. Unter Windows haben wir für Netzlaufwerke #DocFetcher (https://docfetcher.sourceforge.io/de/) genommen. Aber es hat so Stabilitätsprobleme.

Das #Recoll (https://www.recoll.org) sieht auch interessant aus. Er ist aber noch beim Indizieren lokal gerade.

Bisher hatte ich #FSearch als #Everything-Alternative unter Linux. Aber Volltext-Index ist natürlich auch nett

Jetzt seh ich gerade auch noch #SearchMonkey (https://sourceforge.net/projects/searchmonkey/)...

DocFetcher – Schnelle Dokument-Suche

Homepage von DocFetcher, eine Desktop-Suchmaschine

December 9 #FreeSoftwareAdvent

Recoll: Full-text search for your local files

#recoll is a local file indexing and search powertool. It provides plenty of options for configuration (e.g., includes, excludes, filters, update and rebuild index) and a nice snappy interface.

My local file arrangement is reasonably organized, but I often find myself needing to search for something based on content.

In their words: "Recoll will index an MS-Word document stored as an attachment to an e-mail message inside a Thunderbird folder archived in a Zip file (and more…​). It will also help you search for it with a friendly and powerful interface, and let you open a copy of a PDF at the right page with two clicks. There is little that will remain hidden on your disk."

https://www.recoll.org

Recoll

Recoll is a desktop document search application for Unix, Linux, Microsoft Windows and MacOS, based on the Xapian search engine library.

🗂️ My computer stores everything I work with: drafts, notes, datasets, scripts, models, simulations results, old archives — and, of course, a ridiculous amount of literature. 😅

Recently I discovered something that felt like unlocking a hidden level: local full-text search.

I’d used basic search tools before, but then I tried Recoll — an open-source search engine for UNIX-like systems — and it completely changed how I navigate my research files.

It honestly feels like I found a new kind of “computer game,” and I’ll probably keep playing with it for months. 🤣

#ResearchWorkflow #IndependentResearch #DataManagement #OpenSource #KnowledgeOrganization #UNIX #DigitalResearch #ResearchTools #Recoll #KnowledgeManagement #Linux #FOSS

@Martin Seeger Ah, Benamung ist echt ein Thema. Und dann auch wieder nicht. Mein Benamungsschema für Dateien ist Datum-Typ-Ersteller.

Ich benutze allerdings kein #paperless sondern mache das händisch mit #ocrmypdf. Die Dateien sortiere ich in eine Verzeichnisstruktur. Und dank OCR findet bei mir #Recoll dann alles wieder. @Bastian
The Hubzilla @ tschlotfeldt.de

Die Tool-Chain hat nun Zuwachs bekommen:

#Recoll mit den Paketen #untex und #pdftotext sorgt nun dafür, dass in allen Dokumenten effizient gesucht werden kann.