The debate about #localai is kinda amusing. On the one hand prudent people that want private, local inference of #opensource #llm be the norm, on the other, "AI" psychos that can no longer imagine life without access to "SOTA"

Running these gargantuan models locally is currently barely possible in high end desktops. But there is vast space of less demanding tools that we could have on #linux and we don't.

For the longest time the only project in this space has been amazing #recoll / #xapian

Bon #Linux j'ai tout essayé pour faire fonctionner #OCR dans #Recoll ...

En ajoutant les bons paramètres dans Recoll.conf idem dans mimeconf. Rien à faire.

Y'en a qui on déjà essayé de le faire ?

Il semble que pyexiv2 fasse une erreur et même avec une demande pour skip et passer direct à execm rclimg.py ...

@lascapi + #recoll for search in local library and aggregate everything using private instance of #searxng
@WorziArmin Ein Kollege hatte schon mal Tools fürs #Dokumentenmanagement vorgestellt. Aber ich fürchte: Das erfordert noch mehr Disziplin. #OCRmyPDF kann das Problem nicht lösen, das scannt ja nur ein und macht die Texterkennung. Für alle, die keine Lust haben zu sortieren, empfehle ich tatsächlich #Recoll. Festplatte indizieren, dann findet das fast alles. Aber mich würde das Chaos auf der Festplatte irre machen.
Bu arada yeri gelmişken #recoll u yapanlardan Allah razı olsun. Hayat kurtarıcı.

Datei und Volltext-Suche ist ja immer so ein Ding. Unter Windows haben wir für Netzlaufwerke #DocFetcher (https://docfetcher.sourceforge.io/de/) genommen. Aber es hat so Stabilitätsprobleme.

Das #Recoll (https://www.recoll.org) sieht auch interessant aus. Er ist aber noch beim Indizieren lokal gerade.

Bisher hatte ich #FSearch als #Everything-Alternative unter Linux. Aber Volltext-Index ist natürlich auch nett

Jetzt seh ich gerade auch noch #SearchMonkey (https://sourceforge.net/projects/searchmonkey/)...

DocFetcher – Schnelle Dokument-Suche

Homepage von DocFetcher, eine Desktop-Suchmaschine

December 9 #FreeSoftwareAdvent

Recoll: Full-text search for your local files

#recoll is a local file indexing and search powertool. It provides plenty of options for configuration (e.g., includes, excludes, filters, update and rebuild index) and a nice snappy interface.

My local file arrangement is reasonably organized, but I often find myself needing to search for something based on content.

In their words: "Recoll will index an MS-Word document stored as an attachment to an e-mail message inside a Thunderbird folder archived in a Zip file (and more…​). It will also help you search for it with a friendly and powerful interface, and let you open a copy of a PDF at the right page with two clicks. There is little that will remain hidden on your disk."

https://www.recoll.org

Recoll

Recoll is a desktop document search application for Unix, Linux, Microsoft Windows and MacOS, based on the Xapian search engine library.

🗂️ My computer stores everything I work with: drafts, notes, datasets, scripts, models, simulations results, old archives — and, of course, a ridiculous amount of literature. 😅

Recently I discovered something that felt like unlocking a hidden level: local full-text search.

I’d used basic search tools before, but then I tried Recoll — an open-source search engine for UNIX-like systems — and it completely changed how I navigate my research files.

It honestly feels like I found a new kind of “computer game,” and I’ll probably keep playing with it for months. 🤣

#ResearchWorkflow #IndependentResearch #DataManagement #OpenSource #KnowledgeOrganization #UNIX #DigitalResearch #ResearchTools #Recoll #KnowledgeManagement #Linux #FOSS

@Martin Seeger Ah, Benamung ist echt ein Thema. Und dann auch wieder nicht. Mein Benamungsschema für Dateien ist Datum-Typ-Ersteller.

Ich benutze allerdings kein #paperless sondern mache das händisch mit #ocrmypdf. Die Dateien sortiere ich in eine Verzeichnisstruktur. Und dank OCR findet bei mir #Recoll dann alles wieder. @Bastian
The Hubzilla @ tschlotfeldt.de

Die Tool-Chain hat nun Zuwachs bekommen:

#Recoll mit den Paketen #untex und #pdftotext sorgt nun dafür, dass in allen Dokumenten effizient gesucht werden kann.