50 Followers
90 Following
239 Posts
FreeBSD - Chaostreff Ludwigsbu|r|g - Go - ITSec - Digital Preservation - Krav Maga - Comics - Voynich

The German Literature Archive Marbach (DLA Marbach) recently ran a large-scale job with the forensic indexer FileTrove, the open-source tool I’m developing. In a single run, they processed around 4 million files in just over four hours, including metadata extraction and checks against the NSRL.

Thanks to the team (@lignum, @harvey) in Marbach for testing FileTrove on such a large dataset and sharing the results. 4 million files in ~4 hours is pretty fast.

GitHub: https://github.com/steffenfritz/FileTrove

Skandal! Ob die mich verarschen wollen, hab ich gefragt!
Wundert mich jetzt nicht, Bild... #bild
No excuse: no left, no center, no right, no islamic, no christian antisemitism. Simple as that. #paris
Frage mich bei dem Tagesschau-Bild-Text-Bug manchmal, ob wirklich Bug oder doch eher Feature?! #scholz #lindner #trump
Verbote abstellen verboten! #ludwigsburg #germanthings
Mood
lol
Und das Text-Bild-Problem bei der @tagesschau liefert mal wieder: Die Ukraine erhält jetzt die Waffengattung "Deutscher Bauer"
Ludwigsburg vor 27 Jahren