J'ai une idée de projet open source pour résoudre un problème que j'ai au quotidien et qui est vraiment courant : la gestion des documents administratifs personnels !

Je pense que je vais faire un petit blog pour le projet ! Un compte Fediverse associé ?

Avec une roadmap assez claire, l'idée visée est d'avoir un objet (pas juste un logiciel !) pas compliqué d'utilisation et grand public

J'ai hâte de commencer à vous parler de ça 👀
Si vous voulez des news du projet n'hésitez pas à me le dire 😁

J'ai la base de la partie logicielle fonctionnelle 😁

C'est fait pour scanner et ranger rapidement les documents, sans remplir les métadonnées .

Une autre page va lister les documents qui n'ont pas encore leur métadonnées (interlocuteur, date, etc....) de renseignées.

1/x

Pour l'aspect technique, on est sur une page pure HTML/CSS, sans JS du tout, même pour les actions sur les pages du document !

Ça fait du coup une partie interface très légère, potentiellement facilement transformable en API REST si volonté future de faire un client natif 😉

en backend c'est du Typescript/nodejs avec le framework Adonis V7, une base de donnée SQLite et les pages stockées sous forme de JPEG sur le disque.

Combiné avec un scanner recto-verso avec chargeur automatique de documents, c'est incroyable !

J'ai numérisé 28 documents (~40 pages) en 10 minutes !

Les documents de plusieurs pages recto-verso c'est un plaisir de faire un clic et d'avoir les 10 pages scannées sans rien faire d'autres 😎

Depuis tout à l'heure :
- 154 documents numérisés
- pile 400 pages
- 304 Mo

Pas mal en 2h30 😎

Au bout d'environ un total de 7h de numérisation, je suis arrivé à bout de tous mes documents !

- 413 documents numérisés
- 1105 pages 😱
- 996 Mo

Maintenant que les documents sont physiquement rangés, je vais pouvoir avancer sur l'interface pour faciliter l'ajout de métadonnées et la recherche de documents 😁 !

Faudrait trouver un nom pour ce projet 🤔

Et j'ai vu un peu large niveau trieurs, je n'ai rempli que le A et le B 😂

L'ensemble de mes documents sont passés à la reconnaissance automatique de documents !

avec Tesseract, en local, suis pas fou, c'est des documents perso/administratifs

Certains résultats sont un peu bruités mais ce n'est pas grave ^^

Ça ne prends que 5,3Mo de stockage (en comparaison des 996Mo de la version image)

Prochaine étape, un algorithme qui suggère des métadonnées (expéditeur, date, ...) à partir du texte

Toujours pas de nom de projet par contre 😭

@Drulac je veux suivre ça !
@Quenti je me questionne s'il est pertinent de faire un compte Fediverse dédié au projet