Bonjour le fédiverse 👋
Je découvre Mastodon. Je viens de lancer 577deputes.fr : un explorateur de la 17e législature de l'Assemblée nationale à partir des dumps open data officiels : 577 députés, ~17 000 questions, ~108 000 amendements, ~6 500 scrutins, ~2 700 textes.
Un truc dont je suis content : la détection des amendements quasi-identiques (MinHash). Sur la 17e, ~26% des amendements déposés sont des quasi-doublons, dont une centaine de clusters de « dépôt en masse » (≥15 versions identiques).
Données 100% officielles, méthodo documentée, code source ouvert. Retours bienvenus.
