[Nouveau billet] Les bibliothèques numériques sont-elles représentatives ?https://scoms.hypotheses.org/799 À partir de l'ensemble des métadonnées de data BNF avant 1900 j'ai tenté d'évaluer la "représentativité" de Gallica au fil du temps à partir de la proportion d'éditions mentionnées dans le Catalogue de la BNF qui ont également été numérisées. https://mastodon.social/media/Dsl3QJ2M6DsdgFZE8kA
Au total, 17,5% des éditions sont également numérisées sur Gallica (ce qui est assez énorme), mais il y a des variations significatives selon les années (de 3% en 1530 à… 31% en 1731). Globalement, le XVIIIe siècle est la période la mieux représentée

@Dorialexander Très intéressant ! 👏

Je garderai ça en mémoire pour toutes les études de learning / analyse textuelle où on analyse l'historique de certains mots ou certaines expressions !