Le saviez-vous ? Actuellement toutes les grandes plateformes qui proposent des textes en accès ouvert sont gravement compromises par du spam très agressif.
Gallica, OpenEdition, EMAN etc.
C'est une catastrophe silencieuse.
Et évidemment ces infrastructures ne sont pas faites pour supporter des centaines de requêtes/seconde.
Et évidemment ça ne va pas s'arranger.

Edit grâce à @quota_atypique
1) le dernier rapport de l'Arcep https://www.arcep.fr/uploads/tx_gspublication/rapport-IA-generative-defis-internet-ouvert-janvier2026.pdf
2) le rapport du GLAM
https://www.glamelab.org/products/are-ai-bots-knocking-cultural-heritage-offline/

@juliegiovacchini et tout ces sites ont des système de téléchargement en masse en plus, non ? Ils sont pas obligés de passer par le site comme tout le monde ?
@just_chill de ce que je sais, c'est ecore pire quand il y a une API. Par exemple pour Gallica c'est tragique, ils luttent pour ne pas tomber.
@juliegiovacchini @just_chill on dirait que le concept d'externalité négative n'est pas tout à fait maitrisé par les soutiens des progrès de l'IAGen. (Par ses opposants, et par ces promoteurs directs, bien plus.)