Le saviez-vous ? Actuellement toutes les grandes plateformes qui proposent des textes en accès ouvert sont gravement compromises par du spam très agressif.
Gallica, OpenEdition, EMAN etc.
C'est une catastrophe silencieuse.
Et évidemment ces infrastructures ne sont pas faites pour supporter des centaines de requêtes/seconde.
Et évidemment ça ne va pas s'arranger.

Edit grâce à @quota_atypique
1) le dernier rapport de l'Arcep https://www.arcep.fr/uploads/tx_gspublication/rapport-IA-generative-defis-internet-ouvert-janvier2026.pdf
2) le rapport du GLAM
https://www.glamelab.org/products/are-ai-bots-knocking-cultural-heritage-offline/

Tous les agents de l'ESR on doit savoir qu'on a actuellement des collègues qui bossent le week end, qui bossent la nuit pour que tout ce qui est déployé sur OpenEdition ou Huma-num fonctionne.
Parce que des connards quelque part ont décidé que tout ce qui est en ligne est à eux.
C'est un peu comme si on avait créé un très beau jardin public plein de fleurs et que des centaines de personne débarquaient d'un coup pour absolument toutes les arracher et les revendre à des fleuristes.
Je suis même plus en colère en fait.
C'est au delà.
Je vois le temps et l'énergie dépensés sans compter pour offrir un service de qualité aux collègues et je vois l'environnement dans lequel ces services sont construits de plus en plus hostile à la notion même de service.
Bref profitez de pouvoir encore pour le moment vous promener sur Gallica ou sur les sites publics équivalents.
Je ne sais pas combien de temps ça va tenir si rien de politique n'est fait.
Un truc qu'il faut bien comprendre c'est qu'aucun contenu web n'est à l'abri.
La situation aujourd'hui c'est que tout ce que vous mettez en ligne en accès ouvert va être absorbé et digéré en permanence par des bots soit pour être vendu à des entreprises soit pour entraîner des modèles.
Tous vos précieux contenus personnels sont devenus du MINERAI.
De l'herbe pour les vaches artificielles.
Donc l'accessibilité de ces contenus pour de vrais humains qui veulent juste les lire c'est SECONDAIRE.

Prenons une autre image : vous ne pouvz pas entrer dans la bibliothèque parce que des vandales y sont, qui brûlent les pages des livres pour se chauffer (edit : non parce qu'à la limite ça serait une raison. ils les brûlent juste pour se cuire des saucisses ? imaginez ce que vous voulez) et qui vous empêchent d'entrer.
C'est cool hein ?

C'est à ce prix que vous fabriquez des chats avec des écailles de poisson.

Bon le rapport du GLAM est cauchemardesque en fait (mais très clair, merci à elleux).
"For both technical and legal reasons, bots tend to be optimized to collect data from publicly available websites. As a result, moving collections behind login screens can significantly reduce the amount of bot traffic they receive."

quand je disais que l'internet ouvert est mort, voilà voilà

ça va être très rigolo quand il va falloir expliquer aux tutelles qu'après avoir bataillé pendant des années pour que les institutions renoncent aux login parce que l'open data, on va devoir les réinstaller en catastrophe pour pas que les sites tombent 😭
le rapport de l'arcep est très très intéressant (<3 @quota_atypique ) mais alors c'est pas bon pour le moral non plus parce que j'ai l'impression que 0 intention politique européenne actuellement d'aller dans le sens des préconisations du dit rapport.
@quota_atypique on est en train de re-brûler la bibliothèque d'Alexandrie c'est merveilleux