Nouvel effet secondaire pervers du pillage massif du web par les entreprises d'IA (oui parce que je pense que vous n'étiez pas assez en colère déjà). Une de mes collègues en charge du dépôt légal du web à la #BnF nous signale que, face à cette menace, les sites se barricadent de plus en plus. Résultat : les robots de la BnF se retrouvent le bec dans l'eau. Les collectes sont massivement en échec.
1/2

L'effort de préservation du web français, que l'institution mène depuis environ 2010 (avec des collections qui remontent jusqu'en 1996) est en péril.

Seule solution que nos collègues envisagent jusqu'ici : contacter individuellement les producteurs pour leur expliquer la démarche et leur demander de lever les barrières. Autant vous dire que ça ne va pas marcher.

2/2

@BertrandCaron C'est vraiment dramatique et je constate que de plus en plus de site calculent la vitesse avant de nous laisser entrer. Est-ce qu'Internet Archive et son formidable Wayback Machine rencontre les mêmes difficultés ?
@jcbuttier @BertrandCaron Anubis (un des outils utilisés pour se protéger des bot) autorise par défaut Internet Archive pour éviter ce problème
@claudex @jcbuttier @BertrandCaron empêcher les bots d'IA de lire les contenus mais laisser internetarchive lire… les bots n'ont qu'à lire internetarchive pour arriver à leurs fins ! C'est pour ça que je bloque internetarchive également

@TurboTrain @claudex @jcbuttier @BertrandCaron

Et tu contribues au problème de la préservation

@Mr_Mick @claudex @jcbuttier @BertrandCaron entre ça et aider les boites d'IA, le choix est vite fait

@TurboTrain @claudex @jcbuttier @BertrandCaron

Non. Je considère personnellement que la préservation du patrimoine est plus importante que l'ego de ne pas "finir dans une IA"

@Mr_Mick @claudex @jcbuttier @BertrandCaron qui a dit que refuser de participer à l'IA était pour l'ego ? Pas moi en tout cas. Je t'invite à lire https://lareleveetlapeste.fr/1-300-scientifiques-appellent-au-boycott-de-lia-generative/ pour les raisons principales (et il y en a bien d'autres)
1 300 scientifiques appellent au boycott de l'IA générative

Face au déploiement massif de l’IA générative (IAg), des scientifiques appellent à manifester une « objection de conscience ».

La Relève et La Peste

@TurboTrain @claudex @jcbuttier @BertrandCaron

Oui mais tu contribues à rendre la préservation du patrimoine numérique très compliqué. Et ton impact sur la préservation est bien plus grand que ton impact sur l'IA en refusant.

Et ce qui n'a pas pu être archivé aujourd'hui ne pourra plus l'être à l'avenir.

@Mr_Mick @claudex @jcbuttier @BertrandCaron bof ton argument est le même qu'utilisent les borg euh les boites d'IA, les gafam (et on va éviter le point godwin même s'il me démange) « You will be assimilated. Resistance is futile. »

@TurboTrain @claudex @jcbuttier @BertrandCaron

Tu m'inventes des arguments?

Non, mon argument est que les dégâts d'une absence de préservation seront bien plus grands qu'un usage marginal de contenu par une IA. Principalement car l'IA n'est pas inéluctable à la différence de la disparition de contenu non préservé et archivé.

Ce que je critique, c'est le fait que ta résistance (sous cette forme) risque de faire plus de dégâts que de bien.

@TurboTrain @claudex @jcbuttier @BertrandCaron

C'est frustrant sûrement mais les actions qu'on peut faire à titre personnel, à part voter, sont souvent plus négative qu'autre choses. Car si au final, les scrappeurs IA trouvent un moyen, tu n'auras qu'impacter la préservation sans autre effet. Ce serait le plus triste.