Mastodawn

#IA Beaucoup de collègues pensent que LA source des #stéréotypes des grands modèles de langues (ou IA génératives) à la #gpt c'est les données d'entrainement... Certes, elles jouent un rôle, mais il y a d'autres sources de biais stéréotypés. L'une d'elles est assez inattendue : l'évaluation.
En gros, on utilise de très gros jeux de données, souvent de type QCM, pour évaluer les modèles (voire les entraîner), qu'on appelle des #benchmarks. Mes étudiant·e·s sont allés regarder ces benchmarks de plus près et iels ont trouvé pas mal de pbs : des biais explicites (ça avait déjà été mentionné par d'autres), mais également des biais implicites et des erreurs factuelles. Si cela vous intéresse, nous avons écrit sur le sujet un papier en français pour la conférence TALN, que vous trouverez ici : https://inria.hal.science/hal-05618509/file/Benchmarks_trad_TALN-VF.pdf

Show thread

Guillaume Collain 6d ago

@kfort
Merci, c’est super intéressant ! C’est vrai que je pensais en premier aux biais dans les données d’entrainement, tout en ayant déjà entendu qu’il y avait des biais dans la manière dont sont conçus ces outils / dans leur code, ce qui me semblait un peu trop abstrait voire parfois un peu magique. Merci de rendre ça plus concret et d’avoir documenté cette source de biais énorme :)

Show thread

Chloé Azencott 6d ago

@kfort merci, ça tombe à pic pour mon cours sur l'évaluation de modèles de ML aux élèves de première année des Mines vendredi !

Show thread

Kaa

🧶6d ago

@cazencott Tu vas trouver pas mal de choses dans mes publis : https://members.loria.fr/KFort/publications/hal/

Publications on HAL – Karën Fort

Show thread

Kaa

🧶6d ago

@cazencott Nous avons produit des corpus/outils pour l'évaluation des stéréotypes, mais ce n'est pas qqch qui est aujourd'hui pris en compte dans l'éval

Show thread

Florence Maraninchi 6d ago

@kfort @cazencott
Super ! Je rajoute ça à mon exposé de vendredi à Sciences Po Lyon !