#IA Beaucoup de collègues pensent que LA source des #stéréotypes des grands modèles de langues (ou IA génératives) à la #gpt c'est les données d'entrainement... Certes, elles jouent un rôle, mais il y a d'autres sources de biais stéréotypés. L'une d'elles est assez inattendue : l'évaluation.
En gros, on utilise de très gros jeux de données, souvent de type QCM, pour évaluer les modèles (voire les entraîner), qu'on appelle des #benchmarks. Mes étudiant·e·s sont allés regarder ces benchmarks de plus près et iels ont trouvé pas mal de pbs : des biais explicites (ça avait déjà été mentionné par d'autres), mais également des biais implicites et des erreurs factuelles. Si cela vous intéresse, nous avons écrit sur le sujet un papier en français pour la conférence TALN, que vous trouverez ici : https://inria.hal.science/hal-05618509/file/Benchmarks_trad_TALN-VF.pdf
@kfort
Merci, c’est super intéressant ! C’est vrai que je pensais en premier aux biais dans les données d’entrainement, tout en ayant déjà entendu qu’il y avait des biais dans la manière dont sont conçus ces outils / dans leur code, ce qui me semblait un peu trop abstrait voire parfois un peu magique. Merci de rendre ça plus concret et d’avoir documenté cette source de biais énorme :)
@kfort merci, ça tombe à pic pour mon cours sur l'évaluation de modèles de ML aux élèves de première année des Mines vendredi !
@cazencott Tu vas trouver pas mal de choses dans mes publis : https://members.loria.fr/KFort/publications/hal/
Publications on HAL – Karën Fort

@cazencott Nous avons produit des corpus/outils pour l'évaluation des stéréotypes, mais ce n'est pas qqch qui est aujourd'hui pris en compte dans l'éval
@kfort @cazencott
Super ! Je rajoute ça à mon exposé de vendredi à Sciences Po Lyon !