C'est quand même fou qu'avec des machines fondamentalement déterministes (les ordinateurs) ont ait TOUT FAIT pour améliorer le déterministe de ces systèmes (en travaillant sur la fiabilité : builds reproductibles, TDD, vérification d'intégrité, environnements conteneurisés...)...

... et que l'IA arrive comme un chien dans un jeu de quilles, foutant tout en l'air à ne pas répondre deux fois la même chose à la même question.

Comment, en tant qu'informaticien, on peut seulement SOUHAITER ça ?

@sebsauvage Ben tu joues bien à des roguelike, toi 
@sebsauvage @AugierLe42e Si tu commence à mélanger loisirs et travail aussi...
@xalofar Je te rappelle que moi je vis avec un TDAH. Mélanger les trucs c'est un fonctionnement par défaut chez moi 👀
@sebsauvage

@sebsauvage En réalité les LLM sont déterministes.

À prompt, modèle, paramètres et seed identiques, ils produisent exactement la même sortie.
Ce qui donne l’impression d’aléatoire vient du sampling probabiliste (temperature, top-p), qui est volontaire pour générer des réponses variées.

Autrement dit, ce n’est pas l’IA qui casse le déterminisme : c’est un choix d’usage. On peut parfaitement rendre la chose entièrement reproductible.

@YanK
ÀMHA, si on enlève la part d'aléatoire, ça aura moins de succès, car :
- ça donnera moins l'impression d'être humainish ;
- y aura pas le côté «machine à sous, je re-prompt jusqu'à ce qu'enfin j'ai trouvé la solution et jackpot ! ».
@sebsauvage

@nicoco C'est ce que j'allais dire.

@YanK Déjà, ces options ne sont pas accessibles aux utilisateurs, faut avoir le LLM en local pour pouvoir les bidouiller. Et puis les modèles commerciaux sont bidouillés de semaine en semaine. Le Grok/ChatGPT 5/etc. d'aujourd'hui ne sont pas les modèles d'il y a un mois, six mois, un an...

@sebsauvage

@YanK @sebsauvage Oui, mais quand tu utilises Claude en tant que dev, c'est pas ce paramétrage que tu utilises…
@sebsauvage le pire c'est de voir des collègues dev l'utiliser joyeusement pour produire du code en quantité sans se poser de question j'ai vraiment du mal a comprendre 🫠
@maddyneko une grande partie du dev, pour certain·es (et je juge pas, c'est ce qu'on leur demande), c'est copier-coller des solutions toutes faites et documentées à des petits problèmes et les assembler pour en résoudre des plus gros. Il y a potentiellement une valeur à comprendre le problème et le structurer, mais la partie "code" n'est pas toujours de la recherche en R&D non plus, hein…

@borisschapira @maddyneko Je peux m'inclure dedans pas mal de fois ! Et je ne vois effectivement pas ça comme déshonorant. :) Je ne révolutionnerai pas le monde de l'informatique, mais mes petites connaissances au service de petits besoins ca peut rendre service, et c'est bien comme ça.

Par contre ce qui est fait et proposé est compris (je crois :p )

Et d'ailleurs s'il s'agit de répondre à un besoin "simple" par combinaisons de solutions existantes, je dirais que si on sait faire avec des outils éprouvés et moins impactants alors qu'elle est la pertinence d'utiliser un outil plus coûteux et moins éprouvé comme un LLM ?!

@sebsauvage ce qui est impressionnant, c'est la création de réponses qui semblent plausibles en permanence plutot que dire je sais pas. Mais le LLM est poli, il s'excuse et te donne toujours une autre version .....tant que l'utilisateur garde assez de sens critique pour lui dire c'est pas bon....
@sebsauvage j'ai l'impression que les LLM sont comme des tours de magie. C'est l'illusion qui prime, l'effet wouahou. Il faut donner l'impression de. La part de réalité est plus ou moins variable
@sebsauvage Bah faut croire que nos métiers sont pas assez complexes comme ca et qu'on avait besoin d'une dose de hasard en plus 🤷

@sebsauvage Je me faisais la reflexion ce matin en faisant le ménage.

Ok ca produit du code, ou autre, au kilomètre. Bon déjà à quel coût, et ensuite quand on sait ce qui le rend possible ... mais quelle solution de bourrins. Zéro élégance, zéro intelligence dans la mise en oeuvre.

@sebsauvage un intérêt possible que je vois dans ces outils est qu'ils pondèrent des possibilités linguistiques (pour les llms). Malheureusement la plupart des usages n'offrent aucune visibilité là dessus ni aucun contrôle sur la génération, qui est en effet aléatoire
@sebsauvage le problème c'est qu'on veut en faire des agents autonomes plutôt que de véritables modèles qui permettent d'explorer des structures linguistiques (je veux dire si on fait abstraction de tous les problèmes éthiques associés à leur construction bien sûr)

@sebsauvage
C'est simple : on ne souhaite pas ça.

Je me suis "amusé" à effectuer des tests avec cette crasse de chatgpt sur des éléments que je connais. Résultat : à minima 75% de réponses totalement foireuses et semi-aléatoires.

Et encore, ces 75%, c'est gentil hein.

@sebsauvage Je ne sais pas trop ce que tu veux dire. Pour les tâches rédactionnelles, on inventait déjà depuis un moment des outils de réécriture comportant une part d'aléatoire. Je me rappelle de projets de reformulation de contenus AFP, d'usines à site pour le netlinking SEO et de fonctionnalités de chat de support en langage naturel bien avant les LLMs. Si ça se démocratise aussi vite, c'est bien qu'il y avait un terreau fertile pour que ça pousse.
@sebsauvage et paradoxalement, à partir d’un système déterministe, les informaticiens ont toujours voulu trouver une façon de générer de l’aléatoire 🤭 Peut-être y a-t-il moyen d’exploiter les LLM pour fabriquer du hasard ?🤔

@sebsauvage

J'avoue que ce qui m'interroge le plus c'est de voir une grande partie de la communauté informatique aller à fond dedans (en tout cas c'est une impression, je suis pas dedans professionnellement).

Ça c'est vraiment un phénomène que je ne comprends pas...

C'est conscient ? inconscient ? avec quelle part d'aveuglement volontaire ?

Ça me dépite un peu beaucoup. Comment lutter sans cette communauté avec nous ?

@raphm @sebsauvage je constate que ce (mon) secteur a été volontairement affaibli petit à petit pour en arriver là. Généralisation de la formation express, mépris pour ces "divas" du code qui coûtent cher, micro-management, no code, frameworks de trop haut niveau, React et compagnie...
On est mûrs, il ne reste plus qu'à nous cueillir 😑
C'est l'industrie qui met au pas !

@tmaz @sebsauvage

ouais en fait comme n'importe quel autre secteur quoi 😢

@sebsauvage étrangement, même en logique booléenne pure, un ordinateur n'est pas toujours déterministe. Un petit rayon cosmique et pof ! un 0 devient un 1 !
@sebsauvage Parce que l'iagen n'est pas un outil de l'informatique, juste un autre outil bourgeois pour contrôler les foules et monter les gens les uns contre les autres...

@sebsauvage

Parce qu'il y a beaucoup de dev qui ne faisait Ue copier coller du code "qui marche" d'un point A à un point B sans vérifier que le contexte est le bon.

Et l'industrie du dev a tellement habitué les utilisateurs à ce que ça casse souvent lors des mise en prod que ça yolo dans tout les sens.

@sebsauvage Un aveu d'échec comme un autre.