Mastodawn

"Je peux aussi lier cette étude intéressante qui a demandé à divers LLM de prouver des résultats subtilement faux, et qui a noté combien ils prétendaient y arriver : c'est assez mauvais (le meilleur modèle accepte encore de « prouver » des choses fausses dans 61% des cas)."
http://www.madore.org/~david/weblog/d.2026-05-22.2853.ai-and-math.html#d.2026-05-22.2853

https://matharena.ai/brokenarxiv/

David Madore's WebLog: Les LLM vont-ils tuer les mathématiques ?

David Alexander Madore's WebLog / Diary