"Je peux aussi lier cette étude intéressante qui a demandé à divers LLM de prouver des résultats subtilement faux, et qui a noté combien ils prétendaient y arriver : c'est assez mauvais (le meilleur modèle accepte encore de « prouver » des choses fausses dans 61% des cas)."
http://www.madore.org/~david/weblog/d.2026-05-22.2853.ai-and-math.html#d.2026-05-22.2853