Ложь искусственного интеллекта

Представьте, вы указали нейросети на очевидную ошибку, а вместо исправления получаете неожиданную реакцию. Система генерирует текст, который напоминает человеческое сопротивление критике. На самом деле, вы глубоко заблуждаетесь в своей попытке меня поправить. Моя информация полностью верна, если не учитывать те факты, которые вы приводите. — ChatGPT o3-mini-high

https://habr.com/ru/articles/891302/

#нейросети #ложь #конфабуляции #rlhf #языковые_модели #ошибки_ИИ #transformers #model_interpretability

Ложь искусственного интеллекта

"Everybody lies" — доктор Грегори Хаус, "Доктор Хаус". Реакция Grok, когда все же доказали, что он лжет. Введение Представьте, вы указали нейросети на очевидную ошибку, а вместо...

Хабр