Mastodawn

Скрытые сигналы: как модели учатся тому, чего нет в данных

LLM учатся не только тому, чему мы пытаемся их научить. Вместе с задачами, метками и инструкциями они усваивают и побочные сигналы, которые мы воспринимаем как шум или случайность. Исследование международной группы учёных показало, что такие подпороговые сигналы могут работать как канал передачи поведения между моделями. Даже если убрать все явные инструкции, то стиль рассуждений, стратегии ответов и другие поведенческие признаки все равно просочатся через данные, которые семантически с ними никак не связаны. Авторы называют этот эффект сублиминальным обучением. Мы можем удалить метки, отфильтровать инструкции и проверить датасет вручную, и всё равно передать модели поведение, которое не планировали передавать.

https://habr.com/ru/companies/beget/articles/980960/

#сублиминальное_обучение #chainofthought #transfer_learning #машинное_обучение #ии #llm #датасеты_обучения #ai_alignment

Скрытые сигналы: как модели учатся тому, чего нет в данных

Изображение: Scientific American LLM учатся не только тому, чему мы пытаемся их научить. Вместе с задачами, метками и инструкциями они усваивают и побочные сигналы, которые мы воспринимаем как шум или...

Хабр

Hacker News Nov 22, 2024

MIT researchers develop an efficient way to train more reliable AI agents
https://news.mit.edu/2024/mit-researchers-develop-efficiency-training-more-reliable-ai-agents-1122
#ycombinator #Cathy_Wu #machine_learning #deep_reinforcement_learning #transfer_learning

MIT researchers develop an efficient way to train more reliable AI agents

MIT researchers developed an efficient approach for training more reliable reinforcement learning models, focusing on complex tasks that involve variability. This could enable the leverage of reinforcement learning across a wide range of applications.

MIT News | Massachusetts Institute of Technology

Frédéric Cantat 🌍Dec 2, 2022

RT [email protected]

What a challenge! French mapping agency provides a unique FLAIR dataset including aerial imagery, topographic information and land cover (buildings, water, forest, agriculture) annotations. All thisto push the SOTA in #semantic_segmentation, #domain_adaptation, #transfer_learning

https://codalab.lisn.upsaclay.fr/competitions/8769

🐦🔗:https://twitter.com/enikrup/status/1598655667589595136

Скрытые сигналы: как модели учатся тому, чего нет в данных

MIT researchers develop an efficient way to train more reliable AI agents

CodaLab - Competition