Общество мыслей: совещание внутри LLM

DeepSeek-R1, QwQ-32B и OpenAI o1 показывают результаты, которые невозможно объяснить просто "более длинными рассуждениями". Исследователи из Google Research и University of Chicago обнаружили нечто неожиданное: внутри reasoning-моделей происходит не монолог, а настоящее совещание — симуляция многоперспективного диалога с конфликтами, дебатами и примирением. В статье разбираем: • Почему Chain-of-Thought недостаточен для сложных задач • Что такое Society of Thought и как модели воспроизводят коллективный интеллект • Четыре ключевых паттерна conversational dynamics (вопросы, смена перспектив, конфликт, примирение) • 12 социо-эмоциональных ролей по Bales' IPA, которые возникают в рассуждениях моделей • Diversity (разнообразие) перспектив и почему разнообразие точек зрения критично для accuracy (точности) • Результаты экспериментов: activation steering, RL-обучение и transfer effects Основной вывод: reasoning-модели спонтанно научились имитировать то, что философы и психологи описывали как природу мышления — внутренний диалог между разными голосами. И это работает лучше, чем линейное рассуждение.

https://habr.com/ru/articles/987758/

#LLM #reasoning #ChainofThought #DeepSeekR1 #QwQ32B #OpenAI_o1 #искусственный_интеллект #машинное_обучение #Society_of_Thought

Общество мыслей: совещание внутри LLM

Общество мыслей: совещание внутри LLM Вы наверняка слышали про Chain-of-Thought. "Пусть модель думает вслух, и она станет умнее" — звучит логично, правда? Добавляем "Let's think step by step" в...

Хабр

AI quest for human-level intelligence: OpenAI o3 electrifies researchers
https://www.nature.com/articles/d41586-025-00110-6

* record-breaking performance on science/math wows researchers
* OpenAI chatbot model o3 made headlines Dec 2024
* high score on test that marks progress towards artificial general intelligence (AGI)
* OpenAI o3 scored 87.5%, trouncing prev. best score for an artificial intelligence system of55.5%

#LLM #OpenAI #OpenAI_o1 #OpenAI_o3 #GPT4o #ML #AI #transformers #reasoning #COT #ChainOfThought #AGI

How should we test AI for human-level intelligence? OpenAI’s o3 electrifies quest

Experimental model’s record-breaking performance on science and maths tests wows researchers.

OpenAI’s Next Big AI Effort, GPT-5, Is Behind Schedule and Crazy Expensive
https://www.wsj.com/tech/ai/openai-gpt5-orion-delays-639e7693
nonpaywalled: https://archive.fo/L7fOF
https://news.ycombinator.com/item?id=42485938

* OpenAI ran into problem after problem on its new artificial-intelligence project, code-named Orion
* GPT-5 project, code-named Orion, in works for 18+ mo
* intended as major advancement in tech powering ChatGPT
* limitation: available training data, costs ...

#LLM #AI #AGI #OpenAI #GPT4 #GPT5 #OpenAI_o1 #OpenAI_o3 #ChatGPT

[thread] OpenAI o1, o3 | OpenAI GPT-4o
https://en.wikipedia.org/wiki/OpenAI_o1

* generative pre-trained transformer
* form. known within OpenAI as “Q*"
* o1 spends time "thinking" before it answers
* makes it better at complex reasoning tasks, science & programming than OpenAI GPT-4o
* full v. was released 2024-Dec-05

#LLM #OpenAI #OpenAI_o1 #OpenAI_o3 #GPT4o #ML #TransformerArchitecture #reasoning #COT #ChainOfThought #AGI #AI

OpenAI o1 - Wikipedia

OpenAI o1-preview/o1-miniがVS CodeのGitHub Copilot ChatとGitHub Modelsで利用可能に
https://gihyo.jp/article/2024/09/openai-o1-github-copilot?utm_source=feed

#gihyo #技術評論社 #gihyo_jp #GitHub_Copilot #生成AI #OpenAI_o1

OpenAI o1-preview/o1-miniがVS CodeのGitHub Copilot ChatとGitHub Modelsで利用可能に | gihyo.jp

GitHubは2024年9月19日、OpenAIの新しい推論モデルOpenAI o1-previewとo1-miniを、VS Codeを使用したGitHub Copilot Chat、およびGitHub Modelsのプレイグラウンド上で利用できるプレビュー提供を開始した。

gihyo.jp