Как мы заставили ИИ-агентов судиться и почему не зашла архитектура китайцев
В конце 2025 года исследователи из Университета Цинхуа выкатили препринт «Chinese Court Simulation with LLM‑Based Agent System». Они доказали то, о чем многие догадывались давно. Одиночный прогон промта в юридических задачах работает плохо. Классический RAG‑пайплайн формата «запрос пользователя > поиск по базе > генерация ответа» страдает от склонности к подтверждению. Нейросеть цепляется за первый найденный аргумент и начинает игнорировать факты ради сохранения логики своего ответа. У нее нет внешнего критика. Китайские коллеги решили эту проблему через состязательную симуляцию (Adversarial Debate). Они стравили прокурора и адвоката на базе нейросетей. Итог оказался показательным. Количество галлюцинаций резко упало, так как выдуманные адвокатом факты тут же опровергались прокурором. В споре моделей родилась истина. Мы в АйЮрист параллельно строили мультиагентную систему для российских арбитражных судов на базе нашей опенсорсной модели Ken1.0. Когда мы попытались переложить пару академических наработок на B2B, стало понятно, что в суровой реальности архитектура полностью рассыпается. Ниже приведен разбор того, как устроена первая в России система судебных симуляций, в чем просчитались исследователи из Цинхуа и как мы заставили 10 агентов судиться так, чтобы корпоративные юристы получали реальную пользу.

