Как мы написали UI-тесты для ИИ-агента внутри JetBrains IDE

Как проверить, что ИИ-агент в IDE работает, если на одинаковые запросы LLM отвечает по-разному? Ответы модели недетерминированы, а интерфейс и бизнес-логика вполне детерминированы, и их нужно тестировать отдельно. Мы делаем ИИ-агента, встраиваемого в JetBrains IDE. В статье расскажу, как мы выстроили UI-автоматизацию плагина так, чтобы тесты ловили регрессии в интерфейсе, бизнес-логике и при этом не «моргали» из-за нестабильности LLM. Тааак, падажжи

https://habr.com/ru/companies/veai/articles/1028756/

#veai #тестирование #ide #intellij_idea_plugin #плагин_ide #quality_gates #kotlin #intellij_platform #aiagent #ииагент

Как мы написали UI-тесты для ИИ-агента внутри JetBrains IDE

Как проверить, что ИИ-агент в IDE работает, если на одинаковые запросы LLM отвечает по-разному? Ответы модели недетерминированы, а интерфейс и бизнес-логика вполне детерминированы, и их нужно...

Хабр

GLM 5.1 vs. DeepSeek V3.2: сравниваем топовые китайские модели

В Veai мы регулярно тестируем и сравниваем модели, которые доступны у нас в плагине. Каждая модель, которую мы добавляем проходит через наш собственный бенчмарк, прежде чем попасть в продакшн. Недавно тестированию подверглись GLM 5.1 и DeepSeek V3.2. Делимся результатами.

https://habr.com/ru/companies/veai/articles/1027370/

#агент_для_разработчиков #AIагент #бенчмарк_LLM #GLM_51 #DeepSeek_V32 #сравнение_моделей #кодингагент #Veai #open_source_LLM #LLMсудьи

GLM 5.1 vs. DeepSeek V3.2: сравниваем топовые китайские модели

В Veai мы регулярно тестируем и сравниваем модели, которые доступны у нас в плагине. Каждая модель, которую мы добавляем проходит через наш собственный бенчмарк, прежде чем попасть в продакшн. Недавно...

Хабр

Вайбдебаггинг — уже реальность? Мы дали ИИ-агенту отладчик и проверили

В конце прошлого года Cursor выпустил Debug Mode — режим, в котором агент может собирать логи из рантайма, чтобы лучше понимать причины багов. Судя по реакции на Reddit , идею приняли с интересом. Но что, если пойти более прямым путём? Дать агенту «руки», чтобы он отлаживался так же, как это делает разработчик: ставил брейкпоинты, ходил по ним, выполнял evaluate expression? Этим вопросом недавно задались исследователи из Microsoft Research и сделали экспериментальный фреймворк Debug2Fix . Субагент, оснащённый инструментами для взаимодействия с отладчиком, разбирался с багами из датасетов GitBug-Java и SWE-Bench-Live на 20% лучше, чем обычный агент без таких инструментов. Если агент уже интегрирован с IDE, естественно дать ему доступ к полноценному дебаггеру, когда он так близко. Тем более что этим занимаются даже в Microsoft. Поэтому в недавнем релизе своего ассистента для IntelliJ мы добавили Debug Agent, позволяющий агенту взаимодействовать с дебаггером в среде разработки. Сегодня попробуем починить реальный баг с помощью агента с инструментами дебаггера в IDE и Cursor в Debug Mode и проверим, действительно ли ИИ нужен полный доступ к отладчику или достаточно и хорошего логгирования.

https://habr.com/ru/companies/veai/articles/1024264/

#отладка #ииагенты #cursor #veai #debug #intellij #искусственный_интеллект #дебаггер #ииассистент #вайбкодинг

Вайбдебаггинг — уже реальность? Мы дали ИИ-агенту отладчик и проверили

Привет, Хабр! В конце прошлого года Cursor выпустил Debug Mode — режим, в котором агент может собирать логи из рантайма, чтобы лучше понимать причины багов. Судя по реакции на Reddit , идею приняли с...

Хабр

Bạn có mệt mỏi khi phải giải thích lại từ đầu mỗi khi dùng ứng dụng giọng nói?

Ve AI ra đời để giải quyết vấn đề "mất trí nhớ" của các trợ lý ảo. Ứng dụng này có khả năng ghi nhớ ngữ cảnh, dự án và phong cách cá nhân từ các cuộc trò chuyện trước đó. Thay vì lặp lại thông tin, bạn chỉ cần gọi tên dự án và Ve AI sẽ hiểu ngay bạn đang nói về điều gì. Một bước tiến mới cho trải nghiệm AI cá nhân hóa.

#VeAI #ArtificialIntelligence #VoiceApp #Productivity #TriTueNhanTao #CongNghe

https://www.reddit

На стыке AI и науки: Летняя школа Veai для студентов

День студента — отличный повод поговорить не только о сессиях и вечеринках, но и о том, зачем вообще учиться. Новые идеи и технологии, нестандартные решения появляются там, где есть пространство для эксперимента, глубокого исследования и диалога между академической средой и индустрией. Образовательные проекты совместно с ведущими ВУЗами Росиии, ИТМО и СПбГУ – важная часть нашей работы. Летняя школа Проекты и отзывы

https://habr.com/ru/companies/veai/articles/988328/

#стажировка_в_it #студенты #студенческие_проекты #практика #искусственный_интеллект #машинное_обучение #программирование #ai_agent #ai_for_programmers #veai

На стыке AI и науки: Летняя школа Veai для студентов

День студента — отличный повод поговорить не только о сессиях и вечеринках, но и о том, зачем вообще учиться. Новые идеи и технологии, нестандартные решения появляются там, где есть пространство для...

Хабр