Мультимодальный AI в 2025: как GPT‑5.1, Gemini, Claude и Grok научились понимать текст, изображения и видео одновременно

В 2020 году AI был архипелагом изолированных моделей. К 2025-му всё изменилось. Эта статья — глубокое погружение в единую парадигму Next Token Prediction, которая позволила GPT-5.1, Gemini, Claude и Grok научиться понимать текст, изображения и видео одновременно. Разбираем, как это работает, и на что способны флагманские модели сегодня.

https://habr.com/ru/articles/967218/

#llm #локальный_ai #мультимодальные_модели #gpt51 #gemini_25_pro #claude_opus_41 #grok_4 #next_token_prediction #vision_transformer

Мультимодальный AI в 2025: как GPT‑5.1, Gemini, Claude и Grok научились понимать текст, изображения и видео одновременно

Ещё совсем недавно для каждого домашнего устройства у вас был свой пульт: один для телевизора, другой для кондиционера, третий для музыкального центра. Каждый говорил на своём языке, и заставить их...

Хабр

Как мы создали ИИ-ассистента юриста: разбор архитектуры, граблей и инсайтов

Когда заказчик приходит с запросом «нам нужен ИИ-юрист», кажется, что всё просто: берём LLM, подключаем API — и готово. На деле же проект превращается в серию экспериментов с чанками, галлюцинациями и «температурой паранойи». Рассказываю, как мы в SoftMediaLab прошли путь от идеи до работающего продукта.

https://habr.com/ru/articles/964528/

#ииассистент #ии_помощник #ииинжиниринг #ии #gemini #gemini_25_pro #chunk

Как мы создали ИИ-ассистента юриста: разбор архитектуры, граблей и инсайтов

Привет! Меня зовут Георгий Чернышов, я — аналитик СофтМедиаЛаб. В текущем тренде и потребности бизнеса в решениях, основанных на искусственном интеллекте, я создаю архитектуру ИИ-решений. Один из моих...

Хабр

ИИ-помощники для Python: как выбрать между чат-песочницей, IDE-ассистентом, агентами и open-source

В 2025-м помощники для Python распались на 4 класса: онлайн-чаты с изолированной песочницей, IDE-плагины, автономные агенты и локальные/открытые модели . Разбираемся, что чем отличается, где уместно, сколько стоит и на что смотреть разработчикам при выборе. А так же примеры кода.

https://habr.com/ru/articles/959926/

#ИИпомощники_для_Python #Python_ассистенты #чатпесочница_Python #Advanced_Data_Analysis #chatgpt #агенты #claude_code #github_copilot #gemini_25_pro #jetbrains

ИИ-помощники для Python: как выбрать между чат-песочницей, IDE-ассистентом, агентами и open-source

Онлайн-чаты с «песочницей», умные автодополнения в IDE, автономные агенты, а также локальные/открытые модели — все это сегодня называют « ИИ-помощниками для Python ». В статье я разложу варианты по...

Хабр

Мой путь к «умному» LibreChat: боль, радость и 20 тестовых вопросов к RAG

Помню тот момент, когда я в очередной раз пытался вытащить конкретную спецификацию из стопки PDF‑отчетов. «Вот бы ИИ мог сам в этом покопаться», — подумал я. Это чувство знакомо многим, кто работает с большими массивами текстовой информации. Тогда я и решил, что хватит это терпеть. Последующий день превратился в марафон по установке и настройке RAG (генерация с дополнением извлеченной информацией). Это был путь проб и ошибок, который в итоге увенчался успехом. И теперь я хочу поделиться этим опытом с вами. В этом материале мы: • Пошагово установим rag_api в уже развёрнутый LibreChat; • Воспользуемся Python 3.12 , PostgreSQL 17 ; • В командной строке соберём PostgreSQL‑аддон pg_vector через x64 Native Tools Command Prompt for VS 2022; • Протестируем RAG‑систему 20 вопросами к вымышленной документации , сгенерированной в Gemini 2.5 Pro; • Узнаем, во сколько раз медленнее запускать через CPU, чем через GPU. Приятного прочтения!

https://habr.com/ru/companies/bothub/articles/956892/

#librechat #rag #rag_api #pg_vector #PostgreSQL #chatgpt_o3mini #gemini_25_pro

Мой путь к «умному» LibreChat: боль, радость и 20 тестовых вопросов к RAG

Помню тот момент, когда я в очередной раз пытался вытащить конкретную спецификацию из стопки PDF‑отчетов. «Вот бы ИИ мог сам в этом покопаться», — подумал я. Это чувство...

Хабр

Claude Sonnet 4.5 vs Opus 4.1 vs ChatGPT 5: какую нейросеть выбрать в 2025 году?

Интернет снова взорвался новостью от Anthropic: вышла модель Claude Sonnet 4.5, которую уже окрестили лучшим кодирующим ИИ в мире. Сообщают о невероятных успехах в бенчмарках, снижении галлюцинаций и новой гибридной системе рассуждений. Но за громкими заголовками всегда скрывается вопрос: а что на практике? Оправдывает ли модель ажиотаж и сможет ли она действительно стать тем самым «никогда не спящим аналитиком» в вашем проекте? В этой статье мы пропустим Claude Sonnet 4.5 через серию реальных задач — от генерации сложного кода до написания технических статей — и сравним его с главными конкурентами.

https://habr.com/ru/companies/bothub/articles/955822/

#claude_sonnet_45 #anthropic #chatgpt_5 #gemini_25_pro #claude_opus_41 #тест_иимоделей

Claude Sonnet 4.5 vs Opus 4.1 vs ChatGPT 5: какую нейросеть выбрать в 2025 году?

Интернет снова взорвался новостью от Anthropic: вышла модель Claude Sonnet 4.5, которую уже окрестили лучшим кодирующим ИИ в мире. Сообщают о невероятных успехах в бенчмарках,...

Хабр

Генерация идей для бизнеса и творчества: топ AI-инструментов для брейншторминга

Творческий блок, шаблонные решения, страх ошибиться — традиционный брейншторминг, бывает, превращается в хождение по кругу. А вот AI-ассистенты таким проблемам не подвержены, к тому же они уже давно смогли отойти от шаблонности, и в 2025 году люди всё чаще прибегают к их помощи. ИИ могут не только предлагать варианты, но и критиковать их, комбинировать противоположные концепции и даже предугадывать тренды. Нейросети задают неудобные вопросы, предлагают абсурдные, на первый взгляд, комбинации, но в итоге зачастую именно это и приводит к успеху. В этой статье вы найдёте подборку инструментов для брейншторминга и их наглядное тестирование, в которое войдёт как генерация идей на определённую тематику, так и решения для более конкретных задач, а в конце будет сравнительная таблица.

https://habr.com/ru/companies/bothub/articles/927902/

#нейросети #сравнение #брейншторминг #deepseek_r10528 #canva #gigachat_20 #claude_sonnet_4 #chatgpt_o3 #chatgpt_4o #gemini_25_pro

Генерация идей для бизнеса и творчества: топ AI-инструментов для брейншторминга

Творческий блок, шаблонные решения, страх ошибиться — традиционный брейншторминг, бывает, превращается в хождение по кругу. А вот AI‑ассистенты таким проблемам...

Хабр

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)

В первой части мы разобрали теорию text‑to‑SQL: как LLM заменяют разработчиков, почему RAG и CoT спасают от галлюцинаций и зачем Scale AI дообучает ChatGPT-4. Но теория неполна без практики! В этом материале — жёсткое тестирование моделей (ChatGPT o3-mini‑high, ChatGPT 4.1, Claude Sonnet 4, ChatGPT o3, Gemini 2.5 Pro, DeepSeek R1–0528) на бенчмарке LiveSQLBench. 6 моделей, 10 задач, сложность от ★★ до ★★★★★★★★★★. Проверим, как они считают лунные помехи, генерируют SQL для криптобирж и ищут артефакты в музеях.

https://habr.com/ru/companies/bothub/articles/925712/

#texttosql #nl2sql #бенчмарк #chatgpt_o3minihigh #chatgpt_41 #claude_sonnet_4 #chatgpt_o3 #gemini_25_pro #deepseek_r10528

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)

В первой части мы разобрали теорию text‑to‑SQL: как LLM заменяют разработчиков, почему RAG и CoT спасают от галлюцинаций и зачем Scale AI дообучает ChatGPT-4. Но теория неполна...

Хабр

Битва сильнейших: ChatGPT o1 pro / DeepSeek r1 / Claude 3.7 Sonnet / Gemini 2.5 Pro

На дворе 2025-й — год, когда нейросети уже давно превратились из «чего-то неизведанного, но интересного и манящего» в незримых союзников огромного количества людей, которые с радостью поручают им различные задачи в течение дня. И сегодня мы с вами посмотрим на битву ИИ-титанов: ChatGPT o1 Pro, DeepSeek R1, Claude 3.7 Sonnet и Gemini 2.5 Pro. Ну, может, конечно, будет и не столь зрелищно, как в каких-нибудь боевиках, однако, какая из этих моделей справляется с общими задачами лучше всего, мы с вами постараемся выяснить. Что действительно волнует пользователей — как выбрать идеального ИИ-помощника под свою конкретную задачу? Все чаще они ищут не просто умную нейросеть, а специализированные решения для маркетинга, копирайтинга слоганов, сценариев и других видов контента. В этом обзоре мы с вами не только сравним общие способности лидеров рынка, но и присмотримся к тому, какая модель станет вашим лучшим оружием в конкретных областях.

https://habr.com/ru/companies/bothub/articles/919366/

#нейросети #промты #deepseekr1 #gemini_25_pro #claude_37_sonnet #chatgpt_o1_pro #сравнение

Битва сильнейших: ChatGPT o1 pro / DeepSeek r1 / Claude 3.7 Sonnet / Gemini 2.5 Pro

Введение На дворе 2025-й — год, когда нейросети уже давно превратились из «чего-то неизведанного, но интересного и манящего» в незримых союзников огромного количества людей, которые с радостью...

Хабр

Кто выиграл? ChatGPT o3 Pro против конкурентов в двух тестах

Хотите знать, какая нейросеть лучше генерирует код для 3D‑анимации или пишет научный реферат? Мы сравнили ChatGPT o3 Pro , Gemini 2.5 Pro , Claude Opus 4 и DeepSeek R1-0528 в двух примерах: создание веб‑презентации (анимированные алгоритмы сортировки) и подробное исследование о системах беспилотных авто . Кто справился с анимацией? Чей код запустился? Чей текст — как TED Talk на бумаге? Смотрите тесты, сравнивайте Codepen‑примеры и делайте выводы. (Спойлер: победил не o3 Pro!)

https://habr.com/ru/companies/bothub/articles/918712/

#chatgpt_o3_pro #openai #gemini_25_pro #claude_opus_4 #deepseek_r10528 #алгоритмы_сортировки #javascript #беспилотные_авто #рефераты #отладка

Кто выиграл? ChatGPT o3 Pro против конкурентов в двух тестах

Хотите знать, какая нейросеть лучше генерирует код для 3D‑анимации или пишет научный реферат? Мы сравнили ChatGPT o3 Pro, Gemini 2.5 Pro, Claude Opus 4 и DeepSeek...

Хабр

Проверка текста на орфографию: рейтинг лучших AI-корректоров, часть 2

Часть 2 — это гайд по выживанию в мире кривых текстов, а также грамматический апокалипсис, куда мы закинули ChatGPT‑o1 , o3 , две штуковины от «Яндекса» — «Нейроредактор» и YandexGPT-5-Pro , Text.ru и «Мистера корректора» . Заставили их искать опечатки, запятые, кавычки и ошибки уровня «25-го декабря» — и да, это больно. Зачем терпеть этот разбор? Чтобы не стать тем парнем, чей пост на «Хабре» поправили в комментах. Готовьтесь: тут будут не только баллы, но и таблица, из‑за которой один нейрокорректор плачет в уголке. Да‑да, он снова всё испортил. Поехали разбирать, кто реально исправит ваши «исчо», а кто наделает новых ошибок.

https://habr.com/ru/companies/bothub/articles/913890/

#корректура #проверка_орфографии #проверка_пунктуации #chatgpt_o1 #chatgpt_o3 #gemini_25_pro #yandexgpt_5_pro #яндекс_нейроредактор #textru #мистер_корректор

Проверка текста на орфографию: рейтинг лучших AI-корректоров, часть 2

Часть 2 — это гайд по выживанию в мире кривых текстов, а также грамматический апокалипсис, куда мы закинули ChatGPT‑o1 , o3 , две штуковины от «Яндекса» — «Нейроредактор» и...

Хабр