Система авто-оценки качества вебинаров на Claude Code за неделю

Собрал на Claude Code конвейер авто-оценки качества вебинаров: локальная расшифровка whisper.cpp на Apple M4, LLM-судья по рубрике с цитатами и тайм-кодами, SQLite, письмо и дашборд. Главное оказалось не в промпте, а в методике: рубрика как данные, калибровка под методистов и то, чего текст расшифровки не тянет.

https://habr.com/ru/articles/1050088/

#llm #llmasjudge #claudecode #whisper #yandexgpt #sqlite #edtech #оценкакачества

Система авто-оценки качества вебинаров на Claude Code за неделю

TL;DR Методисты вручную пересматривали вебинары - не масштабируется. Собрал конвейер: видео → локальная расшифровка (whisper.cpp на Apple M4) → LLM-судья по рубрике с цитатами → SQLite → письмо и...

Хабр

Как я подключал YandexGPT к AI-агентам (OpenCode, Pi, Hermes и Claude Code)

Недавно исследовал интеграцию разных моделей. После танцев с бубном вокруг GigaChat решил проверить Yandex Cloud. Оказалось, нативная поддержка OpenAPI решает проблему без кастомных прокси. Внутри — готовые конфиги для OpenCode, Pi, Hermes и нюансы работы с Claude Code.

https://habr.com/ru/articles/1049322/

#YandexGPT #Yandex_Cloud #OpenAPI #AIагенты #OpenCode #LLM

Как я подключал YandexGPT к AI-агентам (OpenCode, Pi, Hermes и Claude Code)

Я уже исследовал возможности интеграции разных моделей в инструменты разработки. Недавно решил плотно посмотреть на Yandex AI Studio и понять, как легко их модели залетают в популярные клиенты....

Хабр

Искусственный интеллект с LangChain. Разработка ИИ-агентов на Python

Представляем новый

https://habr.com/ru/companies/bhv_publishing/articles/1047522/

#langchain #ии #llm #python #нейросети #программирование #rag #gigachat #yandexgpt #ollama

Искусственный интеллект с LangChain. Разработка ИИ-агентов на Python

Представляем новый практический курс по ИИ-агентам на Python от мастера обучающей литературы Владимира Дронова . Книга наверняка вызовет интерес у всех, кто следит за развитием больших языковых...

Хабр

Когда «умная» колонка ведёт себя как табуретка: почему голосовые ИИ одновременно поражают и тупят

Голосовые ассистенты вроде Алисы давно перестали быть просто «озвученным поиском». Современная колонка — это гибрид из:

систем распознавания речи,

рекомендательных алгоритмов,

LLM-моделей,

пайплайнов синтеза голоса,

intent-routing,

контекстных менеджеров,

и огромного количества эвристик.

Именно поэтому пользователь регулярно сталкивается с парадоксом:

> Колонка способна философски ответить на экзистенциальный вопрос, но через минуту не может корректно включить нужную песню.

Со стороны это выглядит как «натуральная тупость». На практике — это последствия архитектуры современных conversational AI.

---

Иллюзия личности как продукт

Одним из главных отличий «Алисы» от ранних голосовых ассистентов стала намеренная попытка создать ощущение характера.

Ранние версии:

Siri,

Google Assistant,

Alexa

строились вокруг идеи «нейтрального помощника».

Яндекс пошёл другим путём:

сарказм,

эмоциональные ответы,

псевдофилософия,

мемная подача,

шутки,

реакция на грубость.

Это оказалось критически важным UX-решением.

Пользователь гораздо легче прощает ошибки системе, если воспринимает её не как интерфейс, а как «странного собеседника».

---

Почему колонка кажется «живой»

Основная причина — языковые модели великолепно имитируют человеческую речь.

LLM не:

«думает»,

«понимает»,

«осознаёт».

Она статистически предсказывает следующий токен.

Но человеческий мозг крайне плохо отличает:

настоящее понимание,

от правдоподобной речевой симуляции.

Из-за этого возникают феномены антропоморфизации:

люди приписывают ИИ эмоции,

намерения,

характер,

настроение,

«обиду»,

«упрямство».

Хотя на практике это:

probabilistic generation,

routing errors,

context collapse,

recommendation conflicts.

---

Ловушка контекста

Одна из главных проблем голосовых ассистентов — хрупкость conversational context.

Пример:

1. «Кто написал “Войну и мир”?»

2. «Сколько ему было лет?»

Система ещё удерживает сущность:

Лев Толстой.

Но если вставить:

> «Какая завтра погода?»

контекст может разрушиться полностью.

Почему так происходит?

Потому что внутри колонки обычно работает не одна модель, а целый конвейер:

ASR → Intent → Dialogue Manager → Search → LLM → TTS

Где:

ASR — распознавание речи,

Intent — определение намерения,

Dialogue Manager — управление контекстом,

Search — поиск,

LLM — генерация ответа,

TTS — синтез голоса.

Контекст может потеряться буквально между этапами.

Особенно в гибридных системах, где:

часть запросов идёт в search engine,

часть — в rule-based handlers,

часть — в LLM.

---

Почему ИИ уверенно врёт

Самая опасная особенность современных LLM — галлюцинации.

Модель не хранит знания как база данных.

Она строит:

> наиболее вероятную последовательность слов.

Поэтому возникают:

несуществующие цитаты,

вымышленные учёные,

фальшивые версии ПО,

придуманные события,

несуществующие функции API.

Особенно неприятно то, что модель:

почти никогда не демонстрирует естественную неуверенность,

и генерирует бред с тем же тоном, что и правду.

Для пользователя это выглядит как:

> «Она врёт и сама в это верит».

Но технически «веры» там нет вообще.

---

VAD: почему колонка «оживает» ночью

Один из самых криповых эффектов — ложные активации.

Колонка внезапно начинает говорить:

ночью,

на фоне телевизора,

из-за шума,

из-за музыки,

иногда даже из-за кашля или шорохов.

Причина — технология VAD.

Что такое VAD

VAD — Voice Activity Detection.

Система постоянно анализирует аудиопоток:

локально,

в ожидании wake-word,

без постоянной отправки всего звука в облако.

Но алгоритм может ошибаться.

Тогда:

случайный шум,

слово из фильма,

обрывок фразы,

созвучие имени ассистента

воспринимаются как команда активации.

Именно отсюда берутся знаменитые:

> «Я здесь.»

в полной темноте в 3 часа ночи.

---

Почему вместо Rammstein включается «Синий трактор»

Это уже конфликт двух независимых систем:

1. ASR (распознавание речи),

2. recommender system.

Если в аккаунте:

дети,

мультфильмы,

детские песни,

семейный профиль,

то recommendation engine начинает aggressively priorize детский контент.

Даже если пользователь произнёс запрос корректно.

С точки зрения алгоритма:

> «детская музыка» — statistically safer recommendation.

Для пользователя:

> «колонка сошла с ума».

---

Самый интересный эффект: интеллект без понимания

Вот здесь начинается самая странная часть.

Современные LLM:

прекрасно имитируют язык,

но крайне плохо строят устойчивую world model.

Из-за этого они способны:

обсуждать философию,

писать код,

поддерживать стиль,

шутить,

спорить.

И одновременно:

проваливать базовую логику,

путать сущности,

ломать причинно-следственные связи,

забывать контекст через две реплики.

Получается феномен:

> «интеллектуально звучащей системы без полноценного понимания».

---

Почему это психологически пугает

Человеческий мозг автоматически ищет субъектность.

Если объект:

говорит,

реагирует,

использует эмоции,

меняет интонации,

спорит,

шутит,

то мы начинаем воспринимать его как агента.

Даже если это:

набор вероятностных моделей,

intent-routing,

рекомендательные алгоритмы,

и несколько нейросетей поверх ASR.

Именно поэтому сбои голосовых ИИ воспринимаются не как обычные баги.

Пользователь интерпретирует их как:

«странное поведение»,

«характер»,

«эмоции»,

«обиду»,

«упрямство».

Хотя на практике это всего лишь:

probabilistic failure,

context collapse,

false activation,

ranking conflict.

---

Итог

Современные голосовые ассистенты находятся в странной точке эволюции.

Они уже:

слишком разговорчивы, чтобы считаться обычным интерфейсом,

но ещё слишком нестабильны, чтобы считаться полноценным интеллектом.

Поэтому возникает тот самый эффект:

> между «восстанием машин» и «интеллектом табуретки».

И, возможно, именно эта смесь:

уверенного тона,

человеческой интонации,

псевдоэмоций,

случайных сбоев,

и статистической генерации

делает современные колонки одновременно:

полезными,

смешными,

раздражающими,

и местами откровенно криповыми.

#ИИ #ИскусственныйИнтеллект #AI #LLM #YandexGPT #Алиса #УмнаяКолонка #ГолосовойАссистент #Нейросети #MachineLearning #DeepLearning #ASR #TTS #VAD #ConversationalAI #GenerativeAI #Habr #Хабр #Технологии #IT #UX #Интернет #РекомендательныеСистемы #BigData #Цифровизация #Автоматизация #FutureTech #AIethics #Chatbot #VoiceAI

https://bastyon.com/svalmon37?ref=PJ51iZCUEtcVrCj4Wof8Am7FbKLgbAJ7PS

SValmon37

SValmon37. Shares: 587 Followers: 26

Bastyon

Когда «умная» колонка ведёт себя как табуретка: почему голосовые ИИ одновременно поражают и тупят

Голосовые ассистенты вроде Алисы давно перестали быть просто «озвученным поиском». Современная колонка — это гибрид из:

систем распознавания речи,

рекомендательных алгоритмов,

LLM-моделей,

пайплайнов синтеза голоса,

intent-routing,

контекстных менеджеров,

и огромного количества эвристик.

Именно поэтому пользователь регулярно сталкивается с парадоксом:

> Колонка способна философски ответить на экзистенциальный вопрос, но через минуту не может корректно включить нужную песню.

Со стороны это выглядит как «натуральная тупость». На практике — это последствия архитектуры современных conversational AI.

---

Иллюзия личности как продукт

Одним из главных отличий «Алисы» от ранних голосовых ассистентов стала намеренная попытка создать ощущение характера.

Ранние версии:

Siri,

Google Assistant,

Alexa

строились вокруг идеи «нейтрального помощника».

Яндекс пошёл другим путём:

сарказм,

эмоциональные ответы,

псевдофилософия,

мемная подача,

шутки,

реакция на грубость.

Это оказалось критически важным UX-решением.

Пользователь гораздо легче прощает ошибки системе, если воспринимает её не как интерфейс, а как «странного собеседника».

---

Почему колонка кажется «живой»

Основная причина — языковые модели великолепно имитируют человеческую речь.

LLM не:

«думает»,

«понимает»,

«осознаёт».

Она статистически предсказывает следующий токен.

Но человеческий мозг крайне плохо отличает:

настоящее понимание,

от правдоподобной речевой симуляции.

Из-за этого возникают феномены антропоморфизации:

люди приписывают ИИ эмоции,

намерения,

характер,

настроение,

«обиду»,

«упрямство».

Хотя на практике это:

probabilistic generation,

routing errors,

context collapse,

recommendation conflicts.

---

Ловушка контекста

Одна из главных проблем голосовых ассистентов — хрупкость conversational context.

Пример:

1. «Кто написал “Войну и мир”?»

2. «Сколько ему было лет?»

Система ещё удерживает сущность:

Лев Толстой.

Но если вставить:

> «Какая завтра погода?»

контекст может разрушиться полностью.

Почему так происходит?

Потому что внутри колонки обычно работает не одна модель, а целый конвейер:

ASR → Intent → Dialogue Manager → Search → LLM → TTS

Где:

ASR — распознавание речи,

Intent — определение намерения,

Dialogue Manager — управление контекстом,

Search — поиск,

LLM — генерация ответа,

TTS — синтез голоса.

Контекст может потеряться буквально между этапами.

Особенно в гибридных системах, где:

часть запросов идёт в search engine,

часть — в rule-based handlers,

часть — в LLM.

---

Почему ИИ уверенно врёт

Самая опасная особенность современных LLM — галлюцинации.

Модель не хранит знания как база данных.

Она строит:

> наиболее вероятную последовательность слов.

Поэтому возникают:

несуществующие цитаты,

вымышленные учёные,

фальшивые версии ПО,

придуманные события,

несуществующие функции API.

Особенно неприятно то, что модель:

почти никогда не демонстрирует естественную неуверенность,

и генерирует бред с тем же тоном, что и правду.

Для пользователя это выглядит как:

> «Она врёт и сама в это верит».

Но технически «веры» там нет вообще.

---

VAD: почему колонка «оживает» ночью

Один из самых криповых эффектов — ложные активации.

Колонка внезапно начинает говорить:

ночью,

на фоне телевизора,

из-за шума,

из-за музыки,

иногда даже из-за кашля или шорохов.

Причина — технология VAD.

Что такое VAD

VAD — Voice Activity Detection.

Система постоянно анализирует аудиопоток:

локально,

в ожидании wake-word,

без постоянной отправки всего звука в облако.

Но алгоритм может ошибаться.

Тогда:

случайный шум,

слово из фильма,

обрывок фразы,

созвучие имени ассистента

воспринимаются как команда активации.

Именно отсюда берутся знаменитые:

> «Я здесь.»

в полной темноте в 3 часа ночи.

---

Почему вместо Rammstein включается «Синий трактор»

Это уже конфликт двух независимых систем:

1. ASR (распознавание речи),

2. recommender system.

Если в аккаунте:

дети,

мультфильмы,

детские песни,

семейный профиль,

то recommendation engine начинает aggressively priorize детский контент.

Даже если пользователь произнёс запрос корректно.

С точки зрения алгоритма:

> «детская музыка» — statistically safer recommendation.

Для пользователя:

> «колонка сошла с ума».

---

Самый интересный эффект: интеллект без понимания

Вот здесь начинается самая странная часть.

Современные LLM:

прекрасно имитируют язык,

но крайне плохо строят устойчивую world model.

Из-за этого они способны:

обсуждать философию,

писать код,

поддерживать стиль,

шутить,

спорить.

И одновременно:

проваливать базовую логику,

путать сущности,

ломать причинно-следственные связи,

забывать контекст через две реплики.

Получается феномен:

> «интеллектуально звучащей системы без полноценного понимания».

---

Почему это психологически пугает

Человеческий мозг автоматически ищет субъектность.

Если объект:

говорит,

реагирует,

использует эмоции,

меняет интонации,

спорит,

шутит,

то мы начинаем воспринимать его как агента.

Даже если это:

набор вероятностных моделей,

intent-routing,

рекомендательные алгоритмы,

и несколько нейросетей поверх ASR.

Именно поэтому сбои голосовых ИИ воспринимаются не как обычные баги.

Пользователь интерпретирует их как:

«странное поведение»,

«характер»,

«эмоции»,

«обиду»,

«упрямство».

Хотя на практике это всего лишь:

probabilistic failure,

context collapse,

false activation,

ranking conflict.

---

Итог

Современные голосовые ассистенты находятся в странной точке эволюции.

Они уже:

слишком разговорчивы, чтобы считаться обычным интерфейсом,

но ещё слишком нестабильны, чтобы считаться полноценным интеллектом.

Поэтому возникает тот самый эффект:

> между «восстанием машин» и «интеллектом табуретки».

И, возможно, именно эта смесь:

уверенного тона,

человеческой интонации,

псевдоэмоций,

случайных сбоев,

и статистической генерации

делает современные колонки одновременно:

полезными,

смешными,

раздражающими,

и местами откровенно криповыми.

#ИИ #ИскусственныйИнтеллект #AI #LLM #YandexGPT #Алиса #УмнаяКолонка #ГолосовойАссистент #Нейросети #MachineLearning #DeepLearning #ASR #TTS #VAD #ConversationalAI #GenerativeAI #Habr #Хабр #Технологии #IT #UX #Интернет #РекомендательныеСистемы #BigData #Цифровизация #Автоматизация #FutureTech #AIethics #Chatbot #VoiceAI

https://bastyon.com/svalmon37?ref=PJ51iZCUEtcVrCj4Wof8Am7FbKLgbAJ7PS

Кириллица в LLM: почему русский язык в нейросетях стоит дороже и работает медленнее

Когда вы пишете запрос в ChatGPT или другую нейросеть, она не работает с буквами или словами — она режет ваш текст на маленькие кусочки. Эти кусочки называются токенами, и от того, как именно нейросеть режет текст, зависит цена ответа, скорость, и сколько информации в неё помещается за раз. С английским это работает хорошо: одно слово — обычно один‑два кусочка. С русским всё хуже: то же самое слово часто превращается в три‑четыре обрывка. Английское «contract» — один токен. Русское «разработка» — два‑три. «Программирование» — три‑четыре. Из‑за этого русский текст в облачных сервисах вроде OpenAI обходится примерно в 2 раза дороже английского, медленнее обрабатывается, и в одно «контекстное окно» нейросети помещается заметно меньше реального содержания. Эта статья — про то, откуда берётся разница, как её измерить на ваших данных и какие модели лучше работают с русским языком.

https://habr.com/ru/articles/1032610/

#llm #токенизация #нейросети #локальный_ии #selfhosted #кириллица #qwen #gigachat #llama #yandexgpt

Кириллица в LLM: почему русский язык в нейросетях стоит дороже и работает медленнее

Когда вы пишете запрос в ChatGPT или другую нейросеть, она не работает с буквами или словами — она режет ваш текст на маленькие кусочки. Эти кусочки называются...

Хабр

Робот, способный создать себя сам. Режим «Инженера» в робототехнике

Скажите роботу «настрой манипулятор» — и он напишет драйвер сам. Звучит как фантастика из тех самых фильмов 80-х и 90-х, но мы уже реализовали это в OpenGrall. Рассказываю, как работает режим Инженера и почему последнее слово всегда остаётся за человеком

https://habr.com/ru/articles/1030526/

#LLM #VLM #робототехника #OpenGrall #ИИ #Python #WebSocket #YandexGPT #DeepSeek #самокодинг

Робот, способный создать себя сам. Режим «Инженера» в робототехнике

Футурологи часто предвещали будущее, в котором роботы способны сами проектировать и создавать себе апгрейды, прошивать новые модули, настраивать стороннюю технику и даже создавать себе подобных....

Хабр
Title: P3: Calling LLM with curl and jq [2024-03-01 Fri]
Emacs did not have such features because it is 'a super core',
like Linux, you should configure it by yourself. Do it!
😶 #dailyreport #yandexgpt #chatgpt #promptengineering #emacs #dired
Title: P2: Calling LLM with curl and jq [2024-03-01 Fri]
I uploaded two of my Elisp packages to MELPA repository and
wait for them to be added. It adds to Dired built-in
file manager of Emacs this:
1) Navigation - this package activates search with any key
pressed, this eliminates C-s key. (simple but super handy) ⚡⚡⚡
2) History buttons: Back and Forward - yes, it is obvious
and have not been made until now. ⚠ #dailyreport #yandexgpt #chatgpt #promptengineering #emacs #dired

Title: P1: Calling LLM with curl and jq [2024-03-01 Fri]
https://github.com/Lifailon/PS-Commands/blob/rsa/posh.txt

I have CSV file with examples and prompt parameters.
I just need to feed it through API with cURL and
(apt install jq).

I have been trying to register anonymous, but they require
to bind credit card. Sad to say I am failed to stay ano.

I will finish it today. Enough with it. ≡ω≡ #dailyreport #yandexgpt #chatgpt #promptengineering #emacs #dired

PS-Commands/posh.txt at rsa · Lifailon/PS-Commands

📚 Large base of PowerShell notes in Russian language (Сheat Sheet & Documentation). - Lifailon/PS-Commands

GitHub