Пишем персонального AI-ассистента на Python

Современные голосовые помощники это мощные приложения, сочетающие обработку речи, машинное обучение и интеграцию с внешними API. В этой статье мы разберём, как создать базовый проект персонального ассистента на Python, используя библиотеки whisper, webrtcvad, gTTS и другие. Наш ассистент будет: слушать микрофон; определять начало и конец речи с помощью VAD (Voice Activity Detection); преобразовывать речь в текст через модель Whisper; отправлять запросы на локальный LLM для генерации ответа; читать ответ вслух с помощью gTTS; начинать/останавливать запись по нажатию клавиши. Проект может служить как началом для экспериментов, так и для прототипирования реальных решений.

https://habr.com/ru/articles/919720/

#Python #Питон #Голосовой_ассистент #Распознавание_речи #Text_To_Speech #voice_assistant

Пишем персонального AI-ассистента на Python

Современные голосовые помощники это мощные приложения, сочетающие обработку речи, машинное обучение и интеграцию с внешними API. В этой статье мы разберём, как создать базовый проект персонального...

Хабр

Как я делал голосового ассистента на NLP и не сошел с ума

Голосовые ассистенты давно перестали быть просто игрушкой — теперь это полноценные цифровые помощники, которые умеют общаться, искать информацию и даже шутить (иногда лучше некоторых людей). В этой статье разберём, как собрать своего кастомного ассистента с нуля на Python, используя современные NLP-инструменты. Без Siri, без Alexa, всё своё, родное.

https://habr.com/ru/articles/897862/

#голосовой_ассистент #python #распознавание_речи #синтез_речи #openai #rasa #whisper #nlp #машинное_обучение

Как я делал голосового ассистента на NLP и не сошел с ума

Голосовые ассистенты давно перестали быть просто игрушкой — теперь это полноценные цифровые помощники, которые умеют общаться, искать информацию и даже шутить (иногда лучше некоторых людей). В этой...

Хабр

Как мы дважды потеряли $500 тысяч на одном стартапе

В начале 2024 года мы нашли отличную идею. По всем признакам, это взорвёт рынок и принесёт сотню миллионов долларов. Это виртуальный ассистент, с которым можно общаться голосом. В отличие от Алексы или Алисы он может искать файлы, ставить созвоны, но не это — главное. Ключевой момент в том, что с ним можно поболтать и он способен человека понимать и сопереживать ему. Короче, как если бы ChatGPT с нормальными пресетами засунули в голосовую колонку. Примерно так оно, собственно, и было. Голосовой режим там, кстати, до сих пор потрясает, а красота проекта была именно в промптах для разных ситуаций. Загорелись. Хотелось ворваться на рынок и оседлать волну, так что мы собрали команду, прикинули бюджет, составили график, сделали отсечки. Стартовали с парой разработчиков, потом по ходу дела подключили дизайнеров, маркетологов и других нужных людей. Выпустили MVP, смотрели метрики и вносили поправки. Тогда казалось, что успех неизбежен. Потратили полгода и примерно 500 тысяч долларов, чтобы понять: наш виртуальный друг или подруга почему-то никому не нужны. Поэтому мы учли ошибки, пересобрали ассистента и закопали ещё полмиллиона. Оказалось, что слить такую сумму — это очень просто. Кажется, что ты за всем следишь, всё расписано, а потом оп — и деньги потрачены, а результата нет.

https://habr.com/ru/companies/skl_vc/articles/876354/

#запуск_проекта #стартап #голосовой_ассистент #ботпомощник

Как мы дважды потеряли $500 тысяч на одном стартапе

В начале 2024 года мы нашли отличную идею. По всем признакам, это взорвёт рынок и принесёт сотню миллионов долларов. Это виртуальный ассистент, с которым можно общаться голосом. В отличие от Алексы...

Хабр

Голосовой ассистент на python

Всем привет, я программист-любитель, изучающий язык python уже многие годы. Не буду долго тянуть с приветствием и сразу перейду к делу. Этот гайд является по сути пошаговой инструкцией для создания базового кода голосового ассистента, который можно будет потом расширять и дополнять. Читать

https://habr.com/ru/articles/864000/

#python #голосовой_ассистент

Голосовой ассистент на python

Всем привет, я программист-любитель, изучающий язык python уже многие годы. Не буду долго тянуть с приветствием и сразу перейду к делу. Этот гайд является по сути пошаговой инструкцией для создания...

Хабр

Встречайте MajorDom: умный дом будущего, который действительно умён

В мире умных домов часто приходится выбирать между удобством и функционалом. Раздумывая над тем, каким может быть идеальный умный дом, мы пришли к идее MajorDom — системе, которая стремится изменить этот баланс и упростить быт без жертв. В этом посте поделимся нашим видением и некоторыми основными принципами новой экосистемы, включая приватность, автономность и широкую поддержку устройств.

https://habr.com/ru/articles/813241/

#голосовой_ассистент #кикстартер #умный_дом #smart_home #voice_assistant #kickstarter #majordom #домашняя_автоматизация #разработка_электроники #разработка_по

Встречайте MajorDom: умный дом будущего, который действительно умён

Вступление В мире умных домов часто приходится выбирать между удобством и функционалом. Раздумывая над тем, каким может быть идеальный умный дом, мы пришли к идее MajorDom — системе, которая стремится...

Хабр

Бесперспективный стартап, собравший миллионы долларов?

Нашумевший стартап, презентация которого собрала миллионы просмотров, а устройство получило десятки обзоров. Но шумиху понимают далеко не все — у устройства много проблем. Сегодня R1 может давать нам неплохую справочную информацию в реальном времени, ориентируясь на AI сервис Perplexity + помогать в поиске документации, бронировать отели, заказывать такси — и всё это голосом. Добавлю, что у гаджета интересный форм-фактор, а концепция напоминает голосового помощника сродни всяким ассистентам по типу Siri. Но самое главное — R1 сможет взаимодействовать с интерфейсом любого приложения. Круто, но насколько реализуемо на практике? Давайте разбираться.

https://habr.com/ru/articles/790614/

#Машинное_обучение #Гаджеты #искусственный_интеллект #Rabbit #r1 #голосовой_ассистент #устройства

Бесперспективный стартап, собравший миллионы долларов?

Нашумевший стартап, презентация которого собрала миллионы просмотров, а устройство получило десятки обзоров. Но шумиху понимают далеко не все — у устройства много проблем.  Сегодня R1 может...

Хабр

Показалось, что ИИ уже ворвался в нашу жизнь, но нет

Несмотря на популярность темы ИИ в инфопространстве в жизни обычных людей до сих пор нет этого ИИ. Мы наблюдаем самые ранние стадии развития технологии, когда в быту ей пользуются новаторы и ранние последователи, но до массового рынка ещё не дошло. В статье расскажу, как применяю ИИ в своих задачах и как его используют мои коллеги и знакомые разработчики. Разберём, как ИИ повлияет на цифровые сервисы в ближайшем будущем и как это отразится на нашем взаимодействии с ними. Посмотрим на негативную сторону ИИ и ответим на вопрос, стоит ли опасаться его массового распространения.

https://habr.com/ru/companies/alfa/articles/785218/

#искусственный_интеллект #ai #чатбот #web_30 #языковая_модель #chatgpt #голосовой_ассистент #диалоговые_системы #автоматизация_рутины #виртуальный_консультант

Показалось, что ИИ уже ворвался в нашу жизнь, но нет

Несмотря на популярность темы ИИ в инфопространстве, в жизни обычных людей до сих пор нет этого ИИ. Мы наблюдаем самые ранние стадии развития технологии, когда в быту ей пользуются новаторы и ранние...

Хабр

Секрет внутренней связи: откровения Маруси о том, как она научилась слушать себя

Привет, Хабр! Меня зовут Коля Кремер, уже 4 года я работаю в команде мобильного приложения Маруси, где мы постоянно стараемся сделать так, чтобы с нашим помощником было удобно и интересно общаться. Я несколько раз начинал писать и откладывал этот ретроспективный пост, но потом к нему подключились ребята из нашей команды и помог довести его до публикации. Хочу поблагодарить Влада Голоднюка, старшего программиста, и Пашу Муханова, руководителя мобильной разработки, и рассказать сообществу Хабра о том, как мы отучили Марусю в приложении триггериться на себя и научили правильно слышать и понимать ваши запросы.

https://habr.com/ru/companies/vk/articles/782944/

#шумодав #маруся #триггеры #голосовой_помощник #голосовой_ассистент #мобильные_приложения

Секрет внутренней связи: откровения Маруси о том, как она научилась слушать себя

Привет, Хабр! Меня зовут Коля Кремер, уже 4 года я работаю в команде мобильного приложения Маруси, где мы постоянно стараемся сделать так, чтобы с нашим помощником было удобно и интересно...

Хабр

ТРИЗ в разговорном дизайне: как находить оптимальные решения при проектировании сложных сценариев

Я проектирую сценарии голосовых помощников и периодически сталкиваюсь с нетривиальными проблемами. Их решение часто связано с издержками — то диалог получается слишком длинным, то ответ становится неестественным, то пользователь сваливается в бесконечный цикл уточнений и переспросов. Устранить подобные противоречия помогают приёмы ТРИЗ — теории решения изобретательских задач. Вот только есть проблема: эти приёмы были сформулированы для решения инженерных задач, поэтому их использование в дизайне выглядит неуместным — как можно сделать бота пористым, изменить его агрегатное состояние или привести в колебательное движение? Меня зовут Кирилл Богатов, я дизайнер разговорных продуктов в KODE. В этой статье я на примерах покажу, как адаптировал ТРИЗ для работы над голосовым навыком для Алисы. Материал будет полезен дизайнерам и любителям мозговых штурмов.

https://habr.com/ru/articles/776208/

#голосовое_управление #голосовой_помощник #голосовые_интерфейсы #голосовые_ассистенты #голосовой_ассистент #голосовой_поиск #vui #vuiдизайн #дизайн_интерфейсов

ТРИЗ в разговорном дизайне: как находить оптимальные решения при проектировании сложных сценариев

Я проектирую сценарии голосовых помощников и периодически сталкиваюсь с нетривиальными проблемами. Их решение часто связано с издержками — то диалог получается слишком длинным, то ответ становится...

Хабр