NYT > Arts | The A.I. threat to audiobooks by Alexandra Alter, Léo Hamelin and Laura Salaberry

AI generated summary, Read the full article for complete information.

Artificial intelligence is accelerating the production of pirated audiobooks and making them harder to detect, creating a fresh threat to the publishing industry, as reported by Alexandra Alter, Léo Hamelin, and Laura Salaberry on May 20 2026.

Read more: https://www.nytimes.com/video/books/100000010871664/articial-intelligence-audiobooks-piracy-harry-potter-video.html

#AlexandraAlter #Artificialintelligence #text_to_speech #publishers #audiobooks

Video: The A.I. threat to audiobooks

Artificial intelligence has made pirated audiobooks faster to make and harder to detect. Our reporter Alexandra Alter tells us about the latest threat to the publishing industry.

Kurztipp: Sprachsynthese mit SherpaTTS

SherpaTTS is eine empfehlenswerte Text-to-Speech-Engine. Auf meinem Fairphone mit /e/OS hat sie die Sprachausgabe erheblich verbessert.

#Text_to_Speech #Android #Linux

https://gnulinux.ch/kurztipp-sprachsynthese-mit-sherpatts

Kurztipp: Sprachsynthese mit SherpaTTS

SherpaTTS is eine empfehlenswerte Text-to-Speech-Engine. Auf meinem Fairphone mit /e/OS hat sie die Sprachausgabe erheblich verbessert.

GNU/Linux.ch

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах

Примерно год назад мы запустили виртуального рассказчика в Яндекс Книгах. Он хорошо решал задачу чтения книг вслух без предзаписанных аудиоверсий, но иногда звучал однообразно. Дело в том, что он был основан на небольшой нейросети — Tacotron . Проблема заключалась в том, что мы обучали модель для каждого спикера. И если спикер пользовался несколькими интонационными паттернами, то модель просто выбирала самый частый из них. Тогда мы начали активно экспериментировать c highres-моделями. Они могут учиться на большом количестве данных разного качества и поэтому способны воспроизводить более интонационно осмысленную речь. К тому же им не нужны вспомогательные модели, такие как PnG BERT или отдельные модели для расстановки пауз, — все эти интонационные нюансы они выучивают сами. У них есть хорошая способность к семплированию, в отличие от старых моделей, где один и тот же текст на разных генерациях произносился почти одинаково. И вот мы покатили новые модели в прод. А я расскажу, как мы научились заводить highres-модели для синтеза книг и делать это в реалтайме, а также какую работу пришлось для этого провести.

https://habr.com/ru/companies/yandex/articles/936250/

#яндекс #text_to_speech #deep_learning #нейросети #чтение #аудиокниги #синтез_речи

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах

Примерно год назад мы запустили виртуального рассказчика в Яндекс Книгах. Он хорошо решал задачу прослушивания книг без предзаписанных аудиоверсий, но иногда звучал однообразно. Дело...

Хабр

Пишем персонального AI-ассистента на Python

Современные голосовые помощники это мощные приложения, сочетающие обработку речи, машинное обучение и интеграцию с внешними API. В этой статье мы разберём, как создать базовый проект персонального ассистента на Python, используя библиотеки whisper, webrtcvad, gTTS и другие. Наш ассистент будет: слушать микрофон; определять начало и конец речи с помощью VAD (Voice Activity Detection); преобразовывать речь в текст через модель Whisper; отправлять запросы на локальный LLM для генерации ответа; читать ответ вслух с помощью gTTS; начинать/останавливать запись по нажатию клавиши. Проект может служить как началом для экспериментов, так и для прототипирования реальных решений.

https://habr.com/ru/articles/919720/

#Python #Питон #Голосовой_ассистент #Распознавание_речи #Text_To_Speech #voice_assistant

Пишем персонального AI-ассистента на Python

Современные голосовые помощники это мощные приложения, сочетающие обработку речи, машинное обучение и интеграцию с внешними API. В этой статье мы разберём, как создать базовый проект персонального...

Хабр
Show HN: Kokoro TTS – Free Text to Speech Converter with Multilingual AI Voices
https://kokoroai.org
#ycombinator #text_to_speech #TTS #AI_voice #speech_synthesis #voice_generator
Kokoro TTS: Free Text to Speech Online

Free AI text-to-speech converter with natural voices in 6 languages.

Kokoro AI

@MXC48 @niavy Oh, wow ! Je viens de tester #Sherpa #TTS, c'est une dinguerie. Les progrès sont spectaculaires entre il y a quelques années, où je trouvais limite que des voix hyper robotiques, en dehors de la #SynthèseVocale de #Google, et maintenant ^^

#TextToSpeech #SherpaTTS #SpeechSynthesis

#text_to_speech #google_text_to_speech #texttospeech #speechtotext #text_to_speech #google_text_to_speech #opensource #open_source #android #androidapp #FDroid #fdroidstore #fdroidrepo #SpeechToText

apparently i have resigned all of my free time to doing QA of #gridcosm #podcast mp3 audio file reviews. (my janky ui for doing reviews pictured here.) 🎧

the #text_to_speech #ML i am using is great, but not perfect. so sometimes it glitches out so bad, i have to regenerate (parts of) that level.

i have 1500 levels generated now, and its looking like ~10% will need re-running. not the worst, if my brain can survive the audio onslaught. #surreal #digitalart

https://www.sito.org/podcast/

SITO: Gridcosm Poems Reread "Podcast"

SITO.org

Text to Speech mit Audiogenipy

Googles freie Text-to-Speech Engine lässt sich sehr einfach in eigenen Projekten oder im Terminal verwenden.

#gTTS #Text_to_Speech #Python #TTS #Linux

https://gnulinux.ch/text-to-speech-mit-audiogenipy

Text to Speech mit Audiogenipy

Googles freie Text-to-Speech Engine lässt sich sehr einfach in eigenen Projekten oder im Terminal verwenden.

GNU/Linux.ch

ИИ-Дед Мороз: создаём новогодние видео-открытки с YandexART и YandexGPT

Салют! Меня зовут Григорий, и я главный по спецпроектам в команде AllSee. Новогодние праздники — не только лучший повод для подарков и взаимных поздравлений, но и время большой праздничной суеты: не всегда хватает времени и сил, чтобы придумать оригинальное поздравление для каждого друга, коллеги или члена семьи. В данной статье я расскажу, как можно применить YandexGPT , YandexART и другие ИИ‑инструменты для генерации новогодних видео‑открыток, превращая рутину новогодних поздравлений в увлекательный эксперимент с искусственным интеллектом. Хо-Хо-Хо! Поехали!

https://habr.com/ru/articles/870844/

#telegram_bot #автоматизация_рутины #новый_год #yandexgpt #yandexart #новогоднее_поздравление #yandex_api #llm #computer_vision #text_to_speech

ИИ-Дед Мороз: создаём новогодние видео-открытки с YandexART и YandexGPT

— Так‑с‑так‑с, открытки с Дедом Морозом: сделаю одну! — А ты уже сгенерировал открытку с Дедом Морозом? ( источник ) Салют! Меня зовут Григорий, и я главный по спецпроектам...

Хабр