"Khó khăn với huấn luyện giọng nói custom Piper TTS, lỗi xung đột sau khi hạ cấp gói. Đang tìm Docker Container hỗ trợ và hướng dẫn! #PiperTTS #GiọngNóiTuỳChỉnh #Docker #CustomVoice #CôngNghệ #AI"

https://www.reddit.com/r/selfhosted/comments/1omiv5a/piper_tts_custom_voice/

GitHub - rhasspy/piper: A fast, local neural text to speech system

A fast, local neural text to speech system. Contribute to rhasspy/piper development by creating an account on GitHub.

GitHub

Test un peu plus sérieux.

--

Commande utilisée

echo "Enfin, que dis-je, enfin, finalement, une synthèse vocale avec une voix française qui prononce les mots de manière intelligible ! Ça change tellement des voix sans prosodie !" | ./piper --model voices/fr_FR-upmc-medium.onnx --output-wav synt.wav

#piperTTS #TTS

Quitte à utiliser une IA, autant utiliser la voix de GlaDOS.

Enfin une synthèse vocale (TTS) avec une voix en français qui fonctionne et est intelligible.

--

Autrement dit, juste un prétexte pour tester piper-tts

--

Commande utilisée

echo "Quitte à utiliser une IA ; autant utiliser la voix de Gla DOSSE." | ./piper --model voices/fr_FR-glados-medium.onnx --output-raw | aplay -r 22500 -f S16_LE -t raw -D pipewire -

#piperTTS #TTS

Сьогодні дивився на Open-Source Speech Synthesis, і все дуже цікаво.

Ну, спочатку, існують речі такі як `espeak-ng`, які можна встановити з репозиторію і вони наче як ... стандартні.

Але господи, яке воно страшне, найжахливіший синтезований голос шо я чув.

Далі я поліз гуглити, спочатку знайшов Mozilla TTS: https://github.com/mozilla/TTS/ але воно схоже давно мертве. У Mozilla схоже є звичка шось починати і закидать.

Потім, знайшов https://github.com/coqui-ai/TTS ... В якому дуже цікаво виглядає те шо структура README дуже схожа з попереднім, команда інсталяції через pip така сама...

Вдалось його запустити, генерує непоганий голос, але така купа залежностей, тягте CUDA навіть коли воно мені не треба, але працює.

Далі цікавіше, Tortoise TTS:

https://huggingface.co/spaces/Manmay/tortoise-tts

Ось тут воно працює і непогано, але якшо спробувати запустити локально, то як мінімум на ноутбуці все настільки повільно шо я не дочекався поки згенерується одна фраза. Мабуть правду писали в README шо треба NVIDIA GPU.

Потім я знайшов ось цей реддіт тред, https://www.reddit.com/r/MachineLearning/comments/10yzq25/d_locallyrunnable_text_to_speech_ai/

Пішов дивитись на Mimic, і десь там на форумі побачив шо вони out of business, зате подивіть на `piper-tts`.

І ось тут починаєтья найцікавіше: https://github.com/rhasspy/piper

> A fast, local neural text to speech system

Є варіанти встановити як модуль python, є бінарник. Я спочатку думав шо якийсь з python, але ні. І воно генерує дуже непогану мову, дуже швидко, і без 10 гігабайт dependencies.

Дуже прикольна штука. Буду копати далі. Є навіть українські голоси, якість правда так собі, але є.

https://rhasspy.github.io/piper-samples/

Єдина проблема, воно чомусь не сприймає newlines в тексті, доводиться робити отак:

```
echo $text | tr "\n\r" " " | ./piper -m ~/src/speak/en_US-lessac-medium.onnx -f - | paplay
```

Але то вже таке, шось придумаємо!

#tts #SpeechSynthesis #PiperTTS

GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)

:robot: :speech_balloon: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts) - GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion foru...

GitHub
I integrated #PiperTTS speech synthesizer into #FreshRSS newsreader. Still surprised how reliably and pleasantly it works.
You can buy an account on my FreshRSS: https://decent.im/newsreader/
decent.im

hey guys. does anyone have samples of the braille n-speak 2000 lying around somewhere? I want to try to make a piper voice out of it #pipertts#BrailleNSpeak2000

Das Firefox-AddOn "Read Aloud" integriert jetzt #PiperTTS, eine FLOSS-Sammlung mit TTS-Stimmen. Das Projekt wird offenbar von dem Unternehmen (?) hinter Home Assistant gesponsert.

https://github.com/rhasspy/piper

Die deutschen Beispiele klingen noch enttäuschend, aber auf Englisch sehr ordentlich: https://rhasspy.github.io/piper-samples/

Die Integration in Read Aloud scheint bislang eine lokale Netzwerkinstanz mit dem Piper-Server zu suchen, mutet noch unfertig an.

GitHub - rhasspy/piper: A fast, local neural text to speech system

A fast, local neural text to speech system. Contribute to rhasspy/piper development by creating an account on GitHub.

GitHub
What do you guys think of #PiperTTS? Worth the install?

So, I'm really starting to use #Piper voices in NVDA more. I like hfc_male (en-US) and lessac (en-US) the most. For those who use Piper also, which voices do you like?

#NVDA #PiperTTS #accessibility #blind