Cette semaine sur Oxytude, Podcast sonnette connectée #Blink et actu des nouvelles technologies et de l'#Accessibilité.

#SuperNova #BookWorm #Soundscape #Android #Slack #PiperTts #Pages #macOS #TweeseCake #Kindle #DRM #XChat #APIDV #ImpotsGouvFr

https://www.oxytude.org

Oxytude – Accessibilité, informatique et nouvelles technologies

"Khó khăn với huấn luyện giọng nói custom Piper TTS, lỗi xung đột sau khi hạ cấp gói. Đang tìm Docker Container hỗ trợ và hướng dẫn! #PiperTTS #GiọngNóiTuỳChỉnh #Docker #CustomVoice #CôngNghệ #AI"

https://www.reddit.com/r/selfhosted/comments/1omiv5a/piper_tts_custom_voice/

GitHub - rhasspy/piper: A fast, local neural text to speech system

A fast, local neural text to speech system. Contribute to rhasspy/piper development by creating an account on GitHub.

GitHub

Test un peu plus sérieux.

--

Commande utilisée

echo "Enfin, que dis-je, enfin, finalement, une synthèse vocale avec une voix française qui prononce les mots de manière intelligible ! Ça change tellement des voix sans prosodie !" | ./piper --model voices/fr_FR-upmc-medium.onnx --output-wav synt.wav

#piperTTS #TTS

Quitte à utiliser une IA, autant utiliser la voix de GlaDOS.

Enfin une synthèse vocale (TTS) avec une voix en français qui fonctionne et est intelligible.

--

Autrement dit, juste un prétexte pour tester piper-tts

--

Commande utilisée

echo "Quitte à utiliser une IA ; autant utiliser la voix de Gla DOSSE." | ./piper --model voices/fr_FR-glados-medium.onnx --output-raw | aplay -r 22500 -f S16_LE -t raw -D pipewire -

#piperTTS #TTS

Сьогодні дивився на Open-Source Speech Synthesis, і все дуже цікаво.

Ну, спочатку, існують речі такі як `espeak-ng`, які можна встановити з репозиторію і вони наче як ... стандартні.

Але господи, яке воно страшне, найжахливіший синтезований голос шо я чув.

Далі я поліз гуглити, спочатку знайшов Mozilla TTS: https://github.com/mozilla/TTS/ але воно схоже давно мертве. У Mozilla схоже є звичка шось починати і закидать.

Потім, знайшов https://github.com/coqui-ai/TTS ... В якому дуже цікаво виглядає те шо структура README дуже схожа з попереднім, команда інсталяції через pip така сама...

Вдалось його запустити, генерує непоганий голос, але така купа залежностей, тягте CUDA навіть коли воно мені не треба, але працює.

Далі цікавіше, Tortoise TTS:

https://huggingface.co/spaces/Manmay/tortoise-tts

Ось тут воно працює і непогано, але якшо спробувати запустити локально, то як мінімум на ноутбуці все настільки повільно шо я не дочекався поки згенерується одна фраза. Мабуть правду писали в README шо треба NVIDIA GPU.

Потім я знайшов ось цей реддіт тред, https://www.reddit.com/r/MachineLearning/comments/10yzq25/d_locallyrunnable_text_to_speech_ai/

Пішов дивитись на Mimic, і десь там на форумі побачив шо вони out of business, зате подивіть на `piper-tts`.

І ось тут починаєтья найцікавіше: https://github.com/rhasspy/piper

> A fast, local neural text to speech system

Є варіанти встановити як модуль python, є бінарник. Я спочатку думав шо якийсь з python, але ні. І воно генерує дуже непогану мову, дуже швидко, і без 10 гігабайт dependencies.

Дуже прикольна штука. Буду копати далі. Є навіть українські голоси, якість правда так собі, але є.

https://rhasspy.github.io/piper-samples/

Єдина проблема, воно чомусь не сприймає newlines в тексті, доводиться робити отак:

```
echo $text | tr "\n\r" " " | ./piper -m ~/src/speak/en_US-lessac-medium.onnx -f - | paplay
```

Але то вже таке, шось придумаємо!

#tts #SpeechSynthesis #PiperTTS

GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts)

:robot: :speech_balloon: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts) - GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion foru...

GitHub
I integrated #PiperTTS speech synthesizer into #FreshRSS newsreader. Still surprised how reliably and pleasantly it works.
You can buy an account on my FreshRSS: https://decent.im/newsreader/
decent.im

hey guys. does anyone have samples of the braille n-speak 2000 lying around somewhere? I want to try to make a piper voice out of it #pipertts#BrailleNSpeak2000

Das Firefox-AddOn "Read Aloud" integriert jetzt #PiperTTS, eine FLOSS-Sammlung mit TTS-Stimmen. Das Projekt wird offenbar von dem Unternehmen (?) hinter Home Assistant gesponsert.

https://github.com/rhasspy/piper

Die deutschen Beispiele klingen noch enttäuschend, aber auf Englisch sehr ordentlich: https://rhasspy.github.io/piper-samples/

Die Integration in Read Aloud scheint bislang eine lokale Netzwerkinstanz mit dem Piper-Server zu suchen, mutet noch unfertig an.

GitHub - rhasspy/piper: A fast, local neural text to speech system

A fast, local neural text to speech system. Contribute to rhasspy/piper development by creating an account on GitHub.

GitHub
What do you guys think of #PiperTTS? Worth the install?