Cette semaine sur Oxytude, Podcast sonnette connectée #Blink et actu des nouvelles technologies et de l'#Accessibilité.
#SuperNova #BookWorm #Soundscape #Android #Slack #PiperTts #Pages #macOS #TweeseCake #Kindle #DRM #XChat #APIDV #ImpotsGouvFr
Cette semaine sur Oxytude, Podcast sonnette connectée #Blink et actu des nouvelles technologies et de l'#Accessibilité.
#SuperNova #BookWorm #Soundscape #Android #Slack #PiperTts #Pages #macOS #TweeseCake #Kindle #DRM #XChat #APIDV #ImpotsGouvFr
"Khó khăn với huấn luyện giọng nói custom Piper TTS, lỗi xung đột sau khi hạ cấp gói. Đang tìm Docker Container hỗ trợ và hướng dẫn! #PiperTTS #GiọngNóiTuỳChỉnh #Docker #CustomVoice #CôngNghệ #AI"
https://www.reddit.com/r/selfhosted/comments/1omiv5a/piper_tts_custom_voice/
Piper-TTS :
https://github.com/rhasspy/piper
Voix style GlaDOS :
Test un peu plus sérieux.
--
Commande utilisée
echo "Enfin, que dis-je, enfin, finalement, une synthèse vocale avec une voix française qui prononce les mots de manière intelligible ! Ça change tellement des voix sans prosodie !" | ./piper --model voices/fr_FR-upmc-medium.onnx --output-wav synt.wav
Quitte à utiliser une IA, autant utiliser la voix de GlaDOS.
Enfin une synthèse vocale (TTS) avec une voix en français qui fonctionne et est intelligible.
--
Autrement dit, juste un prétexte pour tester piper-tts
--
Commande utilisée
echo "Quitte à utiliser une IA ; autant utiliser la voix de Gla DOSSE." | ./piper --model voices/fr_FR-glados-medium.onnx --output-raw | aplay -r 22500 -f S16_LE -t raw -D pipewire -
Сьогодні дивився на Open-Source Speech Synthesis, і все дуже цікаво.
Ну, спочатку, існують речі такі як `espeak-ng`, які можна встановити з репозиторію і вони наче як ... стандартні.
Але господи, яке воно страшне, найжахливіший синтезований голос шо я чув.
Далі я поліз гуглити, спочатку знайшов Mozilla TTS: https://github.com/mozilla/TTS/ але воно схоже давно мертве. У Mozilla схоже є звичка шось починати і закидать.
Потім, знайшов https://github.com/coqui-ai/TTS ... В якому дуже цікаво виглядає те шо структура README дуже схожа з попереднім, команда інсталяції через pip така сама...
Вдалось його запустити, генерує непоганий голос, але така купа залежностей, тягте CUDA навіть коли воно мені не треба, але працює.
Далі цікавіше, Tortoise TTS:
https://huggingface.co/spaces/Manmay/tortoise-tts
Ось тут воно працює і непогано, але якшо спробувати запустити локально, то як мінімум на ноутбуці все настільки повільно шо я не дочекався поки згенерується одна фраза. Мабуть правду писали в README шо треба NVIDIA GPU.
Потім я знайшов ось цей реддіт тред, https://www.reddit.com/r/MachineLearning/comments/10yzq25/d_locallyrunnable_text_to_speech_ai/
Пішов дивитись на Mimic, і десь там на форумі побачив шо вони out of business, зате подивіть на `piper-tts`.
І ось тут починаєтья найцікавіше: https://github.com/rhasspy/piper
> A fast, local neural text to speech system
Є варіанти встановити як модуль python, є бінарник. Я спочатку думав шо якийсь з python, але ні. І воно генерує дуже непогану мову, дуже швидко, і без 10 гігабайт dependencies.
Дуже прикольна штука. Буду копати далі. Є навіть українські голоси, якість правда так собі, але є.
https://rhasspy.github.io/piper-samples/
Єдина проблема, воно чомусь не сприймає newlines в тексті, доводиться робити отак:
```
echo $text | tr "\n\r" " " | ./piper -m ~/src/speak/en_US-lessac-medium.onnx -f - | paplay
```
Але то вже таке, шось придумаємо!
:robot: :speech_balloon: Deep learning for Text to Speech (Discussion forum: https://discourse.mozilla.org/c/tts) - GitHub - mozilla/TTS: :robot: Deep learning for Text to Speech (Discussion foru...
Das Firefox-AddOn "Read Aloud" integriert jetzt #PiperTTS, eine FLOSS-Sammlung mit TTS-Stimmen. Das Projekt wird offenbar von dem Unternehmen (?) hinter Home Assistant gesponsert.
https://github.com/rhasspy/piper
Die deutschen Beispiele klingen noch enttäuschend, aber auf Englisch sehr ordentlich: https://rhasspy.github.io/piper-samples/
Die Integration in Read Aloud scheint bislang eine lokale Netzwerkinstanz mit dem Piper-Server zu suchen, mutet noch unfertig an.