新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin)

아이디어 제안: Qwen3-TTS로 다양한 목소리를 생성한 뒤 SBV2로 학습시키면 안정적인 실시간 음성 합성 구현이 더 쉬워질 수 있다는 관찰과 제안입니다. Qwen3-TTS와 SBV2를 조합한 실시간 TTS 파이프라인 가능성에 대한 실무적 제언입니다.

https://x.com/kiyoshi_shin/status/2024098451399598556

#qwen3tts #sbv2 #tts #realtime #voicesynthesis

新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) on X

このアイデアいいですね。そうかQwen3-TTSで声をいろいろ作って、SBV2で学習させれば安定したリアルタイム音声を作りやすくなるのか。

X (formerly Twitter)