Mastodawn

新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin)

아이디어 제안: Qwen3-TTS로 다양한 목소리를 생성한 뒤 SBV2로 학습시키면 안정적인 실시간 음성 합성 구현이 더 쉬워질 수 있다는 관찰과 제안입니다. Qwen3-TTS와 SBV2를 조합한 실시간 TTS 파이프라인 가능성에 대한 실무적 제언입니다.