新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin)

Qwen3-ASR을 자신의 목소리로 시험한 결과를 공유한 트윗입니다. 과거 강연에서 7초를 참조음으로 잘라내어 입력하자, 아스키 기사 텍스트를 읽게 했을 때 단 7초 참조만으로도 그럴듯한 읽기 음성이 생성되었다고 보고하며, 앞부분이 참조음성(7초), 후반이 합성(25초)이라고 설명합니다.

https://x.com/kiyoshi_shin/status/2019236962520158225

#qwen3asr #asr #voicecloning #speechsynthesis

新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) on X

Qwen3-ASRを自分の声で試してみた。過去の講演から7秒を切り出し、その声を参照して、アスキー記事を読み上げさせた。わずか7秒なのに、それっぽい読み上げ音声が出来てしまうのは衝撃。最初が参照音声(7秒)、後半が読み上げ音声(25秒)。

X (formerly Twitter)