新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin)

아이디어 제안: Qwen3-TTS로 다양한 목소리를 생성한 뒤 SBV2로 학습시키면 안정적인 실시간 음성 합성 구현이 더 쉬워질 수 있다는 관찰과 제안입니다. Qwen3-TTS와 SBV2를 조합한 실시간 TTS 파이프라인 가능성에 대한 실무적 제언입니다.

https://x.com/kiyoshi_shin/status/2024098451399598556

#qwen3tts #sbv2 #tts #realtime #voicesynthesis

新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) on X

このアイデアいいですね。そうかQwen3-TTSで声をいろいろ作って、SBV2で学習させれば安定したリアルタイム音声を作りやすくなるのか。

X (formerly Twitter)

うみゆき@AI研究 (@umiyuki_ai)

Qwen3TTS의 추론(inference)을 C++로 구현 중이라는 정보. 작성자는 PyTorch 구현과 비교해 C++ 버전이 생성 속도가 3배 이상 빠르다고 전하며, TTS 추론 성능 개선 가능성을 시사함.

https://x.com/umiyuki_ai/status/2022906672235319657

#qwen3tts #tts #cpp #pytorch #inference

うみゆき@AI研究 (@umiyuki_ai) on X

Qwen3TTS推論をC++で実装中との事。pytorchに比べて3倍以上生成が速いらしい https://t.co/F6DKjGy78W

X (formerly Twitter)

新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin)

알리바바가 공개한 텍스트→음성 모델 'Qwen3-TTS Family'를 소개하는 내용으로, 단 4초의 레퍼런스 음성만으로도 유사한 목소리를 생성하는 놀라운 성능을 보여주며 여러 예시를 만든다고 설명함. 음성 합성·음성 클론 성능이 강조됨.

https://x.com/kiyoshi_shin/status/2023160158478828007

#qwen3tts #alibaba #tts #voiceclone #generativeaudio

新清士@(生成AI)インディゲーム開発者 (@kiyoshi_shin) on X

わずか4秒の音声からクローン完成 音声生成AIの実力が想像以上だった アリババが公開したテキストを音声に変換するためのモデル「Qwen3-TTS Family」をご紹介します。4秒のリファレンス音声があれば、似た声が作れるという凄まじい性能です。様々な作例を作りました。 https://t.co/KelE12vLxv

X (formerly Twitter)

Qwen3-TTS, 3초 클립으로 목소리를 복제하는 오픈소스 TTS

Alibaba Qwen 팀의 Qwen3-TTS, 3초 음성 샘플로 목소리 복제하고 97ms 만에 첫 응답을 생성하는 초저지연 멀티링구얼 TTS 모델을 소개합니다.

https://aisparkup.com/posts/8918

就中英混合的文字生成语音,还是vibevoice好,qwen3-tts这点上简直就是婴儿级别的,根本没法用。

#tts #vibevoice #qwentts #qwen #qwen3 #qwen3tts

Github Awesome (@GithubAwesome)

Voicebox는 데스크톱용 음성 클로닝 및 음성 합성 애플리케이션으로, 몇 초 분량의 오디오만으로 Qwen3-TTS 등 모델을 활용해 목소리를 복제합니다. 생성된 음성 클립을 타임라인에 배치해 드래그·레이어링·편집할 수 있어 오디오 편집 워크플로에 바로 통합 가능한 도구입니다.

https://x.com/GithubAwesome/status/2018150445085249935

#voicecloning #tts #speechsynthesis #audioediting #qwen3tts

Github Awesome (@GithubAwesome) on X

Voicebox is a desktop app for voice cloning and speech synthesis. Feed it a few seconds of audio and it clones the voice using models like Qwen3-TTS. Then you arrange the generated speech on a timeline — drag clips around, layer different voices, edit the output like you would in

X (formerly Twitter)

Новые LLM из Китая, бесплатный аналог Suno, ИИ-собеседник от Nvidia и признание Альтмана о текстах в GPT

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Неделя выдалась насыщенной: куча мощнейших релизов из Китая, которые наступают на пятки GPT-5.2 и Gemini 3. Реалтайм инструменты от Krea и NVIDIA, генеративные модели от Qwen и Hunyuan, а Сэм Альтман честно признал, что OpenAI испортили тексты в последних версиях GPT. Всё самое важное — в одном месте. Поехали! Читать дайджест →

https://habr.com/ru/companies/timeweb/articles/990420/

#нейросети #ии #krea #qwen #qwen3tts #texttospeech #alibaba #baidu #ernie #timeweb_дайджест

Новые LLM из Китая, бесплатный аналог Suno, ИИ-собеседник от Nvidia и признание Альтмана о текстах в GPT

Привет, это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.  Меня зовут Вандер , и каждую неделю я обозреваю новости о...

Хабр

nefuron (@nefuron_23)

Qwen3-tts로 여러 캐릭터(오네상, 코바야시, 내레이터)의 대화를 약 3분 분량으로 생성해 본 테스트 공유입니다. 억양·액센트 문제는 있으나 로컬에서 다인 캐릭터 대사를 생성할 수 있는 점을 강조하며, 생성 시간은 길이보다 약간 짧았다고 언급합니다.

https://x.com/nefuron_23/status/2016116209926984167

#qwen3tts #tts #comfyui #speechsynthesis

nefuron (@nefuron_23) on X

Qwen3-ttsで複数キャラクターの会話(dialogue)テスト。長さは3分程で、登場人物はお姉さん、小林、ナレーターの3名。アクセントやイントネーションの問題は有るけれど、これがローカルで作れるのは凄い!生成時間は長さより少し短いぐらいかな #Qwen3TTS #comfyui

X (formerly Twitter)

Qwen (@Alibaba_Qwen)

Qwen3-TTS에 대한 업데이트로 스트리밍 추론 지원을 위해 vLLM 프로젝트와 협력 중이라는 공지입니다. 실시간 스트리밍 방식의 추론을 활성화해 매끄러운 실시간 음성 합성 경험을 제공하려는 계획을 밝히며, 음성 톤 일관성 등 품질 관련 개선도 언급되고 있습니다.

https://x.com/Alibaba_Qwen/status/2015073927564025899

#qwen3tts #vllm #tts #speechsynthesis

Qwen (@Alibaba_Qwen) on X

We’ve been getting lots of questions about Qwen3-TTS—here’s a quick update! 🎙️ 1️⃣ Streaming support? We’re working with @vllm_project to enable streaming inference—huge thanks to vLLM team! Stay tuned for a smooth, real-time experience soon. 2️⃣ Consistent voice tone? Use

X (formerly Twitter)

Qwen3-TTS ra mắt với độ trễ siêu thấp chỉ 97ms, hỗ trợ nhân bản giọng nói và API tương thích OpenAI. Công nghệ tổng hợp giọng nói tiên tiến, lý tưởng cho ứng dụng thời gian thực. #Qwen3TTS #VoiceSynthesis #AI #TextToSpeech #TríTuệNhânTạo #TTS #OpenAI

https://www.reddit.com/r/ollama/comments/1qlzbwk/release_qwen3tts_ultralow_latency_97ms_voice/