AshutoshShrivastava (@ai_for_success)

Grok이 새로운 독립형 오디오 API 2종(Grok Speech to Text, Grok Text to Speech)을 공개했다. Grok Voice, Tesla 차량, Starlink 고객지원과 동일한 스택을 기반으로 하며, 빠르고 성능이 좋다고 언급된다. 음성 입출력용 개발 도구로 활용될 수 있는 중요한 업데이트다.

https://x.com/ai_for_success/status/2045520849055420603

#grok #audioapi #speechtotext #texttospeech #xai

AshutoshShrivastava (@ai_for_success) on X

Grok has dropped new standalone audio APIs: Grok Speech to Text (STT) and Grok Text to Speech (TTS). They are built on the same stack that powers Grok Voice, Tesla vehicles, and Starlink customer support. It is really good and fast. I vibe coded an application so you can try and

X (formerly Twitter)

Google AI (@GoogleAI)

구글이 이번 주 출시 내용을 공개했습니다. Gemini 3.1 Flash TTS는 최신 텍스트-음성 변환 모델로, 네이티브 멀티스피커 대화, 향상된 제어성, 오디오 태그 지원을 통해 70개 이상 언어에서 더 자연스럽고 표현력 있는 음성을 제공합니다. Gemini Robotics-ER 1.6도 함께 언급되었습니다.

https://x.com/GoogleAI/status/2045185070001258865

#gemini #tts #texttospeech #google #ai

Google AI (@GoogleAI) on X

What a week! Here’s everything we shipped: — Gemini 3.1 Flash TTS, our latest text-to-speech model, featuring native multi-speaker dialogue and improved controllability and audio tags for more natural, expressive voices in 70+ languages — Gemini Robotics-ER 1.6 by

X (formerly Twitter)

Artificial Analysis (@ArtificialAnlys)

Fish Audio S2 Pro의 추론 속도와 가격이 공개됐다. 해당 모델은 초당 51자 생성 속도를 보이며, Fish Audio 플랫폼에서 100만 문자당 15달러에 제공된다. TTS 모델의 성능과 비용 효율성을 보여주는 업데이트다.

https://x.com/ArtificialAnlys/status/2045179335854924194

#fishaudio #tts #pricing #inference #texttospeech

Artificial Analysis (@ArtificialAnlys) on X

Fish Audio S2 Pro processes 51 characters per second of generation time at $15 per 1M characters via the Fish Audio platform.

X (formerly Twitter)

Artificial Analysis (@ArtificialAnlys)

Fish Audio가 최신 TTS 모델 S2 Pro를 공개했으며, Artificial Analysis Speech Arena Leaderboard에서 오픈 웨이트 모델 중 선두를 차지해 독점 모델과의 격차를 좁혔다. 멀티 스피커·멀티 턴 생성을 지원하는 최신 음성 합성 모델이다.

https://x.com/ArtificialAnlys/status/2045179330645639285

#texttospeech #fishaudio #speechai #openweights #tts

Artificial Analysis (@ArtificialAnlys) on X

Fish Audio S2 Pro is the new leading Open Weights model on the Artificial Analysis Speech Arena Leaderboard, closing the gap between Open Weights and Proprietary models Fish Audio S2 Pro is the latest TTS model from Fish Audio, featuring multi-speaker, multi-turn generation and

X (formerly Twitter)

Google AI Studio (@GoogleAIStudio)

Gemini 3.1 Flash의 텍스트-투-스피치 기능이 AI Studio에 추가되었습니다. 대화 앞에 태그를 넣어 말투, 속도, 억양 같은 음성 표현을 세밀하게 제어할 수 있으며, Composer에서 실험 후 코드를 내보내 바로 앱 개발에 활용할 수 있습니다.

https://x.com/GoogleAIStudio/status/2044852335848133113

#gemini #aistudio #texttospeech #tts #google

Google AI Studio (@GoogleAIStudio) on X

[pumped] gemini 3.1 flash text-to-speech just landed in ai studio. you can now trigger specific vocal delivery like pace and accent by including [tags] in front of dialogue. iterate in composer view then export the code to start building.

X (formerly Twitter)
Gemini 3.1 Flash TTS is now in preview across Gemini API, AI Studio, Vertex AI, and Google Vids, with a big focus on controllability and expressive voice output. https://aintelligencehub.com/articles/google-gemini-3-1-flash-tts-launch-april-2026?utm_source=mastodon&utm_medium=social&utm_campaign=organic_social&utm_content=google-gemini-3-1-flash-tts-launch-april-2026 #AI #TextToSpeech #Gemini #VoiceAI
Google Unveiled Gemini 3.1 Flash TTS With Better Voice Control

Google introduced Gemini 3.1 Flash TTS in preview across Gemini API, Vertex AI, and Google Vids, emphasizing improved voice quality and controllability.

Artificial Analysis (@ArtificialAnlys)

구글의 Gemini 3.1 Flash TTS가 Artificial Analysis Speech Arena 리더보드에서 2위를 기록했다. ElevenLabs의 Eleven v3보다 앞서며, 이전 구글 TTS 모델 대비 큰 성능 향상을 보여준다. 음성 합성(TTS) 분야에서 주목할 만한 신제품 발표다.

https://x.com/ArtificialAnlys/status/2044450045190418673

#google #gemini #tts #speechai #texttospeech

Artificial Analysis (@ArtificialAnlys) on X

Google’s new Gemini 3.1 Flash TTS ranks #2 on the Artificial Analysis Speech Arena Leaderboard, ahead of ElevenLabs’ Eleven v3 and only behind Inworld TTS 1.5 Max Gemini 3.1 Flash TTS represents a significant step forward for Google from previous TTS models, with notably

X (formerly Twitter)

みゅみゅ (@miyumiyuna5)

Gemini 3.1 Flash TTS 모델을 무료로 사용할 수 있다는 언급이 있다. 텍스트의 분위기를 판단해 그에 맞게 음성으로 읽어주는 기능이 특징이며, 무료 사용 횟수는 제한적이지만 새로운 TTS 모델 공개로 볼 수 있다.

https://x.com/miyumiyuna5/status/2044648047221809315

#gemini #tts #texttospeech #ai #model

みゅみゅ (@miyumiyuna5) on X

gemini-3.1-flash-ttsのモデル、無料でできた 文章みてどんな感じか判断して喋ってるのね すぐにリミットくるね。 今のとこ無料だと 10回程度使えて、その後、Delayかかりそう さくっとひっかかった You exceeded your current quota "quotaValue": "10" "retryDelay": "39s"

X (formerly Twitter)

AshutoshShrivastava (@ai_for_success)

Google이 Gemini 3.1 Flash TTS를 공개했다. AI Studio에서 바로 사용해 볼 수 있으며, 빠르게 시작할 수 있는 템플릿도 제공된다. 텍스트-음성 변환 분야의 새로운 모델 출시 소식이다.

https://x.com/ai_for_success/status/2044452516407185830

#google #gemini #tts #aistudio #texttospeech

AshutoshShrivastava (@ai_for_success) on X

GEMINI NEW MODEL ⚡️ : Google has just launched Gemini 3.1 Flash TTS. I have been testing this for quite some time. Thanks to the Gemini team for early access. You can try it on AI Studio. It is very easy to get started, and there are plenty of quick start templates to test and

X (formerly Twitter)

Zotero 9 Brings Text-to-Speech and Faster Startup

Zotero 9 adds text-to-speech for listening to PDFs, faster startup times, and better writing collaboration tools for academic work.

https://yoota.it/en/zotero-9-brings-text-to-speech-and-faster-startup/