田中義弘 | taziku CEO / AI × Creative (@taziku_co)

Parlor가 브라우저 기반 VAD, 디바이스 내 LLM과 TTS, 시각 입력까지 지원하는 로컬 우선 음성 AI 구조를 소개했다. Gemma 4 E2B와 Kokoro TTS를 사용하며 약 3GB로 동작하고 클라우드 의존성이 없어, 온디바이스 AI 애플리케이션의 유망한 사례로 보인다.

https://x.com/taziku_co/status/2041824778185797646

#parlor #ondevice #gemma #tts #vad

田中義弘 | taziku CEO / AI × Creative (@taziku_co) on X

驚いたのは精度より構成だ。 Parlorは、ブラウザでVAD、端末でLLM+TTS、 さらに視覚入力まで載せる。 ParlorはGemma 4 E2B+Kokoro TTSで 約3GB、クラウド依存ゼロ。 M3 Proで2.5〜3秒。 常時起動の会話UXが、現実になり始めている。 via:@QingQ77

X (formerly Twitter)