Ever wanted #openclaw 🦞 to make phone calls? 📲
Now you can: https://codingjoe.dev/VoIP/mcp/

#voip #python #sip #tts #stt #vibe #vibecoding #voice #vibevoice

MCP Server - Python VoIP

Ah, #Microsoft, bravely charging into the open-source #AI frontier like a digital Don Quixote tilting at windmills of relevance. 🤖💡 Meanwhile, #GitHub users everywhere are left wondering if "VibeVoice" is the next big thing or just another buzzword salad pretending to be #innovation. 🥗📈
https://github.com/microsoft/VibeVoice #OpenSource #VibeVoice #HackerNews #ngated
GitHub - microsoft/VibeVoice: Open-Source Frontier Voice AI

Open-Source Frontier Voice AI. Contribute to microsoft/VibeVoice development by creating an account on GitHub.

GitHub
GitHub - microsoft/VibeVoice: Open-Source Frontier Voice AI

Open-Source Frontier Voice AI. Contribute to microsoft/VibeVoice development by creating an account on GitHub.

GitHub

就中英混合的文字生成语音,还是vibevoice好,qwen3-tts这点上简直就是婴儿级别的,根本没法用。

#tts #vibevoice #qwentts #qwen #qwen3 #qwen3tts

멀티 에이전트 오케스트레이션 실전: Microsoft Agent Framework로 만드는 AI 팟캐스트 스튜디오

Microsoft가 공개한 멀티 에이전트 시스템으로 팟캐스트를 완전 자동 제작합니다. 로컬 AI 모델과 Agent Framework를 활용한 실전 사례를 소개합니다.

https://aisparkup.com/posts/8717

Người dùng thử VibeVoice 7B (4‑bit) trên Mac M3 Pro 36 GB, thời gian sinh âm thanh rất chậm: 560 s cho 6.5 s audio (RTF ≈ 85x). Model 1.5B nhanh hơn, hỏi liệu có thể tối ưu hơn với MPS không? #VibeVoice #AI #Mac #M3Pro #TríTuệNhânTạo #DeepLearning

https://www.reddit.com/r/LocalLLaMA/comments/1qk1tlx/vibevoice_large_on_mac/

VibeVoice LoRA đang trở thành công cụ TTS mạnh mẽ. Với trainer từ repo VibeVoice‑finetuning, đặt --voice_prompt_drop_rate=1 và gradient accumulation≈4, chỉ 15‑30 phút đã có checkpoint khả dụng. LoRA loại bỏ nhạc ngẫu nhiên, giảm cắt từ cuối, tránh rò rỉ prompt và giảm lỗi từ, sánh ngang 7B model. Dùng Gradio demo (--checkpoint_path) hoặc tích hợp vào tts‑audiobook‑tool; CFG≈3 cho âm thanh ổn định. Mẫu LoRA công cộng (klett) đã được chia sẻ. #AI #TTS #VibeVoice #LoRA #MachineLearning #TríTuệNhânT

🗣️ #Microsoft ha reso open-source #VibeVoice, un sistema di text-to-speech in tempo reale.
👉 I dettagli: https://www.linkedin.com/posts/alessiopomaro_tts-microsoft-vibevoice-activity-7419994276698148864-tkeu

___ 
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro

#AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM 

Người dùng đang gặp khó khăn khi huấn luyện VibeVoice LoRA, không rõ về các thành phần như 'diffusion-head', 'acoustic connector' và 'semantic connector'. Dù một extension ComfyUI nói 'adapter config' và 'adapter model' là đủ, ChatGPT lại nhấn mạnh 'diffusion-head' rất quan trọng. Người dùng cũng thắc mắc về sự cần thiết của LoRA cho nhân bản giọng nói khi model 7b với 30 giây âm thanh đã cho kết quả tốt.

#VibeVoice #LoRA #AI #MachineLearning #VoiceCloning #HuấnLuyệnAI #NhânBảnGiọngNói

https:/

Tác giả tìm kiếm phiên bản lượng tử hóa của VibeVoice-7B cho dịch vụ đọc sách ebook, lưu ý mô hình này cần 18.3GB VRAM và tốt hơn Chatterbox trong trường hợp cụ thể. Xin chỉ dẫn về lượng tử hóa hoặc liên kết nguồn. #AI #MachineLearning #VibeVoice #HỗTrợAI #CôngNghệMới

https://www.reddit.com/r/LocalLLaMA/comments/1pp21lx/quantized_vibevoice7b/