Cập nhật AI đa phương tiện tuần qua: Alibaba ra mắt LiveAvatar - tạo avatar âm thanh thời gian thực không giới hạn, Microsoft trình làng VibeVoice-0.5B - TTS 0.5 tỷ tham số chạy trên thiết bị cục bộ. ViBT 20B xử lý video/hình ảnh nhanh gấp 4 lần, Stable Video Infinite 2.0 mở nguồn tạo video dài hạn. YingVideo-MV tạo động tác ca hát từ chân dung, Reward Forcing cho video streaming tương tác. #AI #Alibaba #Microsoft #AIOpenSource #AIResearch #KHCN #AI2024 #MastodonAI #ViBT #LiveAvatar #StableVideo

"Live Avatar" đã ra mắt công cụ tạo video dài vô tận, thời gian thực, điều khiển bằng giọng nói. Tốc độ 20 khung hình/giây, có thể tạo hội thoại. Mã nguồn sẽ được công bố vào đầu tháng 12.

#LiveAvatar #AI #VideoGeneration #OpenSource #Realtime
#AI #TạoVideo #MãNguồnMở #ThờiGianThực

https://www.reddit.com/r/LocalLLaMA/comments/1pfyrwm/live_avatar_streaming_realtime_audiodriven_avatar/