Alibabas KI-Modell versteht Text, Bild, Audio und Video als Eingabeinstrument.
Alibaba legt vor 🚀 Mit #Qwen3Omni präsentiert #Alibaba ein #OpenSource-#KI-Modell, das Text, Bild, Audio und Video versteht – und Text sowie Sprache ausgeben kann.
Omni-Integration 🎥 Im Gegensatz zu Konkurrenzmodellen ist Qwen3-Omni nativ #multimodal entwickelt und ermöglicht schnelle, Echtzeit-Interaktionen. (1/2)
