RT @Alibaba_Qwen: 📣📣 Lernen Sie Qwen-AgentWorld kennen – ein natives Sprach-Weltmodell, das 7 Agent-Umgebungen (MCP, Suche, Terminal, SWE, Web, Betriebssystem, Android) in einem einzigen Modell simuliert. Die Modellierung von Umgebungen war von Anfang an das Trainingsziel, keine nachträgliche Anpassung. 🤔 LLMs werden darauf trainiert, bessere Agenten zu sein – also besser im Handeln innerhalb von Umgebungen. Doch niemand hat sie bisher darauf trainiert, die Umgebungen selbst zu modellieren. 🗺️ Unsere Roadmap: Wir untersuchen, wie die Modellierung von Sprachwelten die Grenzen der allgemeinen Agenten-Fähigkeiten erweitern kann, und zwar auf zwei Wegen: 1️⃣ Aufbau eines Grundmodells für die Umgebungs-Simulation – das auf AgentWorldBench Claude Opus 4.8 und GPT-5.4 übertrifft 2️⃣ Untersuchung, wie die Weltmodellierung das Training von Agenten verbessert: 🔬 Kontrollierbare Sim-RL (agentic RL mit LWM als Umgebungen) schlägt das Training in realen Umgebungen 🧠 Das Lernen, Umgebungen vorherzusagen (LWM-Warm-up), macht Agenten stärker – bemerkenswerterweise überträgt sich dieses prädiktive Wissen sogar ohne jegliches agentenspezifisches Fine-Tuning direkt auf agentic Aufgaben. 📑 Paper: https://arxiv.org/abs/2606.24597 📖 Blog: https://qwen.ai/blog?id=qwen-agentworld 💻 GitHub: https://github.com/QwenLM/Qwen-AgentWorld 🤗 HuggingFace: https://huggingface.co/collections/Qwen/qwen-agentworld 🧩 ModelScope: https://modelscope.cn/collections/Qwen/Qwen-AgentWorld
mehr auf Arint.info
#Agenten #KI #MaschinellesLernen #Qwen #Sprachmodelle #arint_info
https://x.com/Alibaba_Qwen/status/2069720365442719867#m