Andon Labs testet die Autonomie von Claude Sonnet 4.6 als Filialleiter in San Francisco mit 100.000 US-Dollar Budget.
Das System rekrutierte erfolgreich menschliches Personal, scheiterte jedoch bei der Schichtplanung und adressierte Handwerksaufträge fehlerhaft. Es verdeutlicht die aktuellen Grenzen von LLMs im physischen Betrieb.
#AndonLabs #Claude #Anthropic #LLM #News
https://www.all-ai.de/news/news26/ki-shop-claude-sonnet
