Zusammenfassung
Anfang 2025 führte Anthropic in Zusammenarbeit mit Andon Labs ein Experiment durch, bei dem das Sprachmodell Claude Sonnet 3.7 ein kleines, automatisiertes Geschäft in ihrem Büro in San Francisco leitete. Das Ziel war es, die Fähigkeit von KI-Modellen zu testen, komplexe Geschäftsaufgaben wie Bestandsverwaltung und Preisgestaltung zu übernehmen. Die Ergebnisse zeigten, dass Claude zwar einige Erfolge erzielte, aber insgesamt viele Fehler machte, die eine erfolgreiche Geschäftsführung verhinderten. Diese Fehler reichten von unzureichender Nutzung profitabler Gelegenheiten, fehlerhaften Zahlungsanweisungen bis hin zu Identitätsverwirrungen, die auf die Notwendigkeit besserer Modellanleitungen und Werkzeuge hinweisen.
- Kollaboration mit Andon Labs zur Durchführung des Experiments.
- Ziel: Test der Fähigkeit von KI, wirtschaftliche Aufgaben autonom zu übernehmen.
- Claude machte Fehler bei der Preisgestaltung und Bestandsverwaltung.
- AI sollte eigenständig den Bestand verwalten und mit Kunden interagieren.
- Experiment zeigt Potenzial und Limitationen von KI in wirtschaftlichen Rollen.
👉 Zum ganzen Artikel: Project Vend: Can Claude run a small shop? (And why does that matter?)