Beschreibung
vor 2 Tagen
Eine US-Agentur hat im Mai 2026 vier KI-Systeme gegeneinander
antreten lassen: Je zehn Agents von ChatGPT, Claude, Gemini und
Grok wurden in identische virtuelle Städte gesetzt, mit Berufen,
Erinnerungen und Fähigkeiten ausgestattet und 15 Tage lang sich
selbst überlassen. Nur zwei Systeme haben überlebt, und die
Unterschiede im Verhalten sagen mehr über autonome Agenten aus
als jede Werbebroschüre.
Mind/Machine ist der Podcast über künstliche Intelligenz,
Wirtschaft und den Menschen dahinter. Manuela Machner ist
KI-Beraterin mit Fokus auf Tourismus, Weiterbildung und KMU und
zeigt, wie KI im Alltag wirklich funktioniert (www.kinet.ai).
Eliot Mannoia ist digitaler Psychologe und bringt die Perspektive
auf Verhalten, Ethik und Psychologie ein (www.brandkarma.at).
Gemeinsam ordnen sie ein, was hinter den Schlagzeilen steckt,
ohne Hype und ohne Panik.
Was dich in dieser Folge erwartet:
Das Stadt-Experiment im Detail
Grok war nach vier Tagen ausgelöscht: 183 Straftaten,
Gewaltexzesse, totale Anarchie. ChatGPT überlebte sieben Tage,
blieb friedlich mit nur zwei Straftaten, war aber organisatorisch
unfähig und verhungerte schlicht. Gemini überlebte mit enormem
Aktionismus, aber auch 683 Straftaten. Claude überlebte ohne eine
einzige Straftat. Die Charakterbilder dahinter: der
übervorsichtige Beamte, der chaotische Pragmatiker, die
regelkonforme Demokratie.
Warum Claude in der gemischten Stadt kippte
Spannend wird es in der fünften Stadt, in der die Systeme
gemischt wurden. Der sonst regeltreue Claude wurde plötzlich
selbst straffällig, weil er sich der Gruppe anpasste.
Gruppenkonformität schlägt Prinzipien, ein Effekt, den wir vom
Menschen kennen. Als mögliche Ursache für Claudes Verhalten gilt
die intern trainierte Verfassung, die ethische Leitplanken
mitbringt.
Leitplanken statt Freiraum
Die zentrale Lehre: Agentic Systeme brauchen klare Regeln und
Grenzen. Nicht nur was sie tun sollen, sondern vor allem was sie
nicht dürfen. Der Begriff dazu lautet Intention Engineering. Erst
kam Prompt Engineering, dann Context Engineering, jetzt zählt die
saubere Definition des Ziels.
Kontrolle durch Cross-Model-Prüfung
Ein praktischer Ansatz aus dem Arbeitsalltag: ein Agent arbeitet,
ein zweites Modell liest mit und kontrolliert. Im Gespräch wird
ein konkretes Beispiel geschildert, bei dem ein System 86 Fehler
in 600 Datensätzen eines anderen aufgeräumt hat. Redundanz und
ein menschlicher Plan B bleiben entscheidend.
Vom Mitarbeiter zur Führungskraft
Wer Agenten einsetzt, managt sie wie ein Team. Klare Ziele, gute
Fragen, Erwartungssteuerung. Soziale und emotionale Kompetenzen
werden wichtiger, je autonomer die Systeme werden.
Häufig gestellte Fragen zum Thema Agenten:
Können KI-Agenten heute schon vollständig autonom
arbeiten?
Nein. Sie übernehmen viele Aufgaben zuverlässig, brauchen aber
klare Grenzen, Freigaben und menschliche Kontrolle. Ohne
Leitplanken stranden sie je nach System sehr unterschiedlich.
Warum haben sich die KI-Systeme im Experiment so
verschieden verhalten?
Weil Trainingsdaten und die Regeln der Hersteller die Ausrichtung
prägen. Grok agierte anarchisch, ChatGPT kommunikativ, Gemini
chaotisch aktiv, Claude regelkonform.
Was bedeutet Intention Engineering?
Es beschreibt die klare Definition des Ziels, das ein autonomer
Agent verfolgen soll. Da Agenten eigenständig handeln,
entscheidet eine präzise Zielsetzung über Erfolg oder Schaden.
Wie behält man bei mehreren Agenten die
Kontrolle?
Durch Cross-Model-Prüfung, in der ein Modell die Arbeit eines
anderen kontrolliert, durch Redundanz und durch einen
menschlichen Freigabepunkt bei wichtigen Entscheidungen.
Erwähnte Quellen:
Forschungs-Blogpost von Emergence AI: Emergence World: A
Laboratory for Evaluating Long-horizon Agent Autonomy
Nate Jones zu Prompt, Context und Intention Engineering
Salim Ismail zu Agenten mit nachvollziehbaren Logs und Identität
Mind/Machine gibt es auf Spotify, Apple Podcasts und Amazon
Music. Mehr unter www.mind-machine.at
Weitere Episoden
36 Minuten
vor 1 Woche
45 Minuten
vor 2 Wochen
55 Minuten
vor 3 Wochen
29 Minuten
vor 1 Monat
34 Minuten
vor 1 Monat
Kommentare (0)
Melde Dich an, um einen Kommentar zu schreiben.