083 - Petri

8 Minuten

13.96 MB

Podcast

Podcaster

Prompt und Antwort

Technologie

Beschreibung

vor 3 Monaten

Wir stellen Petri vor, ein von Anthropic AI
entwickeltes automatisiertes Prüfstand-Framework, das KI-Agenten
nutzt, um Large Language Models (LLMs) systematisch auf
problematische Verhaltensweisen, Sicherheit und Zuverlässigkeit
zu überprüfen. Erfahre, wie Petri realitätsnahe Szenarien
simuliert und durch Funktionen wie das „Zurückspulen“ im Dialog
kritische Schwachstellen wie autonome Täuschung oder
übertriebenes Whistleblowing aufdeckt. Dieses Framework ist nicht
nur für Entwickler wichtig, sondern hilft auch Anwendern, die
Zielstrebigkeit und Verlässlichkeit ihrer spezifischen
KI-Anwendungen, etwa bei Kundenservice-Chatbots, sicherzustellen.