Podcast
Podcaster
Beschreibung
vor 4 Tagen
In dieser Episode des KI-Gilde Podcasts dreht sich alles um
PromptFoo und die systematische Evaluierung von
Large Language Models (LLMs). Statt Prompts nur nach Bauchgefühl
zu testen, ermöglicht PromptFoo eine automatisierte
Matrixevaluierung durch harte Regeln und semantische Prüfungen,
bei denen ein anderes Sprachmodell als strenger Schiedsrichter
fungiert.Wir beleuchten zudem, wie der „PromptFoo Agent Skill“
autonome Agenten absichert, indem er architektonische Leitplanken
setzt und das System mit synthetischen Stresstests auf die Probe
stellt. Erfahre außerdem, wie intelligentes Caching in der
Pipeline massiv Zeit und Kosten spart und wie das Framework in
hochregulierten Bereichen – von simulierten Hackerangriffen (Red
Teaming) bis hin zur Vermeidung von Falschinformationen im
Gesundheitswesen – für Sicherheit sorgt.Hör rein und erfahre, wie
die Prompt-Entwicklung von einer kreativen Kunstform zu einer
knallharten und messbaren Ingenieursdisziplin wird!
Weitere Episoden
18 Minuten
vor 14 Stunden
6 Minuten
vor 2 Tagen
29 Minuten
vor 1 Woche
7 Minuten
vor 1 Woche
7 Minuten
vor 1 Woche
Kommentare (0)
Melde Dich an, um einen Kommentar zu schreiben.