158 - Modell gegen Prompt Injection

158 - Modell gegen Prompt Injection

vor 1 Monat
8 Minuten
0
0 0 0

Beschreibung

vor 1 Monat

In dieser Folge des KI Gilde Podcasts geht es um die unsichtbare
Gefahr von Prompt Injections bei der Automatisierung von
KI-Systemen. Wir erklären, wie Angreifer durch sogenannte
indirekte Injections versteckte Schadbefehle in scheinbar
harmlosen PDFs oder Webseiten platzieren, um die KI zu
manipulieren.


Als Lösung stellen wir das spezialisierte
Wächtermodell Wolf-Defender vor.
Dieses extrem kompakte Modell ist unter 300 MB groß, lässt sich
lokal ohne Latenz ausführen und fungiert als vorgeschaltetes
Schutzschild für autonome KI-Agenten und RAG-Systeme. Durch ein
großes Kontextfenster von 2048 Token und das Training mit "Hard
Negatives" erkennt der Wolf-Defender echte Angriffe zuverlässig
selbst tief in Dokumenten, ohne bei harmlosen Nutzeranfragen
unnötige Fehlalarme auszulösen. Erfahre, warum blindes Vertrauen
in externe Daten nicht mehr ausreicht und wie dieses Modell deine
KI-Dienste effektiv absichert.

Weitere Episoden

173 - Fable 5
6 Minuten
vor 1 Tag
172 - Agent World
6 Minuten
vor 3 Tagen
171 - Hermes Desktop
7 Minuten
vor 6 Tagen
170 - Qwen 3.7
7 Minuten
vor 1 Woche
169 - Image Prompting
6 Minuten
vor 1 Woche
15
15
Close