071 - LLMs vergiften

071 - LLMs vergiften

vor 7 Monaten
6 Minuten
0
0 0 0

Beschreibung

vor 7 Monaten

Heute packen wir ein heiß diskutiertes Thema an:
Poisoning Attacks (Datenvergiftung) auf große
Sprachmodelle (LLMs).Bisher schien es fast unmöglich, riesige
Modelle wie GPT-4 oder LLaMA anzugreifen. Neuere Experimente
zeigen jedoch, dass nicht der Prozentsatz der manipulierten Daten
entscheidend ist, sondern die absolute Zahl.


Schon etwa 250 manipulierte Dokumente könnten
ausreichen, um ein Modell zu kompromittieren, unabhängig von
seiner Größe oder der Menge der sauberen Trainingsdaten.


Wir diskutieren das beunruhigende Missbrauchspotenzial. Angreifer
könnten über Webarchive schädliche Befehle (wie den Linux-Befehl
„RM- RF“, alles löschen) in Trainingsdaten einschleusen. Kritisch
wird es, wenn diese manipulierten LLMs später Zugriff auf echte
Systeme erhalten.

Weitere Episoden

173 - Fable 5
6 Minuten
vor 1 Tag
172 - Agent World
6 Minuten
vor 3 Tagen
171 - Hermes Desktop
7 Minuten
vor 6 Tagen
170 - Qwen 3.7
7 Minuten
vor 1 Woche
169 - Image Prompting
6 Minuten
vor 1 Woche
15
15
Close