Wie knacke ich die KI?

Wie knacke ich die KI?

42 Minuten

Beschreibung

vor 1 Woche
Jeder, der schon mal mit KI-Sprachmodellen zu tun hatte, kennt es:
man will eine bestimmte Antwort vom Chatbot - doch der weigert sich
hartnäckig, diese zu geben. Es gibt aber Tricks, um LLMs und andere
GenAI-Modelle gefügig zu machen: sogenannte Pompt Hacks, Jailbreaks
oder Prompt Injections. Wir erklären, was hinter diesen Begriffen
steckt, wie diese Methoden funktionieren und wir fragen: Ist es gut
oder schlecht, wenn KI-Modelle nicht alle Fragen beantworten, die
wir ihnen stellen? In dieser Folge: 00:00 Intro 02:38 Was sind
Prompt Hacks und wie funktionieren sie? 13:30 Wie Marie einen
Chatbot dazu brachte, ihr 3000 Proteinriegel zu versprechen 19:47
Fritz und DeepSeek: Wer bestimmt, was KI-Modelle sagen? 30:10
Sollen Chatbots immer auf alle Fragen Antworten geben? 34:32 Was
haben wir diese Woche mit KI gemacht? Redaktion und Mitarbeit:
David Beck, Cristina Cletiu, Chris Eckardt, Fritz Espenlaub, Marie
Kilg, Mark Kleber, Gudrun Riedl, Christian Schiffer, Gregor
Schmalzried Links und Quellen: - Chevrolet of Watsonwille verkauft
Chevy Tahoe für $1
https://www.theautopian.com/chevy-dealers-ai-chatbot-allegedly-recommended-fords-gave-free-access-to-chatgpt/
- Findet man in LLMs gefährlichere Informationen zu Biowaffen als
in Google?
https://www.rand.org/pubs/research_reports/RRA2977-2.html - Der
chinesische Chatbot DeepSeek und das Tiananmen-Massaker:
https://www.linkedin.com/posts/peter-gostev_it-took-some-effort-but-i-managed-to-get-activity-7152042996635521024-2hBZ/
- KI macht Job-Interviews: https://www.micro1.ai/gpt-vetting -
Airline haftet für Fehler ihres Chatbots:
https://www.theguardian.com/world/2024/feb/16/air-canada-chatbot-lawsuit
- Maries Theaterstück: Anna und Eve in der Neuköllner Oper
https://www.neukoellneroper.de/performance/anna-eve/ - Was steckt
hinter dem mysteriösen neuen Chatbot GPT2?
https://news.ycombinator.com/item?id=40199715
https://arstechnica.com/information-technology/2024/04/rumors-swirl-about-mystery-gpt2-chatbot-that-some-think-is-gpt-5-in-disguise/
Kontakt: Wir freuen uns über Fragen und Kommentare an
podcast@br.de. Unterstützt uns: Wenn euch dieser Podcast gefällt,
freuen wir uns über eine Bewertung auf eurer liebsten
Podcast-Plattform. Abonniert den KI-Podcast in der ARD Audiothek
oder wo immer ihr eure Podcasts hört, um keine Episode zu
verpassen. Und empfehlt uns gerne weiter!

Kommentare (0)

Lade Inhalte...
15
15
:
: