KI-Benchmarks haben mehr Probleme als Lösungen
KI-Entwickler brüsten sich stolz mit den Zahlen, die ihre Systeme
in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks
funktionieren und fragen: Wie aussagekräftig sind solche Tests
wirklich? Und kommt es am Ende vielleicht bloss auf die «Vib ...
47 Minuten
Podcast
Podcaster
Beschreibung
vor 1 Jahr
KI-Entwickler brüsten sich stolz mit den Zahlen, die ihre Systeme
in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks
funktionieren und fragen: Wie aussagekräftig sind solche Tests
wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an?
Der ganze Podcast im Überblick: (00:01:28) Was sind eigentlich
KI-Benchmark-Tests? (00:06:23) Neun Probleme (00:34:27) Drei
Lösungen Chatbot Arena: https://chat.lmsys.org SRF Geek Sofa bei
Discord: https://discord.gg/geeksofa
in Benchmark-Tests erreichen. Wir erklären, wie KI-Benchmarks
funktionieren und fragen: Wie aussagekräftig sind solche Tests
wirklich? Und kommt es am Ende vielleicht bloss auf die «Vibes» an?
Der ganze Podcast im Überblick: (00:01:28) Was sind eigentlich
KI-Benchmark-Tests? (00:06:23) Neun Probleme (00:34:27) Drei
Lösungen Chatbot Arena: https://chat.lmsys.org SRF Geek Sofa bei
Discord: https://discord.gg/geeksofa
Weitere Episoden
3 Stunden 4 Minuten
vor 10 Monaten
2 Stunden 23 Minuten
vor 10 Monaten
1 Stunde 4 Minuten
vor 10 Monaten
50 Minuten
vor 10 Monaten
36 Minuten
vor 11 Monaten
In Podcasts werben
Abonnenten
Berlin
Kommentare (0)