Humanitys Last Exam - Die letzte Prüfung der Menschheit?
7 Minuten
Podcast
Podcaster
Beschreibung
vor 3 Monaten
Stell dir vor, die beste KI der Welt schreibt die schwerste
Prüfung aller Zeiten – und besteht sie zu 50%. Klingt nach
Science-Fiction? Ist es aber nicht! In dieser Podcast-Folge
tauchen wir ein in die spannende Welt von „Humanity’s
Last Exam“ (HLE), https://agi.safe.ai dem ultimativen
Test für künstliche Intelligenz. 2.500 extrem schwierige
Fragen aus über 100 Fächern – von Quantenphysik bis zu
alten Sprachen – zeigen, wie nah oder fern KI-Systeme wirklich an
menschlicher Intelligenz sind.
Wer führt aktuell das Rennen an? Google Gemini 3
erreicht 41% und ist damit Spitzenreiter unter den multimodalen
Modellen, die nicht nur Texte, sondern auch Bilder, Videos und
Audio verstehen. Doch die Konkurrenz schläft nicht: Grok
4 Heavy von Elon Musks xAI schafft beeindruckende 50,7%
– allerdings mit Hilfsmitteln und rein textbasiert. Das
chinesische Open-Source-Modell Kimi K2 Thinking
liegt mit 44,9% knapp dahinter und übertrifft sogar Googles
ältere Versionen. Doch das eigentliche Highlight kommt aus der
Schweiz: Giotto.ai, ein Startup aus Lausanne,
das mit einem winzigen Modell von nur 200 Millionen Parametern
beim ARC-AGI-Test für abstraktes Denken führt.
Während die Grossen mit Milliarden Parametern um die Wette
rüsten, zeigt Giotto, dass Effizienz und Ethik
vielleicht der Schlüssel zum Erfolg sind.
Warum ist das alles relevant für dich? Weil HLE nicht nur ein
Test ist, sondern ein Weckruf: Wenn KIs bald die
Hälfte der Fragen richtig beantworten, die selbst Experten
herausfordern, was bleibt dann noch für uns
Menschen? Diese Folge erklärt dir, warum Benchmarks wie
HLE entscheidend sind, um zu verstehen, wo KI heute steht
– und wohin sie sich entwickelt. Wir sprechen über die
Risiken von „halluzinierenden“ KIs, die selbstbewusst falsche
Antworten geben, und warum Tests wie HLE helfen, echte
Intelligenz von bloßer Datenwiederholung zu
unterscheiden.
Am Ende bleibt die grosse Frage: Können wir KI vertrauen,
wenn sie 50% besteht? Und was kommt als Nächstes – eine
noch härtere Prüfung oder die Zusammenarbeit zwischen Mensch und
Maschine?
Bei Fragen: #fragRoger: http://roger.social/
Abonnier auch meinen Newsletter:
http://www.fragroger.social/
Oder schau bei uns in der KI Community:
https://www.ki-update.com
Und wenn Du mehr KI anwenden willst, melde dich gerne bei mir:
https://top-speakers.ch/roger-l-basler-de-roca/
Wer bin ich?
Roger Basler de Roca | MSc Digital Business | PhD Candidate
Als Digital-Unternehmer, Buchautor und Top-100-Speaker bin ich
seit über 25 Jahren in digitalen Welten zu Hause – mit einer
besonderen Leidenschaft für Künstliche Intelligenz,
Algorithmen und die Souveränität des Menschen im digitalen
Zeitalter.
Ich spreche die Sprache der Algorithmen, auch wenn Pflanzen bei
mir weniger gut gedeihen. Mein Ziel: Menschen und
Organisationen befähigen, Digitalisierung und KI nicht
nur zu nutzen, sondern selbstbestimmt zu gestalten.
Mein Schwerpunkt liegt auf dem Aufbau digitaler Geschäfts- und
Wachstumsmodelle durch Educational Consulting –
der Schnittstelle von Bildung, Technologie und unternehmerischem
Denken.
Weitere Episoden
5 Minuten
vor 3 Tagen
4 Minuten
vor 1 Woche
6 Minuten
vor 2 Wochen
5 Minuten
vor 3 Wochen
5 Minuten
vor 1 Monat
In Podcasts werben
Abonnenten
BERLIN
Mainz
Bregenz
Waiblingen
Singen
Nauen
Bad Bentheim
Herford
Hamburg
Irzehoe
WeiWeg
Kommentare (0)