DeepSeek R1, OpenAI RFT, RLVR – und eine Erkenntnis von 1865 über das KI-Training

vor 1 Jahr

26 Minuten

0 0

Podcast

Podcaster

Der Weg nach KAI

Wie künstliche Intelligenz unsere Gesellschaft verändert

Bildung , Nachrichten

Beschreibung

vor 1 Jahr

Der Weg nach KAI – Episode 51: DeepSeek R1, OpenAI RFT, RLVR –
und eine Erkenntnis von 1865 über das KI-Training

Was passiert, wenn eines der leistungsfähigsten KI-Modelle
plötzlich Open Source wird? In dieser Folge analysieren wir die
Veröffentlichung von DeepSeek R1, ein KI-Modell, das nicht nur
technologisch, sondern auch geopolitisch und wirtschaftlich für
Aufsehen sorgt.

Wie unterscheidet es sich von OpenAIs O1? Warum hat es den
KI-Wettbewerb und selbst die Aktienmärkte tatsächlich
'erschüttert'? Und welche revolutionären Trainingsmethoden
stecken hinter seinem Erfolg?

Außerdem sprechen wir über RLVR (Reinforcement Learning with
Verifiable Rewards) – eine alternative Strategie zur Optimierung
von KI, die menschliches Feedback weitgehend ersetzt.

Doch auch OpenAI schläft nicht: Mit Reinforcement Fine-Tuning
(RFT) erprobt das Unternehmen eine Methode, um spezialisierte
KI-Modelle effizienter zu trainieren.

Weitere Episoden

Claude Mythos, Project Glasswing und die Zero-Day-Gefahr: Die dritte Achse der "Scaling-Laws"

In Podcasts werben

Schalte jetzt Werbung in Podcasts.

Alle Episoden anzeigen

Kommentare (0)

Melde Dich an, um einen Kommentar zu schreiben.

Abonnenten

Anmeldung

Hallo Podcast-Hörer! Melde dich hier an. Dich erwarten 1 Million abonnierbare Podcasts und alles, was Du rund um Podcasting wissen musst.

Anmelden mit

Konto erstellen

Anmeldedaten merken

Passwort vergessen?

oder

Google

DeepSeek R1, OpenAI RFT, RLVR – und eine Erkenntnis von 1865 über das KI-Training

Beschreibung

Weitere Episoden

Claude Mythos, Project Glasswing und die Zero-Day-Gefahr: Die dritte Achse der "Scaling-Laws"

Rekursive Selbstverbesserung und hochintelligente Kartoffeln: Die KI-Modelle der nächsten Generation

Opus 4.6 und die 'Situational Awareness': Wenn KI ihre Macht demonstriert

Das Memento-Prinzip moderner KI-Agenten: SKILLS und subliminale Botschaften (Teil 2)

Das Memento-Prinzip moderner KI-Agenten: SKILLS und subliminale Botschaften (Teil 1)

Kommentare (0)

Abonnenten

Bleibe beim Podcasting auf dem Laufenden

Anmelden mit

DeepSeek R1, OpenAI RFT, RLVR – und eine Erkenntnis von 1865 über das KI-Training

Beschreibung

Weitere Episoden

Claude Mythos, Project Glasswing und die Zero-Day-Gefahr: Die dritte Achse der "Scaling-Laws"

Rekursive Selbstverbesserung und hochintelligente Kartoffeln: Die KI-Modelle der nächsten Generation

Opus 4.6 und die 'Situational Awareness': Wenn KI ihre Macht demonstriert

Das Memento-Prinzip moderner KI-Agenten: SKILLS und subliminale Botschaften (Teil 2)

Das Memento-Prinzip moderner KI-Agenten: SKILLS und subliminale Botschaften (Teil 1)

Kommentare (0)

Abonnenten

Episode teilen

Abschnitt weiterleiten

Bleibe beim Podcasting auf dem Laufenden

Anmeldung

Anmelden mit