DeepSeek V3: Open-Source-Powerhouse – Das Geheimnis hinter dem Hype
1 Stunde 1 Minute
Beschreibung
vor 9 Monaten
In dieser Folge nehmen wir das DeepSeek V3 Paper genau unter die
Lupe – das Open-Source-Powerhouse, das aktuell für Furore in der
KI-Szene sorgt. Wir erklären, warum dieses Modell mit seinen 671
Milliarden Parametern (37 Milliarden aktiv pro Token) und
innovativen Architekturen wie Multi-Head Latent Attention und
Mixture-of-Experts den Markt revolutioniert. Dabei beleuchten
wir, wie DeepSeek V3 trotz geringer Kosten (nur ca. 5,58 Mio. USD
für das Training) durch eine effiziente Nutzung von Nvidia H800
Chips und einen sparsamen Datenaufwand beeindruckende Leistungen
erzielt. Erfahrt, was hinter dem Hype steckt, welche technischen
Neuerungen das Modell auszeichnen und warum es als Gamechanger in
der Open-Source-KI gilt.
Weitere Episoden
1 Stunde 20 Minuten
vor 8 Monaten
1 Stunde 5 Minuten
vor 9 Monaten
1 Stunde 14 Minuten
vor 9 Monaten
1 Stunde 46 Minuten
vor 9 Monaten
1 Stunde 18 Minuten
vor 9 Monaten
In Podcasts werben
Kommentare (0)