Was machen eigentlich große Sprachmodelle?

Was machen eigentlich große Sprachmodelle?

vor 9 Monaten
Wie der Transformer Sprache zerlegt, in Vektoren übersetzt – und daraus Texte generiert.
4 Minuten
Podcast
Podcaster
Buschi lernt KI
kikantine

Benutzerfoto kikantine
Darmstadt

Beschreibung

vor 9 Monaten

 In dieser Folge der KI Kantine erklärt Buschi, wie große
Sprachmodelle wie GPT unter der Haube funktionieren. Es geht um
die Transformer-Architektur, um Tokenisierung, Embeddings und
hochdimensionale Vektorräume. Was nach reinem Rechnen klingt,
wirkt oft verblüffend menschlich – warum das so ist, erfährst du
in dieser Folge. 

Abonnenten

tanoli
Nürnberg
15
15
Close