Was machen eigentlich große Sprachmodelle?

Was machen eigentlich große Sprachmodelle?

vor 11 Monaten
Wie der Transformer Sprache zerlegt, in Vektoren übersetzt – und daraus Texte generiert.
4 Minuten
0
0 0 0

Beschreibung

vor 11 Monaten

 In dieser Folge der KI Kantine erklärt Buschi, wie große
Sprachmodelle wie GPT unter der Haube funktionieren. Es geht um
die Transformer-Architektur, um Tokenisierung, Embeddings und
hochdimensionale Vektorräume. Was nach reinem Rechnen klingt,
wirkt oft verblüffend menschlich – warum das so ist, erfährst du
in dieser Folge. 

Abonnenten

admin
Berlin
tanoli
Nürnberg
15
15
Close