174 - Diffusion Gemma

174 - Diffusion Gemma

vor 14 Stunden
6 Minuten
0
0 0 0

Beschreibung

vor 14 Stunden

In dieser Folge des KI-Gilde Podcasts werfen wir einen Blick auf
Googles neues Modell DiffusionGemma. Statt Text
klassisch Wort für Wort zu generieren, nutzt das Modell eine
Diffusion-Architektur, die man sonst aus der Bildgenerierung
kennt.


DiffusionGemma erzeugt eine "Leinwand" von 256 Wörtern auf einen
Schlag, indem es zufälliges "Wort-Rauschen" in mehreren
Durchgängen schrittweise durch passenden Text ersetzt. Dank einer
cleveren "Mixture of Experts"-Architektur, bei der von den 26
Milliarden Parametern immer nur 4 Milliarden gleichzeitig aktiv
sind, benötigt das Modell lediglich 18 GB Videospeicher. Damit
läuft es blitzschnell und lokal auf heimischen Rechnern. Wir
klären, wie dieses "Text-Entrauschen" im Detail funktioniert und
warum diese verzögerungsfreie Textgenerierung unsere Erwartungen
an KI-Assistenten für immer verändern könnte.

Weitere Episoden

173 - Fable 5
6 Minuten
vor 2 Tagen
172 - Agent World
6 Minuten
vor 4 Tagen
171 - Hermes Desktop
7 Minuten
vor 1 Woche
170 - Qwen 3.7
7 Minuten
vor 1 Woche
169 - Image Prompting
6 Minuten
vor 1 Woche
15
15
Close