125 - multimodales RAG

125 - multimodales RAG

vor 1 Monat
6 Minuten
0
0 0

Beschreibung

vor 1 Monat

Diese Folge erklärt Multimodal RAG und wie man
Retrieval Augmented Generation erweitert, um neben Text auch
Bilder, Audio und Video zu verarbeiten. Wir vergleichen drei
technische Ansätze für die Umsetzung: die Umwandlung aller Medien
in Text („Text-ify everything“), das hybride Modell und das
komplexe „Full Multimodal RAG“, das einen gemeinsamen Vektorraum
für alle Datentypen nutzt.
15
15
Close