135 - Agenten verstehen Teil 6: Model Routing

135 - Agenten verstehen Teil 6: Model Routing

vor 2 Monaten
24 Minuten
0
0 0 0

Beschreibung

vor 2 Monaten

Die Themen dieser Folge:





Die Multi-Modell-Strategie: Warum es
ineffizient und teuer ist, für jede einfache Aufgabe immer
das leistungsstärkste Sprachmodell zu nutzen.




Kosten & Effizienz: Wie einfache
Triage-Entscheidungen blitzschnell und günstig von kleinen
Modellen gelöst werden und nur bei echten Problemen auf
teure Hochleistungsmodelle eskaliert wird.




Datenschutz & DSGVO: Wie das System
sensible Unternehmensdaten erkennt und diese sicher zur
Verarbeitung an rein lokale Modelle (z.B. über Ollama)
leitet.




Zukunftssichere Architektur: Wie man
Agenten so baut, dass sich zukünftige Modell-Updates
einfach als Konfiguration einfügen lassen, ohne den Code
umbauen zu müssen.



15
15
Close