115 - Speaches: lokale Sprach-KI
9 Minuten
Podcast
Podcaster
Beschreibung
vor 1 Monat
In dieser Folge stellen wir das Open-Source-Projekt
Speaches vor, das oft als "Ollama für Audio"
bezeichnet wird.
Wir erklären, wie du damit modernste Sprach-KI lokal und
datenschutzkonform betreibst.
Die Highlights:
• Funktion: Eine Middleware, die Faster Whisper
(Speech-to-Text) und Modelle wie Kokoro oder Piper
(Text-to-Speech) unter einer einfachen Oberfläche bündelt,,.
• Hardware: Wie du High-End-Transkription schon
mit 8 GB VRAM auf Consumer-Grafikkarten realisierst,.
• Integration: Einrichtung via Docker und
Nutzung als privater Sprachassistent (z. B. im Smart Home) oder
Drop-in-Replacement für die OpenAI-API,.
Weitere Episoden
23 Minuten
vor 4 Tagen
14 Minuten
vor 6 Tagen
6 Minuten
vor 1 Woche
21 Minuten
vor 1 Woche
6 Minuten
vor 1 Woche
In Podcasts werben
Kommentare (0)