115 - Speaches: lokale Sprach-KI

115 - Speaches: lokale Sprach-KI

9 Minuten

Beschreibung

vor 1 Monat

In dieser Folge stellen wir das Open-Source-Projekt
Speaches vor, das oft als "Ollama für Audio"
bezeichnet wird.


Wir erklären, wie du damit modernste Sprach-KI lokal und
datenschutzkonform betreibst.


Die Highlights:


• Funktion: Eine Middleware, die Faster Whisper
(Speech-to-Text) und Modelle wie Kokoro oder Piper
(Text-to-Speech) unter einer einfachen Oberfläche bündelt,,.


• Hardware: Wie du High-End-Transkription schon
mit 8 GB VRAM auf Consumer-Grafikkarten realisierst,.


• Integration: Einrichtung via Docker und
Nutzung als privater Sprachassistent (z. B. im Smart Home) oder
Drop-in-Replacement für die OpenAI-API,.

Weitere Episoden

128 - pencil.dev
14 Minuten
vor 6 Tagen
127 - BMAD
6 Minuten
vor 1 Woche
125 - multimodales RAG
6 Minuten
vor 1 Woche

Kommentare (0)

Lade Inhalte...

Abonnenten

15
15