#153 Wie hoste ich ein Large Language Modell (LLM) mit Kubernetes in 5 Minuten mit Data Science Deep Dive ~ Engineering Kiosk Podcast

Wie hoste ich ein Large Language Modell in 5 Minuten mit
Kubernetes mit Data Science Deep Dive.

Im Engineering Kiosk Adventskalender 2024 sprechen befreundete
Podcaster⋅innen und wir selbst, Andy und Wolfi, jeden Tag kurz
& knackig innerhalb von wenigen Minuten über ein
interessantes Tech-Thema.

Unsere aktuellen Werbepartner findest du auf
https://engineeringkiosk.dev/partners

Das schnelle Feedback zur Episode:

(top) (geht
so)

Links

Data Science Deep Dive Podcast: https://inwt.podbean.com/

In Numbers We Trust: https://www.inwt-statistics.de/

Kubernetes: https://kubernetes.io/

Hugging Face: https://huggingface.co/

Databricks: https://www.databricks.com/de

Tabby: https://github.com/TabbyML/tabby

Gradio: https://www.gradio.app/

Ollama: https://ollama.com/

vLLM: https://github.com/vllm-project/vllm

NVIDIA device plugin for Kubernetes:
https://github.com/NVIDIA/k8s-device-plugin#quick-start

Sprungmarken

(00:00:00) Wie hoste ich ein Large Language Modell in 5 Minuten
mit Kubernetes?

Hosts

Wolfgang Gassler (https://mastodon.social/@woolf)

Andy Grunwald (https://andygrunwald.com/)

Feedback

EngKiosk Community:
https://engineeringkiosk.dev/join-discord

Buy us a coffee: https://engineeringkiosk.dev/kaffee

Email: stehtisch@engineeringkiosk.dev

LinkedIn: https://www.linkedin.com/company/engineering-kiosk/

Mastodon: https://podcasts.social/@engkiosk

Bluesky:
https://bsky.app/profile/engineeringkiosk.bsky.social

Twitter: https://twitter.com/EngKiosk

#153 Wie hoste ich ein Large Language Modell (LLM) mit Kubernetes in 5 Minuten mit Data Science Deep Dive

Beschreibung

Weitere Episoden

#257 Fischbecken, Jeep, Saugroboter - 3 Hacks, 1 Lesson: Zero Trust

#256 Hochleistungskultur ohne Druckkultur mit Philip Klasen-Schwidetzki

#255 Die DB skaliert nicht! OLTP vs. OLAP, Row vs. Column Stores, Parquet, CSV, Iceberg, DuckDB

#254 Domain Driven Design: Hype, Hate oder Handwerk für komplexe Systeme?

#253 Technisches Produktmanagement mit Michael Gasch von Amazon Web Services

Kommentare (0)

Abonnenten

Anmelden mit