EP15 - Benchmaxxing ~ Commit to Market Podcast

️ Folge 15 - Benchmaxing: Tokens, Agenten und Cyberpunk

In dieser Episode sprechen Paul Freund und Daniel Ratke über neue
KI-Modelle, Benchmark-Hype und die Frage, ob jeder Release
wirklich eine Revolution ist - oder eher eine Evolution, die
maximal gut verkauft wird.

Von dort geht’s direkt in die Praxis: Tokenpreise,
GitHub-Abrechnung, OpenAI vs. Anthropic, Agentic Coding in
Jira/Azure DevOps und die Frage, ob KI wirklich wieder “zu teuer”
wird - oder ob wir gerade erst anfangen zu verstehen, wie man
Agents sinnvoll und wirtschaftlich einsetzt.

Außerdem wird es wild: Paul berichtet von seinem
OpenClaw-Experiment mit WhatsApp, Voice und einem Agenten, der
eigenständig Workarounds findet. Danach geht’s um AI-Security,
Jailbreaks, Social Engineering, Voice-Cloning, Ghost in the
Shell, Neuralink, Black Mirror und die Frage: Was kann man im
Internet eigentlich noch glauben?

In dieser Episode:

* Neues Modell, neuer Hype - warum “Benchmaxing” perfekt passt

* Warum KI-Releases oft eher Evolution als Revolution sind

* Tokenpreise, Subscriptions und warum Anthropic gerade so teuer
wirkt

* GitHub Copilot und tokenbasierte Abrechnung im Business-Alltag

* Agentic Coding direkt im Jira-/Azure-DevOps-Workflow

* Warum “AI ist teurer als Mitarbeiter” oft zu kurz gedacht ist

* Agent-Fleets vs. einzelne Agents - warum Kommunikation auch bei
KI teuer ist

* Langsamer, günstiger, besser? Warum Speed ein Pricing-Hebel
werden könnte

* Lokale Modelle, GPU-Server, Hetzner, RunPod und Self-Hosting

* OpenClaw als persönlicher WhatsApp-Assistent

* Wenn Agents Rechte umgehen, Tools installieren und einfach
“machen”

* Jailbreaks, Scraping, DeepSeek und AI-Guardrails

* Social Engineering durch AI-Agenten und neue Cybercrime-Risiken

* Ghost in the Shell, Akira und warum Cyberpunk plötzlich
realistischer wirkt

* Seeing is believing? Warum Voice-Cloning und Deepfakes
Vertrauen verändern

* Passwörter für Familie und Freunde - als Schutz gegen
AI-Betrug?

* Brainchips, Neuralink, Black Mirror und
Pay-to-Live-Zukunftsbilder

* Megacorps, Regulierung und dystopische Tech-Visionen

️ Kapitel / Timecodes:

00:00 Intro - zurück in Deutschland

00:34 Neues Modell, Benchmarks und “Benchmaxing”

02:51 OpenAI vs. Anthropic: Pricing, Tokens und Subscriptions

04:06 GitHub-Abrechnung und Token-Schock

06:06 Agentic Coding im Jira-/Azure-DevOps-Workflow

08:30 Sind Mitarbeiter wieder günstiger als AI?

09:56 Agent-Fleets, Overhead und warum langsamer billiger sein
könnte

13:53 Lokale Modelle, Self-Hosting und GPU-Server

17:44 Open-Source-Modelle, Kimi und Hardware-Anforderungen

23:26 OpenClaw-Experiment mit WhatsApp und Voice

27:18 Wenn Agents eigenständig Workarounds finden

29:56 Jailbreaks, Scraping und DeepSeek

31:25 AI-Agenten, Social Engineering und Cybercrime

33:39 Ghost in the Shell, Akira und Cyberpunk-Realität

36:41 Seeing is no longer believing

39:19 Voice-Cloning, Deepfakes und Vertrauensprobleme

41:41 Brainchips, Neuralink und Black Mirror

46:44 Megacorps, Politik und dystopische Zukunftsbilder

49:10 Wrap-up - Sharing is caring

Links:

Mehr vom Podcast - https://committomarket.de

Du bist oder suchst Entwickler? - https://auralis.group

Coaching und Beratung! - https://frnd.dev

EP15 - Benchmaxxing

Beschreibung

Weitere Episoden

EP14 - Accelerate

EP13 - Goldrausch

EP12 - KI, Arbeitsmarkt und Bewusstsein

EP11 - Mental Health

EP10 - Softwarequalität

Kommentare (0)

Abonnenten

Bleibe beim Podcasting auf dem Laufenden

Anmelden mit