EP15 - Benchmaxxing

EP15 - Benchmaxxing

vor 2 Tagen
50 Minuten
0
0 0 0

Beschreibung

vor 2 Tagen

️ Folge 15 - Benchmaxing: Tokens, Agenten und Cyberpunk





In dieser Episode sprechen Paul Freund und Daniel Ratke über neue
KI-Modelle, Benchmark-Hype und die Frage, ob jeder Release
wirklich eine Revolution ist - oder eher eine Evolution, die
maximal gut verkauft wird.





Von dort geht’s direkt in die Praxis: Tokenpreise,
GitHub-Abrechnung, OpenAI vs. Anthropic, Agentic Coding in
Jira/Azure DevOps und die Frage, ob KI wirklich wieder “zu teuer”
wird - oder ob wir gerade erst anfangen zu verstehen, wie man
Agents sinnvoll und wirtschaftlich einsetzt.





Außerdem wird es wild: Paul berichtet von seinem
OpenClaw-Experiment mit WhatsApp, Voice und einem Agenten, der
eigenständig Workarounds findet. Danach geht’s um AI-Security,
Jailbreaks, Social Engineering, Voice-Cloning, Ghost in the
Shell, Neuralink, Black Mirror und die Frage: Was kann man im
Internet eigentlich noch glauben?





In dieser Episode:


* Neues Modell, neuer Hype - warum “Benchmaxing” perfekt passt


* Warum KI-Releases oft eher Evolution als Revolution sind


* Tokenpreise, Subscriptions und warum Anthropic gerade so teuer
wirkt


* GitHub Copilot und tokenbasierte Abrechnung im Business-Alltag


* Agentic Coding direkt im Jira-/Azure-DevOps-Workflow


* Warum “AI ist teurer als Mitarbeiter” oft zu kurz gedacht ist


* Agent-Fleets vs. einzelne Agents - warum Kommunikation auch bei
KI teuer ist


* Langsamer, günstiger, besser? Warum Speed ein Pricing-Hebel
werden könnte


* Lokale Modelle, GPU-Server, Hetzner, RunPod und Self-Hosting


* OpenClaw als persönlicher WhatsApp-Assistent


* Wenn Agents Rechte umgehen, Tools installieren und einfach
“machen”


* Jailbreaks, Scraping, DeepSeek und AI-Guardrails


* Social Engineering durch AI-Agenten und neue Cybercrime-Risiken


* Ghost in the Shell, Akira und warum Cyberpunk plötzlich
realistischer wirkt


* Seeing is believing? Warum Voice-Cloning und Deepfakes
Vertrauen verändern


* Passwörter für Familie und Freunde - als Schutz gegen
AI-Betrug?


* Brainchips, Neuralink, Black Mirror und
Pay-to-Live-Zukunftsbilder


* Megacorps, Regulierung und dystopische Tech-Visionen





️ Kapitel / Timecodes:


00:00 Intro - zurück in Deutschland


00:34 Neues Modell, Benchmarks und “Benchmaxing”


02:51 OpenAI vs. Anthropic: Pricing, Tokens und Subscriptions


04:06 GitHub-Abrechnung und Token-Schock


06:06 Agentic Coding im Jira-/Azure-DevOps-Workflow


08:30 Sind Mitarbeiter wieder günstiger als AI?


09:56 Agent-Fleets, Overhead und warum langsamer billiger sein
könnte


13:53 Lokale Modelle, Self-Hosting und GPU-Server


17:44 Open-Source-Modelle, Kimi und Hardware-Anforderungen


23:26 OpenClaw-Experiment mit WhatsApp und Voice


27:18 Wenn Agents eigenständig Workarounds finden


29:56 Jailbreaks, Scraping und DeepSeek


31:25 AI-Agenten, Social Engineering und Cybercrime


33:39 Ghost in the Shell, Akira und Cyberpunk-Realität


36:41 Seeing is no longer believing


39:19 Voice-Cloning, Deepfakes und Vertrauensprobleme


41:41 Brainchips, Neuralink und Black Mirror


46:44 Megacorps, Politik und dystopische Zukunftsbilder


49:10 Wrap-up - Sharing is caring





Links:


Mehr vom Podcast - https://committomarket.de


Du bist oder suchst Entwickler? - https://auralis.group


Coaching und Beratung! - https://frnd.dev
15
15
Close