Ai Talk Podcast by Dominik Wojcik

Ai Talk Podcast by Dominik Wojcik

0 0
0 0

Episoden

Bis zu 14.000€ Token-Wert für 200€ Abo!, Google erfolgreich verklagt, etc...| AI Talk 11.06.2026
12.06.2026
35 Minuten
OpenAI und Anthropic subventionieren ihre Abo-Modelle massiv – und eine neue Analyse zeigt, wie extrem das Missverhältnis wirklich ist.





00:00:06 | Intro & Themenüberblick


Worum es geht: Preiskampf, Fable-Test, Google-Haftung





00:00:34 | Claude Fable – Ersteindruck


Mythos-Architektur, Stärken im Coding, Schwächen in anderen Wissensbereichen





00:01:13 | Fable vs. Opus 4.8


Direktvergleich im Host-Workflow – Opus 4.8 bleibt vorn





00:03:09 | Fable fliegt aus Subscriptions


Zugang endet ~22. Juni; danach nur noch API zu 50 $/1M Token





00:05:00 | Subscription vs. API – Die Subventions-Analyse


SemiAnalysis-Daten: Token-Gegenwert je Plan von Claude Pro bis ChatGPT Pro





00:07:00 | Die 14.000-Dollar-Zahl erklärt


ChatGPT Pro (200 $/Monat) entspricht ~14.000 $ API-Gegenwert; Claude Max (200 $) ~8.000 $





00:08:07 | Break-even und Margenrisiko


Anthropic break-even bei ~20 % Auslastung; OpenAI-200-$-Plan rentiert sich nur unter 5,7 %





00:09:52 | Preiskampf: OpenAI senkt Token-Preise


WSJ-Bericht: OpenAI plant massive Preissenkungen als Reaktion auf Fable





00:11:12 | Fable-API-Preis und Einordnung


Aktuell 50 $/1M Token (vorher 125 $) – immer noch ~2× teurer als Opus





00:13:46 | Empfehlung: Welche Tools jetzt nutzen?


Cursor, Claude Code, ChatGPT Pro – solange die Subventionierung anhält





00:16:04 | Google AI Overviews – Klage und SEO-Konsequenzen


Zwei Verlage klagen; nur ~1 % der Nutzer klicken auf Quellenangaben





00:19:02 | EU-Haftungsurteil: Google haftet für falsche Overviews


Regelung vom 3. Juni, 9 Monate Übergangsfrist, Einspruchsrecht für Publisher





00:20:51 | Googles rechtliche Gegenwehr


Revision wahrscheinlich; langfristige Konsequenzen noch offen





00:21:48 | Apex Agents Benchmark: Gemini Flash 3.5 vs. Claude Sonnet 5


Gemini Flash 3.5 ~50 %, Claude Sonnet 5 ~45 % – gezieltes Agentic-Training als Erklärung





00:23:20 | Gemini 3.5 Pro – Vorsicht mit dem Hype


Early-Access-Feedback bisher verhalten





00:28:12 | Tool-Tipp: TextLottie


Lottie-Animationen direkt aus Codex/Claude Code generieren





00:30:27 | Praxistest: Website-Rebuild mit Claude/Fable


Komplette Homepage inkl. CMS und dynamischer Hero-Animation





00:33:58 | Fazit & Ausblick


Subscription-Fenster nutzen, Preiskampf beobachten, Google-Entwicklung verfolgen





---





Shownotes:





WSJ berichtet über geplante drastische Preissenkungen bei OpenAI als Reaktion auf Anthropics neues Modell:


https://www.wsj.com/tech/ai/openai-considers-drastic-price-cuts-anticipating-war-for-users-with-anthropic-9b8c178e?mod=e2tw





SemiAnalysis analysiert Subscription- vs. API-Margen bei OpenAI und Anthropic – inklusive Break-even-Berechnung:


https://x.com/SemiAnalysis_/status/2064815042374074396





Heise berichtet über das Münchner Urteil: Google muss für falsche Aussagen in AI Overviews haften:


https://www.heise.de/en/news/LG-Munich-I-Google-ordered-to-pay-for-false-statements-in-AI-summaries-11327217.html





Jake warnt davor, Token-Kosten auf Basis von Durchschnittspreisen zu berechnen – Modelle verbrauchen sehr unterschiedliche Mengen:


https://x.com/JakeKAllDay/status/2064870609796898862/photo/1





TextLottie: Open-Source-Skill für Codex und Claude Code, der Lottie-Animationen direkt aus dem Coding-Agenten generiert:


https://x.com/konstipaulus/status/2064011863889788972





- Quelle zu: https://www.theinformation.com/newsletters/the-briefing/german-court-ruling-google-spotlights-ai-liability-question


- Maßgeschneiderte KI-Strategien und -Lösungen – von der Idee über das Modell-Training bis zur produktiven Integration: https://wojcik.de


- The biggest IPO in history is now 4x oversubscribed, with SpaceX $SPCX drawing $250B in demand against a $75B raise: https://x.com/NoLimitGains/status/2064439231968166348
Mehr
Loops statt Prompten, Claude Mythos Leaks & Personal-Wechsel | AI Talk Mo. 08.06.2026
09.06.2026
53 Minuten
Zwei Themen dominieren die KI-Woche – und beide zeigen, wie schnell sich Begriffe und Erwartungen verselbstständigen, bevor die Realität sie einholt.





Peter Steinbergers Tweet vom 7. Juni hat 2,2 Millionen Views gesammelt. Sechs Wörter: „You should be designing loops that prompt your agents." Problem: In den Replies streiten alle darüber, was das überhaupt bedeutet. Die Folge erklärt Boris Chernys Definition vom WorkOS-Event, zeigt die fünfjährige Entwicklungsgeschichte von ReAct über AutoGPT bis zur heutigen Orchestrierungsebene – und nimmt den Cron-Job-Einwand ernst. Dazu ein konkretes Praxisbeispiel: 90 Minuten autonomes Codex-Coding, 630.000 Tokens, ein eigener LLM-Benchmark steigt von 90,1 auf 91,0 Prozent.





Parallel brodelt der Hype um Claude Mythos. Leak-Outputs aus der DevMode-Community zeigen einen macOS-Klon mit 50.000 Tokens und funktionierendem Browser, einen Cut-the-Rope-Nachbau mit Level-Editor und Musik-Generierung über Code – alles auf Low Thinking Effort. Anthropic-interne Daten sollen 52-fache Trainings-Code-Speedups in bestimmten Optimierungsaufgaben zeigen. Polymarket sah die Release-Wahrscheinlichkeit innerhalb einer Woche bei 40 Prozent – vier Tage zuvor lag sie noch bei 3 Prozent. Preisgerüchte: rund 125 Dollar pro einer Million Output-Token, zwei Versionen für Endnutzer und Enterprise.





Außerdem: Clive Chan verlässt OpenAI nach 2,4 Jahren im Custom-Chip-Programm und wechselt zu Anthropic. OpenAI plant den eigenen Inferenz-Chip für H2 2026. Apple WWDC bringt ein neues Siri, möglicherweise mit Gemini-Backend. Und Ramp-Kreditkartendaten für Juni zeigen: Anthropic führt im B2B-Wachstum – OpenAI taucht nicht mehr unter den Top-Playern auf.





00:00:08 Intro & Format


00:03:17 Claude Mythos – erste Community-Outputs


00:06:00 Generierungszeit und Kosten


00:07:13 GPT-5.06 – erste Infos aus internen Tests


00:15:33 Mythos-Preise und zwei Versionen


00:18:21 Release-Prognose via Polymarket


00:20:32 Mythos-Preise konkret: $125 pro 1M Output-Token


00:21:22 Gemini 3.5 Pro Leak


00:25:32 Peter Steinbergers viraler Loop-Tweet


00:26:44 Loop vs. Prompt – was ist der Unterschied?


00:29:31 Praxisbeispiel: 90 Minuten autonomes Codex-Coding


00:32:53 Sub-Agents und parallele Loops


00:36:37 Warnung: Token-Kosten können explodieren


00:38:15 Loop-Coding erklärt: Der Mensch schreibt die Schleife


00:40:18 Verifikation als wichtigster Erfolgsfaktor


00:40:43 Das größte Risiko bei AI-Agents


00:41:05 Skills sind das Asset, nicht der Loop


00:41:35 Vom Prompt Engineer zum Agent-Orchestrator


00:42:22 Brain Drain: Chip-Ingenieur wechselt von OpenAI zu Anthropic


00:43:38 OpenAIs eigener Inferenz-Chip


00:44:01 Apple WWDC: Neues Siri mit Gemini-Backend?


00:46:27 Ramp-Marktdaten Juni: Wer wächst wirklich?


00:47:21 Anthropic führt – OpenAI verliert Boden


00:48:37 Abschluss & Ausblick





Shownotes:





Der virale Tweet, der die Debatte ausgelöst hat – mit Einordnung der Loop-Definition und fünfjähriger Entwicklungsgeschichte: https://x.com/mvanhorn/status/2063865685558903149





Weitere Mythos-Outputs auf Low Effort, mit Hinweis auf deutlich bessere Ergebnisse bei xHigh/Max: https://x.com/Lentils80/status/2063686677160149501





Mythos-Output-Thread mit Pixel Art, Piano-Musik-Visualizer und Cut-the-Rope-Nachbau aus der DevMode-Community: https://x.com/mirochill/status/2062931007725015356





Mythos generiert Musik über Code – Einordnung als „First Principles"-Ansatz für Audio: https://x.com/chetaslua/status/206361381924369210





Polymarket-Einordnung: Release-Wahrscheinlichkeit von 3 % auf 40 % in vier Tagen, Modell kurz in Anthropic-UI aufgetaucht: https://x.com/goodworse/status/2063579122555662763





Mythos vs. GPT-5.6 – Vergleich von Leak-Outputs, mit Hinweis auf möglichen IPO-Hype als Verzerrungsfaktor: https://x.com/notjazii/status/2063272880708956258





Clive Chan verlässt OpenAI nach 2,4 Jahren im Custom-Chip-Programm und wechselt zu Anthropic: https://x.com/itsclivetime/status/2063356118525792542
Mehr
LoRA Fine-Tuning für SEO: Mein eigenes LLM Experiment
05.06.2026
53 Minuten
In dieser AI Talk Folge geht es um mein Experiment, ein eigenes SEO LLM per LoRA Fine-Tuning zu trainieren.


Ich spreche darüber, wie ich aus meinem SEO Benchmark Trainingsdaten erstelle, warum gute Datensätze wichtiger sind als reine Menge und wie ich ein Open-Weight-Modell gezielt für technische SEO-Aufgaben, strukturierte Daten, Onpage, Offpage, Crawling und Agent-Workflows optimieren möchte.


Außerdem geht es um Qwen 3.6, lokale LLMs, RunPod, GPU-Setups, Benchmarks, Student-Teacher-Ansätze und die Frage, ob ein kleineres Modell nah genug an große Topmodelle herankommen kann, um in echten Workflows deutlich günstiger eingesetzt zu werden.


Ein großer Teil der Folge zeigt auch, warum Fine-Tuning ein iterativer Prozess ist: trainieren, testen, Fehler analysieren, Trainingsdaten verbessern und erneut benchmarken.


Kapitel:


00:00 Einstieg: Warum ein eigenes SEO LLM? 02:42 SEO Benchmark, Student-Teacher-Prinzip und Modellvergleich 05:12 Codex, Claude Code, Cursor und aktuelle Coding-Tools 07:48 Trainingsstatus, Setup und lokale Modelle 13:15 Qwen 3.6 als Basis für das Fine-Tuning 17:48 Aufbau der SEO-Trainingsdaten 24:45 Training starten, Datensätze kuratieren und LoRA verstehen 30:42 Benchmark-Test mit dem neuen Modell 32:36 Iteration: Trainieren, testen, verbessern 39:02 Erste Ergebnisse, Rückschritte und Learnings 46:38 Analyse mit starken Modellen und Vorbereitung für V4 57:14 Neuer Trainingslauf mit optimierten Beispielen 58:15 Nächster Schritt: Tool- und Function-Calling-Training 59:54 Fazit: Wie ich LLMs optimiere 01:02:05 Warum Benchmark und Trainingsdaten getrennt bleiben müssen 01:03:06 Ziel: Ein günstigeres spezialisiertes SEO Brain Modell
Mehr
Meta AI Hack, Nvidia DGX Power & eigene SEO Modelle: Warum AI Agents noch wackeln
02.06.2026
53 Minuten
In dieser AI Talk Folge geht es um Nvidia DGX Spark, lokale LLMs, neue Open-Weight-Modelle, Minimax M3, Coding-Benchmarks, ein neues Video-Modell von xAI und den Meta Support Assistant Hack.





Außerdem zeige ich mein nächstes Experiment: ein eigenes SEO LLM per LoRA Fine-Tuning. Dafür will ich aus meinem SEO Benchmark Trainingsdaten bauen und ein Modell stärker auf technische SEO-Aufgaben, Crawling, Onpage, Offpage und Agent-Workflows optimieren.





Kapitelübersicht:





00:00 Neues Setup und KI-Co-Host


02:42 Alphabet und AI-Infrastruktur


05:02 Nvidia DGX Spark und lokale LLMs


07:30 KI im Betriebssystem


10:30 DGX Station und Blackwell Power


14:23 Nvidia Nemotron 3 Ultra


17:19 Minimax M3 für Coding


21:41 Neues Video-Modell von xAI


24:04 Coding-Benchmarks und Modellpreise


28:11 Meta Support Assistant Hack


31:37 KI-Co-Host im Live-Test


33:19 Eigenes SEO LLM per LoRA


41:37 Anthropic IPO und Preisdruck


50:20 Fazit und Ausblick





02.06.2026 · AI Talk 3





Shownotes


Grok Imagine Video 1.5 Preview | xAI Docs: Pricing $0.08 per second Pricing Output $0.08 per second You are charged for each second of video generated when using the API. https://docs.x.ai/developers/models/grok-imagine-video-1.5-preview


Meta's AI chatbot helped attackers take over Instagram accounts | heise online: The attack vector was made public by US tech magazine 404 Media , which refers to Telegram groups of security researchers and hacking group… https://www.heise.de/en/news/Meta-s-AI-chatbot-helped-attackers-take-over-Instagram-accounts-11314517.html


Persönlicher KI-Supercomputer | NVIDIA DGX Station: Tensor-Recheneinheiten der NVIDIA Blackwell-Generation NVIDIA DGX Station verfügt über Tensor-Recheneinheiten der NVIDIA Blackwell Generation, die 4-Bit-Gleitkomma-KI… https://www.nvidia.com/de-de/products/workstations/dgx-station/


NASDAQ-Aktie Alphabet schwächer: Riesen-Kapitalerhöhung geplant - Blick auf den Berkshire-Anteil | finanzen.net: Google befindet sich damit in guter Gesellschaft: Amazon etwa plant, rund 200 Milliarden Dollar zu investi… https://www.finanzen.net/nachricht/aktien/ausbau-alphabet-aktie-sinkt-mega-kapitalerhoehung-fuer-ki-offensive-berkshire-anteil-im-blick-15723078


Warren Buffett steigt mit 10 Milliarden Dollar bei Alphabets KI-Offensive ein: Juni 2026 Alphabet plant eine Kapitalerhöhung von 80 Milliarden Dollar, um seine KI-Infrastruktur auszubauen. https://the-decoder.de/warren-buffett-steigt-mit-10-milliarden-dollar-bei-alphabets-ki-offensive-ein/


OpenAI models and Codex on Amazon Bedrock are now generally available | Artificial Intelligence: More than 5 million people use Codex every week to write, refactor, debug, test, and validate code across large codebases. https://aws.amazon.com/blogs/machine-learning/openai-models-and-codex-on-amazon-bedrock-are-now-generally-available/


Regional availability - Amazon Bedrock: Virginia) Legacy (EOL: 2026-09-30) Rerank Region In-Region Geo Global us-west-2 (Oregon) ca-central-1 (Canada) eu-central-1 (Frankfurt) ap-northeast-1 (Tokyo) Nova Sonic Region In… https://docs.aws.amazon.com/bedrock/latest/userguide/models-region-compatibility.html


Nemotron 3 Ultra: Nvidias neues Open-Source-Modell ist laut Benchmark das stärkste der USA: Bild: AAII Beim Anbieter DeepInfra liefert Nemotron 3 Ultra laut Artificial Analysis zudem mehr als 300 Token pro Sekunde. https://the-decoder.de/nemotron-3-ultra-nvidias-neues-open-source-modell-ist-laut-benchmark-das-staerkste-der-usa/





Anthropic confidentially submits draft S-1 to the SEC \ Anthropic: Skip to main content Skip to footer Try Claude Announcements Anthropic confidentially submits draft S-1 to the SEC Jun 1, 2026 Today, Anthropic, PBC con… https://www.anthropic.com/news/confidential-draft-s1-sec


MiniMax M3: Frontier Coding, 1M Context, Native Multimodality — All in One Model - MiniMax Research | MiniMax: Its clean, scalable, easy-to-implement, and hardware-friendly characteristics allow its theoretical gains to… https://www.minimax.io/blog/minimax-m3
Mehr
Deepseek v4, Cursor Composer 2.5 & Chrome DevTools MCP: AI Talk über neue KI Tools
29.05.2026
53 Minuten
In dieser AI Talk Folge spreche ich über Deepseek v4, Cursor Composer 2.5, Codex, Claude Code und neue Agent Tools.





Deepseek v4 Pro hat in meinen Benchmarks extrem stark performt und ist preislich deutlich günstiger als viele westliche Frontier Modelle. Gleichzeitig zeige ich, wo politische Biases und Antwortverweigerungen problematisch werden können.





Außerdem teile ich meine Erfahrungen mit Cursor Composer 2.5 aus einem echten Coding-Projekt, spreche über Codex Updates, Claude Code, Microsoft Agent Skills, steigende Token-Kosten in Unternehmen und den neuen Chrome DevTools MCP Server für Performance Audits.





Eine Folge über neue KI-Modelle, Coding Agents, Kosten, Benchmarks und die Frage, welche Tools im Alltag wirklich nützlich sind.
Mehr

Über diesen Podcast

Wir sprechen über KI, LLMs, AI Agents, SEO und Online Marketing. Im Fokus stehen neue Tools, aktuelle Entwicklungen, praktische Learnings und die Frage, was davon wirklich nützlich ist und was eher Hype bleibt.
15
15
Close