Podcaster
Episoden
12.06.2026
35 Minuten
OpenAI und Anthropic subventionieren ihre Abo-Modelle massiv – und eine neue Analyse zeigt, wie extrem das Missverhältnis wirklich ist.
00:00:06 | Intro & Themenüberblick
Worum es geht: Preiskampf, Fable-Test, Google-Haftung
00:00:34 | Claude Fable – Ersteindruck
Mythos-Architektur, Stärken im Coding, Schwächen in anderen Wissensbereichen
00:01:13 | Fable vs. Opus 4.8
Direktvergleich im Host-Workflow – Opus 4.8 bleibt vorn
00:03:09 | Fable fliegt aus Subscriptions
Zugang endet ~22. Juni; danach nur noch API zu 50 $/1M Token
00:05:00 | Subscription vs. API – Die Subventions-Analyse
SemiAnalysis-Daten: Token-Gegenwert je Plan von Claude Pro bis ChatGPT Pro
00:07:00 | Die 14.000-Dollar-Zahl erklärt
ChatGPT Pro (200 $/Monat) entspricht ~14.000 $ API-Gegenwert; Claude Max (200 $) ~8.000 $
00:08:07 | Break-even und Margenrisiko
Anthropic break-even bei ~20 % Auslastung; OpenAI-200-$-Plan rentiert sich nur unter 5,7 %
00:09:52 | Preiskampf: OpenAI senkt Token-Preise
WSJ-Bericht: OpenAI plant massive Preissenkungen als Reaktion auf Fable
00:11:12 | Fable-API-Preis und Einordnung
Aktuell 50 $/1M Token (vorher 125 $) – immer noch ~2× teurer als Opus
00:13:46 | Empfehlung: Welche Tools jetzt nutzen?
Cursor, Claude Code, ChatGPT Pro – solange die Subventionierung anhält
00:16:04 | Google AI Overviews – Klage und SEO-Konsequenzen
Zwei Verlage klagen; nur ~1 % der Nutzer klicken auf Quellenangaben
00:19:02 | EU-Haftungsurteil: Google haftet für falsche Overviews
Regelung vom 3. Juni, 9 Monate Übergangsfrist, Einspruchsrecht für Publisher
00:20:51 | Googles rechtliche Gegenwehr
Revision wahrscheinlich; langfristige Konsequenzen noch offen
00:21:48 | Apex Agents Benchmark: Gemini Flash 3.5 vs. Claude Sonnet 5
Gemini Flash 3.5 ~50 %, Claude Sonnet 5 ~45 % – gezieltes Agentic-Training als Erklärung
00:23:20 | Gemini 3.5 Pro – Vorsicht mit dem Hype
Early-Access-Feedback bisher verhalten
00:28:12 | Tool-Tipp: TextLottie
Lottie-Animationen direkt aus Codex/Claude Code generieren
00:30:27 | Praxistest: Website-Rebuild mit Claude/Fable
Komplette Homepage inkl. CMS und dynamischer Hero-Animation
00:33:58 | Fazit & Ausblick
Subscription-Fenster nutzen, Preiskampf beobachten, Google-Entwicklung verfolgen
---
Shownotes:
WSJ berichtet über geplante drastische Preissenkungen bei OpenAI als Reaktion auf Anthropics neues Modell:
https://www.wsj.com/tech/ai/openai-considers-drastic-price-cuts-anticipating-war-for-users-with-anthropic-9b8c178e?mod=e2tw
SemiAnalysis analysiert Subscription- vs. API-Margen bei OpenAI und Anthropic – inklusive Break-even-Berechnung:
https://x.com/SemiAnalysis_/status/2064815042374074396
Heise berichtet über das Münchner Urteil: Google muss für falsche Aussagen in AI Overviews haften:
https://www.heise.de/en/news/LG-Munich-I-Google-ordered-to-pay-for-false-statements-in-AI-summaries-11327217.html
Jake warnt davor, Token-Kosten auf Basis von Durchschnittspreisen zu berechnen – Modelle verbrauchen sehr unterschiedliche Mengen:
https://x.com/JakeKAllDay/status/2064870609796898862/photo/1
TextLottie: Open-Source-Skill für Codex und Claude Code, der Lottie-Animationen direkt aus dem Coding-Agenten generiert:
https://x.com/konstipaulus/status/2064011863889788972
- Quelle zu: https://www.theinformation.com/newsletters/the-briefing/german-court-ruling-google-spotlights-ai-liability-question
- Maßgeschneiderte KI-Strategien und -Lösungen – von der Idee über das Modell-Training bis zur produktiven Integration: https://wojcik.de
- The biggest IPO in history is now 4x oversubscribed, with SpaceX $SPCX drawing $250B in demand against a $75B raise: https://x.com/NoLimitGains/status/2064439231968166348
00:00:06 | Intro & Themenüberblick
Worum es geht: Preiskampf, Fable-Test, Google-Haftung
00:00:34 | Claude Fable – Ersteindruck
Mythos-Architektur, Stärken im Coding, Schwächen in anderen Wissensbereichen
00:01:13 | Fable vs. Opus 4.8
Direktvergleich im Host-Workflow – Opus 4.8 bleibt vorn
00:03:09 | Fable fliegt aus Subscriptions
Zugang endet ~22. Juni; danach nur noch API zu 50 $/1M Token
00:05:00 | Subscription vs. API – Die Subventions-Analyse
SemiAnalysis-Daten: Token-Gegenwert je Plan von Claude Pro bis ChatGPT Pro
00:07:00 | Die 14.000-Dollar-Zahl erklärt
ChatGPT Pro (200 $/Monat) entspricht ~14.000 $ API-Gegenwert; Claude Max (200 $) ~8.000 $
00:08:07 | Break-even und Margenrisiko
Anthropic break-even bei ~20 % Auslastung; OpenAI-200-$-Plan rentiert sich nur unter 5,7 %
00:09:52 | Preiskampf: OpenAI senkt Token-Preise
WSJ-Bericht: OpenAI plant massive Preissenkungen als Reaktion auf Fable
00:11:12 | Fable-API-Preis und Einordnung
Aktuell 50 $/1M Token (vorher 125 $) – immer noch ~2× teurer als Opus
00:13:46 | Empfehlung: Welche Tools jetzt nutzen?
Cursor, Claude Code, ChatGPT Pro – solange die Subventionierung anhält
00:16:04 | Google AI Overviews – Klage und SEO-Konsequenzen
Zwei Verlage klagen; nur ~1 % der Nutzer klicken auf Quellenangaben
00:19:02 | EU-Haftungsurteil: Google haftet für falsche Overviews
Regelung vom 3. Juni, 9 Monate Übergangsfrist, Einspruchsrecht für Publisher
00:20:51 | Googles rechtliche Gegenwehr
Revision wahrscheinlich; langfristige Konsequenzen noch offen
00:21:48 | Apex Agents Benchmark: Gemini Flash 3.5 vs. Claude Sonnet 5
Gemini Flash 3.5 ~50 %, Claude Sonnet 5 ~45 % – gezieltes Agentic-Training als Erklärung
00:23:20 | Gemini 3.5 Pro – Vorsicht mit dem Hype
Early-Access-Feedback bisher verhalten
00:28:12 | Tool-Tipp: TextLottie
Lottie-Animationen direkt aus Codex/Claude Code generieren
00:30:27 | Praxistest: Website-Rebuild mit Claude/Fable
Komplette Homepage inkl. CMS und dynamischer Hero-Animation
00:33:58 | Fazit & Ausblick
Subscription-Fenster nutzen, Preiskampf beobachten, Google-Entwicklung verfolgen
---
Shownotes:
WSJ berichtet über geplante drastische Preissenkungen bei OpenAI als Reaktion auf Anthropics neues Modell:
https://www.wsj.com/tech/ai/openai-considers-drastic-price-cuts-anticipating-war-for-users-with-anthropic-9b8c178e?mod=e2tw
SemiAnalysis analysiert Subscription- vs. API-Margen bei OpenAI und Anthropic – inklusive Break-even-Berechnung:
https://x.com/SemiAnalysis_/status/2064815042374074396
Heise berichtet über das Münchner Urteil: Google muss für falsche Aussagen in AI Overviews haften:
https://www.heise.de/en/news/LG-Munich-I-Google-ordered-to-pay-for-false-statements-in-AI-summaries-11327217.html
Jake warnt davor, Token-Kosten auf Basis von Durchschnittspreisen zu berechnen – Modelle verbrauchen sehr unterschiedliche Mengen:
https://x.com/JakeKAllDay/status/2064870609796898862/photo/1
TextLottie: Open-Source-Skill für Codex und Claude Code, der Lottie-Animationen direkt aus dem Coding-Agenten generiert:
https://x.com/konstipaulus/status/2064011863889788972
- Quelle zu: https://www.theinformation.com/newsletters/the-briefing/german-court-ruling-google-spotlights-ai-liability-question
- Maßgeschneiderte KI-Strategien und -Lösungen – von der Idee über das Modell-Training bis zur produktiven Integration: https://wojcik.de
- The biggest IPO in history is now 4x oversubscribed, with SpaceX $SPCX drawing $250B in demand against a $75B raise: https://x.com/NoLimitGains/status/2064439231968166348
Mehr
09.06.2026
53 Minuten
Zwei Themen dominieren die KI-Woche – und beide zeigen, wie schnell sich Begriffe und Erwartungen verselbstständigen, bevor die Realität sie einholt.
Peter Steinbergers Tweet vom 7. Juni hat 2,2 Millionen Views gesammelt. Sechs Wörter: „You should be designing loops that prompt your agents." Problem: In den Replies streiten alle darüber, was das überhaupt bedeutet. Die Folge erklärt Boris Chernys Definition vom WorkOS-Event, zeigt die fünfjährige Entwicklungsgeschichte von ReAct über AutoGPT bis zur heutigen Orchestrierungsebene – und nimmt den Cron-Job-Einwand ernst. Dazu ein konkretes Praxisbeispiel: 90 Minuten autonomes Codex-Coding, 630.000 Tokens, ein eigener LLM-Benchmark steigt von 90,1 auf 91,0 Prozent.
Parallel brodelt der Hype um Claude Mythos. Leak-Outputs aus der DevMode-Community zeigen einen macOS-Klon mit 50.000 Tokens und funktionierendem Browser, einen Cut-the-Rope-Nachbau mit Level-Editor und Musik-Generierung über Code – alles auf Low Thinking Effort. Anthropic-interne Daten sollen 52-fache Trainings-Code-Speedups in bestimmten Optimierungsaufgaben zeigen. Polymarket sah die Release-Wahrscheinlichkeit innerhalb einer Woche bei 40 Prozent – vier Tage zuvor lag sie noch bei 3 Prozent. Preisgerüchte: rund 125 Dollar pro einer Million Output-Token, zwei Versionen für Endnutzer und Enterprise.
Außerdem: Clive Chan verlässt OpenAI nach 2,4 Jahren im Custom-Chip-Programm und wechselt zu Anthropic. OpenAI plant den eigenen Inferenz-Chip für H2 2026. Apple WWDC bringt ein neues Siri, möglicherweise mit Gemini-Backend. Und Ramp-Kreditkartendaten für Juni zeigen: Anthropic führt im B2B-Wachstum – OpenAI taucht nicht mehr unter den Top-Playern auf.
00:00:08 Intro & Format
00:03:17 Claude Mythos – erste Community-Outputs
00:06:00 Generierungszeit und Kosten
00:07:13 GPT-5.06 – erste Infos aus internen Tests
00:15:33 Mythos-Preise und zwei Versionen
00:18:21 Release-Prognose via Polymarket
00:20:32 Mythos-Preise konkret: $125 pro 1M Output-Token
00:21:22 Gemini 3.5 Pro Leak
00:25:32 Peter Steinbergers viraler Loop-Tweet
00:26:44 Loop vs. Prompt – was ist der Unterschied?
00:29:31 Praxisbeispiel: 90 Minuten autonomes Codex-Coding
00:32:53 Sub-Agents und parallele Loops
00:36:37 Warnung: Token-Kosten können explodieren
00:38:15 Loop-Coding erklärt: Der Mensch schreibt die Schleife
00:40:18 Verifikation als wichtigster Erfolgsfaktor
00:40:43 Das größte Risiko bei AI-Agents
00:41:05 Skills sind das Asset, nicht der Loop
00:41:35 Vom Prompt Engineer zum Agent-Orchestrator
00:42:22 Brain Drain: Chip-Ingenieur wechselt von OpenAI zu Anthropic
00:43:38 OpenAIs eigener Inferenz-Chip
00:44:01 Apple WWDC: Neues Siri mit Gemini-Backend?
00:46:27 Ramp-Marktdaten Juni: Wer wächst wirklich?
00:47:21 Anthropic führt – OpenAI verliert Boden
00:48:37 Abschluss & Ausblick
Shownotes:
Der virale Tweet, der die Debatte ausgelöst hat – mit Einordnung der Loop-Definition und fünfjähriger Entwicklungsgeschichte: https://x.com/mvanhorn/status/2063865685558903149
Weitere Mythos-Outputs auf Low Effort, mit Hinweis auf deutlich bessere Ergebnisse bei xHigh/Max: https://x.com/Lentils80/status/2063686677160149501
Mythos-Output-Thread mit Pixel Art, Piano-Musik-Visualizer und Cut-the-Rope-Nachbau aus der DevMode-Community: https://x.com/mirochill/status/2062931007725015356
Mythos generiert Musik über Code – Einordnung als „First Principles"-Ansatz für Audio: https://x.com/chetaslua/status/206361381924369210
Polymarket-Einordnung: Release-Wahrscheinlichkeit von 3 % auf 40 % in vier Tagen, Modell kurz in Anthropic-UI aufgetaucht: https://x.com/goodworse/status/2063579122555662763
Mythos vs. GPT-5.6 – Vergleich von Leak-Outputs, mit Hinweis auf möglichen IPO-Hype als Verzerrungsfaktor: https://x.com/notjazii/status/2063272880708956258
Clive Chan verlässt OpenAI nach 2,4 Jahren im Custom-Chip-Programm und wechselt zu Anthropic: https://x.com/itsclivetime/status/2063356118525792542
Peter Steinbergers Tweet vom 7. Juni hat 2,2 Millionen Views gesammelt. Sechs Wörter: „You should be designing loops that prompt your agents." Problem: In den Replies streiten alle darüber, was das überhaupt bedeutet. Die Folge erklärt Boris Chernys Definition vom WorkOS-Event, zeigt die fünfjährige Entwicklungsgeschichte von ReAct über AutoGPT bis zur heutigen Orchestrierungsebene – und nimmt den Cron-Job-Einwand ernst. Dazu ein konkretes Praxisbeispiel: 90 Minuten autonomes Codex-Coding, 630.000 Tokens, ein eigener LLM-Benchmark steigt von 90,1 auf 91,0 Prozent.
Parallel brodelt der Hype um Claude Mythos. Leak-Outputs aus der DevMode-Community zeigen einen macOS-Klon mit 50.000 Tokens und funktionierendem Browser, einen Cut-the-Rope-Nachbau mit Level-Editor und Musik-Generierung über Code – alles auf Low Thinking Effort. Anthropic-interne Daten sollen 52-fache Trainings-Code-Speedups in bestimmten Optimierungsaufgaben zeigen. Polymarket sah die Release-Wahrscheinlichkeit innerhalb einer Woche bei 40 Prozent – vier Tage zuvor lag sie noch bei 3 Prozent. Preisgerüchte: rund 125 Dollar pro einer Million Output-Token, zwei Versionen für Endnutzer und Enterprise.
Außerdem: Clive Chan verlässt OpenAI nach 2,4 Jahren im Custom-Chip-Programm und wechselt zu Anthropic. OpenAI plant den eigenen Inferenz-Chip für H2 2026. Apple WWDC bringt ein neues Siri, möglicherweise mit Gemini-Backend. Und Ramp-Kreditkartendaten für Juni zeigen: Anthropic führt im B2B-Wachstum – OpenAI taucht nicht mehr unter den Top-Playern auf.
00:00:08 Intro & Format
00:03:17 Claude Mythos – erste Community-Outputs
00:06:00 Generierungszeit und Kosten
00:07:13 GPT-5.06 – erste Infos aus internen Tests
00:15:33 Mythos-Preise und zwei Versionen
00:18:21 Release-Prognose via Polymarket
00:20:32 Mythos-Preise konkret: $125 pro 1M Output-Token
00:21:22 Gemini 3.5 Pro Leak
00:25:32 Peter Steinbergers viraler Loop-Tweet
00:26:44 Loop vs. Prompt – was ist der Unterschied?
00:29:31 Praxisbeispiel: 90 Minuten autonomes Codex-Coding
00:32:53 Sub-Agents und parallele Loops
00:36:37 Warnung: Token-Kosten können explodieren
00:38:15 Loop-Coding erklärt: Der Mensch schreibt die Schleife
00:40:18 Verifikation als wichtigster Erfolgsfaktor
00:40:43 Das größte Risiko bei AI-Agents
00:41:05 Skills sind das Asset, nicht der Loop
00:41:35 Vom Prompt Engineer zum Agent-Orchestrator
00:42:22 Brain Drain: Chip-Ingenieur wechselt von OpenAI zu Anthropic
00:43:38 OpenAIs eigener Inferenz-Chip
00:44:01 Apple WWDC: Neues Siri mit Gemini-Backend?
00:46:27 Ramp-Marktdaten Juni: Wer wächst wirklich?
00:47:21 Anthropic führt – OpenAI verliert Boden
00:48:37 Abschluss & Ausblick
Shownotes:
Der virale Tweet, der die Debatte ausgelöst hat – mit Einordnung der Loop-Definition und fünfjähriger Entwicklungsgeschichte: https://x.com/mvanhorn/status/2063865685558903149
Weitere Mythos-Outputs auf Low Effort, mit Hinweis auf deutlich bessere Ergebnisse bei xHigh/Max: https://x.com/Lentils80/status/2063686677160149501
Mythos-Output-Thread mit Pixel Art, Piano-Musik-Visualizer und Cut-the-Rope-Nachbau aus der DevMode-Community: https://x.com/mirochill/status/2062931007725015356
Mythos generiert Musik über Code – Einordnung als „First Principles"-Ansatz für Audio: https://x.com/chetaslua/status/206361381924369210
Polymarket-Einordnung: Release-Wahrscheinlichkeit von 3 % auf 40 % in vier Tagen, Modell kurz in Anthropic-UI aufgetaucht: https://x.com/goodworse/status/2063579122555662763
Mythos vs. GPT-5.6 – Vergleich von Leak-Outputs, mit Hinweis auf möglichen IPO-Hype als Verzerrungsfaktor: https://x.com/notjazii/status/2063272880708956258
Clive Chan verlässt OpenAI nach 2,4 Jahren im Custom-Chip-Programm und wechselt zu Anthropic: https://x.com/itsclivetime/status/2063356118525792542
Mehr
05.06.2026
53 Minuten
In dieser AI Talk Folge geht es um mein Experiment, ein eigenes SEO LLM per LoRA Fine-Tuning zu trainieren.
Ich spreche darüber, wie ich aus meinem SEO Benchmark Trainingsdaten erstelle, warum gute Datensätze wichtiger sind als reine Menge und wie ich ein Open-Weight-Modell gezielt für technische SEO-Aufgaben, strukturierte Daten, Onpage, Offpage, Crawling und Agent-Workflows optimieren möchte.
Außerdem geht es um Qwen 3.6, lokale LLMs, RunPod, GPU-Setups, Benchmarks, Student-Teacher-Ansätze und die Frage, ob ein kleineres Modell nah genug an große Topmodelle herankommen kann, um in echten Workflows deutlich günstiger eingesetzt zu werden.
Ein großer Teil der Folge zeigt auch, warum Fine-Tuning ein iterativer Prozess ist: trainieren, testen, Fehler analysieren, Trainingsdaten verbessern und erneut benchmarken.
Kapitel:
00:00 Einstieg: Warum ein eigenes SEO LLM? 02:42 SEO Benchmark, Student-Teacher-Prinzip und Modellvergleich 05:12 Codex, Claude Code, Cursor und aktuelle Coding-Tools 07:48 Trainingsstatus, Setup und lokale Modelle 13:15 Qwen 3.6 als Basis für das Fine-Tuning 17:48 Aufbau der SEO-Trainingsdaten 24:45 Training starten, Datensätze kuratieren und LoRA verstehen 30:42 Benchmark-Test mit dem neuen Modell 32:36 Iteration: Trainieren, testen, verbessern 39:02 Erste Ergebnisse, Rückschritte und Learnings 46:38 Analyse mit starken Modellen und Vorbereitung für V4 57:14 Neuer Trainingslauf mit optimierten Beispielen 58:15 Nächster Schritt: Tool- und Function-Calling-Training 59:54 Fazit: Wie ich LLMs optimiere 01:02:05 Warum Benchmark und Trainingsdaten getrennt bleiben müssen 01:03:06 Ziel: Ein günstigeres spezialisiertes SEO Brain Modell
Ich spreche darüber, wie ich aus meinem SEO Benchmark Trainingsdaten erstelle, warum gute Datensätze wichtiger sind als reine Menge und wie ich ein Open-Weight-Modell gezielt für technische SEO-Aufgaben, strukturierte Daten, Onpage, Offpage, Crawling und Agent-Workflows optimieren möchte.
Außerdem geht es um Qwen 3.6, lokale LLMs, RunPod, GPU-Setups, Benchmarks, Student-Teacher-Ansätze und die Frage, ob ein kleineres Modell nah genug an große Topmodelle herankommen kann, um in echten Workflows deutlich günstiger eingesetzt zu werden.
Ein großer Teil der Folge zeigt auch, warum Fine-Tuning ein iterativer Prozess ist: trainieren, testen, Fehler analysieren, Trainingsdaten verbessern und erneut benchmarken.
Kapitel:
00:00 Einstieg: Warum ein eigenes SEO LLM? 02:42 SEO Benchmark, Student-Teacher-Prinzip und Modellvergleich 05:12 Codex, Claude Code, Cursor und aktuelle Coding-Tools 07:48 Trainingsstatus, Setup und lokale Modelle 13:15 Qwen 3.6 als Basis für das Fine-Tuning 17:48 Aufbau der SEO-Trainingsdaten 24:45 Training starten, Datensätze kuratieren und LoRA verstehen 30:42 Benchmark-Test mit dem neuen Modell 32:36 Iteration: Trainieren, testen, verbessern 39:02 Erste Ergebnisse, Rückschritte und Learnings 46:38 Analyse mit starken Modellen und Vorbereitung für V4 57:14 Neuer Trainingslauf mit optimierten Beispielen 58:15 Nächster Schritt: Tool- und Function-Calling-Training 59:54 Fazit: Wie ich LLMs optimiere 01:02:05 Warum Benchmark und Trainingsdaten getrennt bleiben müssen 01:03:06 Ziel: Ein günstigeres spezialisiertes SEO Brain Modell
Mehr
02.06.2026
53 Minuten
In dieser AI Talk Folge geht es um Nvidia DGX Spark, lokale LLMs, neue Open-Weight-Modelle, Minimax M3, Coding-Benchmarks, ein neues Video-Modell von xAI und den Meta Support Assistant Hack.
Außerdem zeige ich mein nächstes Experiment: ein eigenes SEO LLM per LoRA Fine-Tuning. Dafür will ich aus meinem SEO Benchmark Trainingsdaten bauen und ein Modell stärker auf technische SEO-Aufgaben, Crawling, Onpage, Offpage und Agent-Workflows optimieren.
Kapitelübersicht:
00:00 Neues Setup und KI-Co-Host
02:42 Alphabet und AI-Infrastruktur
05:02 Nvidia DGX Spark und lokale LLMs
07:30 KI im Betriebssystem
10:30 DGX Station und Blackwell Power
14:23 Nvidia Nemotron 3 Ultra
17:19 Minimax M3 für Coding
21:41 Neues Video-Modell von xAI
24:04 Coding-Benchmarks und Modellpreise
28:11 Meta Support Assistant Hack
31:37 KI-Co-Host im Live-Test
33:19 Eigenes SEO LLM per LoRA
41:37 Anthropic IPO und Preisdruck
50:20 Fazit und Ausblick
02.06.2026 · AI Talk 3
Shownotes
Grok Imagine Video 1.5 Preview | xAI Docs: Pricing $0.08 per second Pricing Output $0.08 per second You are charged for each second of video generated when using the API. https://docs.x.ai/developers/models/grok-imagine-video-1.5-preview
Meta's AI chatbot helped attackers take over Instagram accounts | heise online: The attack vector was made public by US tech magazine 404 Media , which refers to Telegram groups of security researchers and hacking group… https://www.heise.de/en/news/Meta-s-AI-chatbot-helped-attackers-take-over-Instagram-accounts-11314517.html
Persönlicher KI-Supercomputer | NVIDIA DGX Station: Tensor-Recheneinheiten der NVIDIA Blackwell-Generation NVIDIA DGX Station verfügt über Tensor-Recheneinheiten der NVIDIA Blackwell Generation, die 4-Bit-Gleitkomma-KI… https://www.nvidia.com/de-de/products/workstations/dgx-station/
NASDAQ-Aktie Alphabet schwächer: Riesen-Kapitalerhöhung geplant - Blick auf den Berkshire-Anteil | finanzen.net: Google befindet sich damit in guter Gesellschaft: Amazon etwa plant, rund 200 Milliarden Dollar zu investi… https://www.finanzen.net/nachricht/aktien/ausbau-alphabet-aktie-sinkt-mega-kapitalerhoehung-fuer-ki-offensive-berkshire-anteil-im-blick-15723078
Warren Buffett steigt mit 10 Milliarden Dollar bei Alphabets KI-Offensive ein: Juni 2026 Alphabet plant eine Kapitalerhöhung von 80 Milliarden Dollar, um seine KI-Infrastruktur auszubauen. https://the-decoder.de/warren-buffett-steigt-mit-10-milliarden-dollar-bei-alphabets-ki-offensive-ein/
OpenAI models and Codex on Amazon Bedrock are now generally available | Artificial Intelligence: More than 5 million people use Codex every week to write, refactor, debug, test, and validate code across large codebases. https://aws.amazon.com/blogs/machine-learning/openai-models-and-codex-on-amazon-bedrock-are-now-generally-available/
Regional availability - Amazon Bedrock: Virginia) Legacy (EOL: 2026-09-30) Rerank Region In-Region Geo Global us-west-2 (Oregon) ca-central-1 (Canada) eu-central-1 (Frankfurt) ap-northeast-1 (Tokyo) Nova Sonic Region In… https://docs.aws.amazon.com/bedrock/latest/userguide/models-region-compatibility.html
Nemotron 3 Ultra: Nvidias neues Open-Source-Modell ist laut Benchmark das stärkste der USA: Bild: AAII Beim Anbieter DeepInfra liefert Nemotron 3 Ultra laut Artificial Analysis zudem mehr als 300 Token pro Sekunde. https://the-decoder.de/nemotron-3-ultra-nvidias-neues-open-source-modell-ist-laut-benchmark-das-staerkste-der-usa/
Anthropic confidentially submits draft S-1 to the SEC \ Anthropic: Skip to main content Skip to footer Try Claude Announcements Anthropic confidentially submits draft S-1 to the SEC Jun 1, 2026 Today, Anthropic, PBC con… https://www.anthropic.com/news/confidential-draft-s1-sec
MiniMax M3: Frontier Coding, 1M Context, Native Multimodality — All in One Model - MiniMax Research | MiniMax: Its clean, scalable, easy-to-implement, and hardware-friendly characteristics allow its theoretical gains to… https://www.minimax.io/blog/minimax-m3
Außerdem zeige ich mein nächstes Experiment: ein eigenes SEO LLM per LoRA Fine-Tuning. Dafür will ich aus meinem SEO Benchmark Trainingsdaten bauen und ein Modell stärker auf technische SEO-Aufgaben, Crawling, Onpage, Offpage und Agent-Workflows optimieren.
Kapitelübersicht:
00:00 Neues Setup und KI-Co-Host
02:42 Alphabet und AI-Infrastruktur
05:02 Nvidia DGX Spark und lokale LLMs
07:30 KI im Betriebssystem
10:30 DGX Station und Blackwell Power
14:23 Nvidia Nemotron 3 Ultra
17:19 Minimax M3 für Coding
21:41 Neues Video-Modell von xAI
24:04 Coding-Benchmarks und Modellpreise
28:11 Meta Support Assistant Hack
31:37 KI-Co-Host im Live-Test
33:19 Eigenes SEO LLM per LoRA
41:37 Anthropic IPO und Preisdruck
50:20 Fazit und Ausblick
02.06.2026 · AI Talk 3
Shownotes
Grok Imagine Video 1.5 Preview | xAI Docs: Pricing $0.08 per second Pricing Output $0.08 per second You are charged for each second of video generated when using the API. https://docs.x.ai/developers/models/grok-imagine-video-1.5-preview
Meta's AI chatbot helped attackers take over Instagram accounts | heise online: The attack vector was made public by US tech magazine 404 Media , which refers to Telegram groups of security researchers and hacking group… https://www.heise.de/en/news/Meta-s-AI-chatbot-helped-attackers-take-over-Instagram-accounts-11314517.html
Persönlicher KI-Supercomputer | NVIDIA DGX Station: Tensor-Recheneinheiten der NVIDIA Blackwell-Generation NVIDIA DGX Station verfügt über Tensor-Recheneinheiten der NVIDIA Blackwell Generation, die 4-Bit-Gleitkomma-KI… https://www.nvidia.com/de-de/products/workstations/dgx-station/
NASDAQ-Aktie Alphabet schwächer: Riesen-Kapitalerhöhung geplant - Blick auf den Berkshire-Anteil | finanzen.net: Google befindet sich damit in guter Gesellschaft: Amazon etwa plant, rund 200 Milliarden Dollar zu investi… https://www.finanzen.net/nachricht/aktien/ausbau-alphabet-aktie-sinkt-mega-kapitalerhoehung-fuer-ki-offensive-berkshire-anteil-im-blick-15723078
Warren Buffett steigt mit 10 Milliarden Dollar bei Alphabets KI-Offensive ein: Juni 2026 Alphabet plant eine Kapitalerhöhung von 80 Milliarden Dollar, um seine KI-Infrastruktur auszubauen. https://the-decoder.de/warren-buffett-steigt-mit-10-milliarden-dollar-bei-alphabets-ki-offensive-ein/
OpenAI models and Codex on Amazon Bedrock are now generally available | Artificial Intelligence: More than 5 million people use Codex every week to write, refactor, debug, test, and validate code across large codebases. https://aws.amazon.com/blogs/machine-learning/openai-models-and-codex-on-amazon-bedrock-are-now-generally-available/
Regional availability - Amazon Bedrock: Virginia) Legacy (EOL: 2026-09-30) Rerank Region In-Region Geo Global us-west-2 (Oregon) ca-central-1 (Canada) eu-central-1 (Frankfurt) ap-northeast-1 (Tokyo) Nova Sonic Region In… https://docs.aws.amazon.com/bedrock/latest/userguide/models-region-compatibility.html
Nemotron 3 Ultra: Nvidias neues Open-Source-Modell ist laut Benchmark das stärkste der USA: Bild: AAII Beim Anbieter DeepInfra liefert Nemotron 3 Ultra laut Artificial Analysis zudem mehr als 300 Token pro Sekunde. https://the-decoder.de/nemotron-3-ultra-nvidias-neues-open-source-modell-ist-laut-benchmark-das-staerkste-der-usa/
Anthropic confidentially submits draft S-1 to the SEC \ Anthropic: Skip to main content Skip to footer Try Claude Announcements Anthropic confidentially submits draft S-1 to the SEC Jun 1, 2026 Today, Anthropic, PBC con… https://www.anthropic.com/news/confidential-draft-s1-sec
MiniMax M3: Frontier Coding, 1M Context, Native Multimodality — All in One Model - MiniMax Research | MiniMax: Its clean, scalable, easy-to-implement, and hardware-friendly characteristics allow its theoretical gains to… https://www.minimax.io/blog/minimax-m3
Mehr
29.05.2026
53 Minuten
In dieser AI Talk Folge spreche ich über Deepseek v4, Cursor Composer 2.5, Codex, Claude Code und neue Agent Tools.
Deepseek v4 Pro hat in meinen Benchmarks extrem stark performt und ist preislich deutlich günstiger als viele westliche Frontier Modelle. Gleichzeitig zeige ich, wo politische Biases und Antwortverweigerungen problematisch werden können.
Außerdem teile ich meine Erfahrungen mit Cursor Composer 2.5 aus einem echten Coding-Projekt, spreche über Codex Updates, Claude Code, Microsoft Agent Skills, steigende Token-Kosten in Unternehmen und den neuen Chrome DevTools MCP Server für Performance Audits.
Eine Folge über neue KI-Modelle, Coding Agents, Kosten, Benchmarks und die Frage, welche Tools im Alltag wirklich nützlich sind.
Deepseek v4 Pro hat in meinen Benchmarks extrem stark performt und ist preislich deutlich günstiger als viele westliche Frontier Modelle. Gleichzeitig zeige ich, wo politische Biases und Antwortverweigerungen problematisch werden können.
Außerdem teile ich meine Erfahrungen mit Cursor Composer 2.5 aus einem echten Coding-Projekt, spreche über Codex Updates, Claude Code, Microsoft Agent Skills, steigende Token-Kosten in Unternehmen und den neuen Chrome DevTools MCP Server für Performance Audits.
Eine Folge über neue KI-Modelle, Coding Agents, Kosten, Benchmarks und die Frage, welche Tools im Alltag wirklich nützlich sind.
Mehr
Über diesen Podcast
Wir sprechen über KI, LLMs, AI Agents, SEO und Online Marketing. Im
Fokus stehen neue Tools, aktuelle Entwicklungen, praktische
Learnings und die Frage, was davon wirklich nützlich ist und was
eher Hype bleibt.
Kommentare (0)
Melde Dich an, um einen Kommentar zu schreiben.