Podcaster
Episoden
09.03.2026
1 Stunde 12 Minuten
Im aktuellen Rückblick sprechen wir über die neuen Modelle Nano
Banana 2, Seedream 5 Light und das neue Videomodell Seedance 2.0.
Außerdem geht es um die massive Disruption der Produktfotografie,
den Umgang mit Trainingsdaten und die Frage, warum
wissenschaftliche Daten plötzlich bezahlt werden, kreative Werke
aber oft nicht.Im Gespräch mit Medienwissenschaftler Prof. Dr.
Jens Schröter von der Rheinischen Friedrich-Wilhelms-Universität
Bonn wird es dann grundsätzlich: Was ist Kreativität, was bleibt
von der Fotografie, und wie verändert KI unseren Begriff von
Authentizität, Kunst und Wirklichkeit? Und was haben UFOs, Pilze
und KI gemeinsam?
HIGHLIGHTS
(0:08) – Februar-Rückblick & Modellschub
Rückblick auf den Februar 2026: Mehrere Releases und Leaks
sorgen für Dynamik im KI-Toolmarkt.
(0:27) – Nano Banana 2 & Seedream 5 Light
Einordnung der neuen Bildmodelle und des Naming-Chaos: Nano
Banana – Nano Banana – Nano Banana 2. Testergebnis: schneller,
günstiger und stabiler als Seedream 5 Light, das teils
inkonsistent reagiert und stärker zensiert ist.
(3:29) – Vision Grounded Search
Nano Banana 2 und Seedream 5 Light nutzen eine neue Logik:
Das Modell kann während der Generierung online nach visuellen
Referenzen suchen.
(9:47) – Seedance 2.0 & verschobener Release
Das neue ByteDance-Videomodell kursiert bereits online, ist
offiziell noch nicht veröffentlicht. Der Release wurde offenbar
mehrfach verschoben, während das Netz bereits mit Demo-Clips
gefüllt ist.
(10:47) – Hollywood reagiert auf KI-Deepfakes
Studios und Rechteinhaber protestieren gegen die Nutzung
ihrer Figuren und Gesichter ohne Zustimmung. Gleichzeitig stellt
sich die Frage, ob westliche Firmen juristisch gegen ByteDance
vorgehen können.
(14:08) – Warum Seedance 2.0 überzeugt
Aus einfachen Prompts entstehen cineastische
15-Sekunden-Clips mit Schnitt, Kameraführung, Dramaturgie und
Sounddesign. Das Modell versteht filmische Sprache überraschend
gut und wirkt derzeit stärker als Googles oder Klings
Videomodelle. Problematisch bleibt eine chaotische, sich ständig
ändernde Zensur in Beta.
(19:23) – KI in der Produktfotografie
Ein neues Google-Tool zeigt, wie aus einfachem
Ausgangsmaterial sofort professionelle Produktbilder und Szenen
entstehen. Der Markt für klassische Produktfotografie könnte sich
dadurch stark verändern.
(22:50) – ZDF-Fall: KI-Material im Nachrichtenkontext
Diskutiert wird ein KI-generierter Clip in einem ZDF-Beitrag
mit sichtbar gebliebenem Sora-Logo. Die Kritik richtet sich nicht
nur auf fehlende Kennzeichnung, sondern auch auf redaktionelle
Abläufe, Verifikation und Krisenkommunikation.
(32:14) – Zu Gast ist Jens Schröter: Medienkultur, Pilze, UFOs
Mit dem Medienwissenschaftler Prof. Dr. Jens Schröter
verschiebt sich das Gespräch zu Grundsatzfragen. Beispiele aus
Mushroom Studies und UFO-Forschung dienen als Metapher dafür, wie
Kultur mit radikal Fremdem umgeht – auch mit KI.
(37:49) – KI als fremde Intelligenz
Schröter schlägt vor, KI nicht nur als Spiegel menschlicher
Kultur zu sehen, sondern als mögliche Form andersartiger
Intelligenz.
Boris hält dagegen: Das Fremde wird meist durch menschliche
Kategorien gedacht.
(42:00) – Kreativität: Simulation oder Praxis
Diskutiert wird, ob KI Kreativität nur simuliert oder bereits
kreativ handelt. Schröter argumentiert, dass auch menschliche
Kreativität meist auf vorhandenen Mustern und kulturellen Feldern
basiert.
(49:39) – Margaret Boden & Regelbruch
Boris bringt Margaret Bodens Kreativitätstheorie ins Spiel:
Kombination, Mustererkennung und möglicher Regelbruch. Offen
bleibt, ob KI echte Regelüberschreitung leisten kann.
(1:00:33) – Fotografie im Wandel
Fotografie war historisch immer ein Feld technischer Umbrüche
– von Chemie über Elektronik bis zur Digitalisierung.
(1:05:29) – Authentizität, Herkunft, Kontext
Entscheidend ist weniger die Frage „Ist das noch
Fotografie?“, sondern unter welchen Verfahren Bilder als
authentisch gelten. Transparenz und institutionelle Regeln werden
zentral.
Mehr
19.02.2026
50 Minuten
Im Januar 2026 ist viel passiert rund um KI, Bilder und Video.
Das chinesische Videomodell Kling 3.0 kann jetzt 4K-Videos,
mehrere Kameraperspektiven in einem Clip und immer realistischere
Szenen erzeugen, "Flux 2 Klein" ist die Minivariante von Flux 2.
Wir fragen uns, was "Lügnerdividende" ist und schauen etwas
genauer auf die Negativszenarien des CEOs von Anthropic. Wir
untersuchen die Kennzeichnungspflicht des EU AI Acts, besprechen
die Microsoft-Studie zur weltweiten Nutzung von KI und sind
erstaunt, dass die USA nur im Mittelfeld und hinter Deutschland
liegen.
Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der
Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und
Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden
Gästen über aktuelle Auswirkungen von KI auf Fotografie.
HIGHLIGHTS:
(0:00) – Jahresauftakt & Plattform-Update
Rückblick auf Januar 2026 (Folge 13).
Podcast jetzt auch auf Spotify, bald iTunes.
Weniger neue KI-Modelle als erwartet.
(0:52) – Neue Bild- & Videomodelle
Flux 2 klein: schnelles, lokal laufendes Bildmodell.
Bytedance kündigt neue Modelle an.
„Kling 3.0“ (China): 4K, 15 Sekunden, Multishot (mehrere
Kameraeinstellungen im Prompt), Ton- & Stimmenklonen.
Trend: Video wird als generierter 3D-Raum gedacht – Bild und
Film verschmelzen.
(4:22) – KI im Foto-Alltag
Workshops zeigen:
KI wird für hybride Aufgaben genutzt (Menschen ergänzen,
Retusche, Begrünung, etc.).
Kommerzielle Fotografie war immer inszeniert – KI verstärkt
das.
Zentrale Frage: Wird das künftig als „Deepfake“ gelten?
(9:37) – EU AI Act & Kennzeichnung
KI-generierte Inhalte sollen gekennzeichnet werden.
Problem: Definition knüpft am Werkzeug (KI) an, nicht an
Authentizität.
Gefahr: Inszenierte Fotos gelten als „echt“, KI-Bilder als
„Fake“.
Forderung: Durchgängige Metadaten statt reiner KI-Markierung.
(21:03) – Politische KI-Beispiele
KI-Inszenierungen mit historischen Figuren.
Manipulierte Bilder aus politischen Kontexten.
Polizeiliche KI-Symbolbilder zur Emotionalisierung.
Problem: Behörden erzeugen eigene Bildrealitäten –
Glaubwürdigkeit leidet.
(27:10) – KI-Erkennung scheitert
Studie zeigt: Chatbots erkennen KI-Videos nicht zuverlässig.
Technische Erkennung allein reicht nicht.
(29:06) – Neue Kennzeichnungsideen
Vorschlag: Transparenz nach
Autorenschaft
Ausführung
Verfeinerung
Verifikation (Mensch/KI/Assisted).
Ansatz: Medienübergreifendes System statt einfacher
„KI“-Labels.
(35:44) – Vertrauenskrise neu definiert
„Lügner-Dividende“: Echte Bilder können als KI-Fake
diskreditiert werden.
KI-Restaurierungen verändern reale Personen subtil.
Notwendig: Vertrauenszonen je nach Kontext (Journalismus,
Werbung, freie Kunst).
(38:48) – KI-Nutzung weltweit
Microsoft-Studie zeigt:
Hohe Nutzung in VAE und Singapur.
Deutschland im Mittelfeld.
USA nicht führend bei Nutzung.
Digitalisierte Staaten adaptieren schneller.
(41:37) – Kreative vs. KI-Training
Initiativen gegen ungefragtes Training mit urheberrechtlich
geschütztem Material.
Beispiel: Bücher werden gekauft, gescannt, zerstört –
rechtlich zulässig in den USA.
(44:54) – Risiken: Doom-Szenario oder Realismus?
Essay von Dario Amodei (CEO Anthropic):
Risiken durch Überwachung, Autoritarismus, Missbrauch.
Weniger Superintelligenz, mehr reale Machtfragen.
Mehr
02.02.2026
55 Minuten
Zum Jahreswechsel überbieten sich amerikanische und chinesische
Anbieter mit neuen Modellen. OpenAI versucht mit ChatGPT 1.5 an
die Modelle von Google und Bytedance Anschluss zu finden.
Hautunreinheiten sind wieder begehrt: Higgsfield, Magnific und
Topaz bieten einen "Skin Enhancer" für einen neuen Realismus.
Im Videobereich arbeiten sich chinesische Modelle immer näher an
Google VEO 3.1 heran. Ali Baba Cloud bietet Wan 2.6 mit Sound,
Bytedance bietet mit Seedream 1.5 Pro ein Videomodell mit Sound,
Multiframe und Storyboard, das eine echte Konkurrent geworden
ist.
Wir schauen auf das viral gewordene KI-Weihnachtsvideo von
McDonald, die Jahresansprache des Instagram CEO zur Zukunft der
Contentproduktion und unterhalten uns mit unserem Gast Sabine
Richly über den aktuellen Stand des EU AI Acts.
...
Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der
Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und
Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden
Gästen über aktuelle Auswirkungen von KI auf Fotografie.
LINKS:
Rechtsanwältin Sabine Richly
MacDonalds Satire
IPTC
KI-Bilder Konvergenz
HIGHLIGHTS:
(00:08) - Selbstironischer Start
(01:19) - KI-Weihnachtswerbung & Backlash:
Coca-Cola: mittelmäßig, McDonald’s NL: massiver Shitstorm.
Spot „The Most Terrible Time of the Year“:
Anti-Weihnachtsbotschaft + KI-Look Ablehnung.
Verteidigung der Agentur („Our fingers hurts from typing
prompts“) wird Meme.
Cleveres Reaction-Video einer anderen Agentur kontert KI mit
KI, thematisiert Copyright & Austauschbarkeit von KI-Figuren.
(06:20) - Disney & OpenAI:
Disney lizenziert Charaktere und investiert nach vorheriger
Drohkulisse.
Strategie: erst alles zulassen, Markt schaffen, dann
lizensieren.
Fanfiction wird Marketing-Asset (UGC 2.0). Profit vor allem
für große Player.
(10:44) - Metadaten & Transparenz:
IPTC 25.1 führt detaillierte KI-Felder ein (Modell, Version,
Prompt etc.).
Wichtig für kommende Kennzeichnungspflichten; offen bleibt,
ob IPTC, C2PA oder anderes Standard wird.
Politik: mögliche Verzögerungen wegen „Komplexität“.
(14:34) - Tool- & Modell-Update:
ChatGPT Images: wenig Innovation, klarer Fokus auf
Mainstream-User.
Marktführer aus Praxis: Google (Nano Banana Pro) &
ByteDance (Seedream 4.5).
Trend: Realismus-Nachbearbeitung (Skin Enhancer, Pickel als
„Echtheitsmarker“).
Video: Kling mit starkem Sound-Generator; Foley wird
automatisiert.
Higgsfield Angles: Bilder als latente 3D-Räume neue
Perspektiven aus 2D.
Video-Modelle: ByteDance und Google aktuell vorne; kein
„bestes Modell“, alles use-case-abhängig.
(29:46) - Instagram & Authentizität:
Insta CEO Adam Mosseri erklärt Hochglanz-Ästhetik für tot.
Widerspruch: Auch „unperfekt“ kann KI faken.
Idee: Reservate für echte Fotos wären sinnvoller als noch
mehr Realismus.
(34:35) Zu Gast: Sabine Richly
EU AI Act: Code of Practice zu Transparenz/Kennzeichnung
Kennzeichnung maschinenlesbar, nicht sichtbar fürs Auge.
Problem: Freiwilligkeit, geopolitische Spannungen,
Durchsetzung.
Plattformen (Deployers) sollen visuelle Labels einblenden.
Deepfake-Begriff unscharf; Rechtsprechung wird nachschärfen.
Mehr
15.12.2025
56 Minuten
Zum Jahresende zeigt sich eine massive Beschleunigung der
generativen KI: Drei Jahre nach ChatGPT ist der Markt
fragmentierter und professioneller geworden.
Im Bildbereich setzt sich das chinesische Modell Seedream 4.5
gegen Googles Nano Banana Pro durch, vor allem durch höhere
Prompt-Treue und bessere Eignung für professionelle Workflows,
während Detailverliebtheit allein nicht mehr reicht. Mit Flux 2
und Z-Image versuchen zwei Open Source Modelle dazu
aufzuschließen.
Bei Video-KI eskaliert der Wettbewerb mit neuen Editing-, Audio-
und Cameo-Funktionen, wobei Google (Veo) aktuell vorne liegt, die
chinesische Modellen von Kling (O1 und 2.6) aber mit weniger
Zensur aufholen. Runway veröffentlich Gen 4.5.
Parallel verschieben sich die Grundfragen: Urheberrecht,
Regulierung, journalistisches Vertrauen und kulturelles Erbe
werden zur eigentlichen Frontlinie – nicht die nächste
Modellversion.
Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der
Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und
Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden
Gästen über aktuelle Auswirkungen von KI auf Fotografie.
LINKS:
Symposium des Deutschen Fotorates, Hamburg, 21.11.2025
HIGHLIGHTS:
00:00:08 | Rückblick auf November/Dezember, 3 Jahre ChatGPT /
generative KI.
00:04:03 | Black Forest Labs: 3-Mrd-Bewertung, europäische
Grundlagenarbeit, Substanz vs. Marketing.
00:05:48 | Neue KI-Bildmodelle & erste Einordnung:
FLUX 2: Gutes Open-Source-Modell - aber schwächer als
Konkurrenz.
Microsoft MAI: angekündigt, noch ungetestet.
Nano Banana Pro (Google) vs. Seedream 4 4.5 (ByteDance).
Z-Image Turbo (Alibaba): Open Source, lokal, offline,
schnell, wenig Zensur.
00:08:43 | Video-KI-Overkill Ende Nov / Anfang Dez:
Runway 4.5 angekündigt, ab Mitte Dezember verfügbar
Kling Omni (O1): nachträgliches Video-Editing per Prompt
& Referenz.
Vergleich zu Sora 2 Cameo / Veo: Deepfake-Potenzial, erste
Demos.
Kling 2.6: Video + Ton + Sprache + Musik (stark bei Musik,
schwach bei Schauspiel).
Zwischenfazit Video: Veo 3.1 vorne, Kling holt auf, Zensur
als Faktor.
00:12:39 | Geopolitik & Zensur:
Chinesische Modelle: günstiger, weniger zensiert,
Open-Source-Strategie als Marktangriff.
Persönliches Nutzungsfazit: Bild = China vorn, Video = China
schließt auf.
00:14:10 | Großer Bild-Modell-Vergleich: Nano Banana Pro vs.
Seedream 4.5
Style- & Color-Transfer: Prompt-Verständnis als
Schwachstelle.
Renaissance des Textprompts beim Prompt Editing.
Corporate / Auftrags-Usecases: Seedream stabiler, Nano Banana
detailverliebt.
Rollen-Prompts („Du bist Helmut Newton“): Referenztreue vs.
Stilfreiheit.
Usecase Werbung
00:26:16 | Vorhergehender Test Nano Banana Pro vs Seedream 4.0
00:29:06 | Klares Jahresfazit: Seedream 4.5 aktuell bestes Modell
für Prompt Editing.
00:29:13 | Strategische Positionierung der Player:
OpenAI: Masse, Gamification, Social.
Google: professionelle Tools, Infografiken, strukturierte
Prompts.
00:32:10 | Kreativer Prozess & Bewertung
Google-Ansatz: KI evaluiert eigenen Output gegen Prompt.
Kernproblem: Automatisierung vs. Mittelmaß.
China-Studie: Juniors Ideen, Seniors Bewertung &
Feinschliff.
Kreativität, Stil, Vorhersehbarkeit, Comedy-Experimente.
00:38:30 | Mitarbeit in UNESCO-Arbeitsgruppe: KI-Werke &
Weltkulturerbe.
00:39:30 | Urheberrecht & Rechtspolitik:
Provokation: „Entertaste = Auslöser“ menschliche
Autorschaft.
Gefahr juristischer Scheinpräzision (Prompt-Länge,
Iterationen).
USA vs. EU: Deregulierung, Zölle, Machtkampf.
GEMA vs. OpenAI: Präzedenzfall Trainingsdaten.
Historischer Exkurs: Fake-Image-Debatte schon 1912.
00:47:20 | Das Symposium des Fotorates:
AI Act & „Deepfake“-Kennzeichnung: Begrifflich und
praktisch problematisch.
Branchenreaktionen (Werbung, Amazon).
Vertrauensverlust: „Ich glaube euch kein Bild mehr.“
Konsequenz: Provenienz, Signaturen, Verifikation.
Vision: Foto-„Reservate“, redaktionelle Standards, Vertrauen
statt Label-Inflation.
Mehr
15.11.2025
44 Minuten
Wie verändert sich die Bildagentur-Landschaft durch KI? Unser
Gast ist diesmal Alexander Karst, Geschäftsführer von
"DieBildbeschaffer" und Berater für "Bildrecherche,
Bildeinkauf,Bildrechte, Lizenzierung und Archivierung." Wir
sprechen mit ihm über den Wandel derletzten Jahre und was KI für
Bildagenturen und Bildberater*innen bedeutet. Dazugibt es einen
vollgepackten Rückblick auf alle Neuerungen bei KI-Bild
undVideomodellen - und ein Special zum Thema "Prompt-Editing".
Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter
derArbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat
und BorisEldagsen (Mitglied der Arbeitsgruppe) mit wechselnden
Gästen über aktuelleAuswirkungen von KI auf Fotografie.
LINKS:
Die Bildbeschaffer: https://www.die-bildbeschaffer.de
Symposium des Deutschen Fotorats: Dr.Jürgen Scriba
über"Bildjournalismus im Zeitalter Generativer
KI"https://www.youtube.com/watch?v=MYxDe9I2IH8&t=8628s
HIGHLIGHTS:
(00:00) - Start
(00:08) - Einstieg:
Ausstellungen, Hamburg-Fotorat & erste Video-Experimente
(03:10) - KI-Bubble, Geldkreislauf & Nvidia:
Blase oder Investitionswelle?
Kapital zirkuliert bei Big Playern, Nvidia profitiert durch
Chips + CUDA.
Ideen: Orbital-Rechenzentren, Teslas als verteiltes Compute.
(06:30) - Authentizität, KI-Kamera & Canva/Affinity:
Sony-Firmware unterscheidet reale 3D-Szenen von abgefilmten
Screens.
KI-Kamera als iPhone-Add-on mit generativen Filtern.
Canva kauft Affinity; Suite quasi gratis, Monetarisierung
über KI-Abos.
(09:30) - Preisverfall bei Aggregatoren:
Preise stürzen: Gratisjahre, Flatrates, APIs statt eigener
Modelle.
China drückt Preise, Markt wird laut und unübersichtlich.
(12:30) - Bildmodelle & Prompt Editing:
Neue Modelle: Qwen Edit, Seedream4, Reve, Nano Banana.
Rollenprompting, Negatives ohne Extrafelder, neue Referenzen.
Camera Angle Control rekonstruiert Blickwinkel.
Fall „Afghan Girl“ auf der Paris Photo: neue Perspektive oder
Aneignung?
(17:10) - Videotrends & latente 3D-Räume:
Veo 3.1 ändert Kamera nachträglich; ChronoEdit baut 3D aus
fünf Frames.
Trend: Bilder/Videos als rekonstruierte 3D-Szenen.
Abo-Frage: Einzeltools vs. Aggregatoren (Runway nutzt
Fremdmodelle).
(21:10) - Fun Facts: China-Namen, Branding & Sora
Kulturelle Modellnamen, neue Modelle (Flux 2, Microsoft).
Branding: „Nano Banana“ vs. „ChatGPT Image“.
Sora 2 mit Cameo-Cloning, jetzt auch Android.
(26:01) - Zu Gast: Alexander Karst („Die Bildbeschaffer“):
Beratung, Recherche, Lizenzen; Ex-Getty.
Disruptionen: Krise, Napster, Fotolia, Social
KI als nächste Welle.
(31:00) - KI vs. Stock:
KI ersetzt generischen Stock, Reportage bleibt.
Adobe trennt Stock/Firefly; Stock wird Massenware, Markt
kippt zu Großkunden.
(34:30) - Qualität, Geschmack & Übersättigung:
Generieren schlägt Suchen; ohne Auge entstehen Fehler.
Bewertung wird zentral: Kultur, Kontext, Marke.
KI und Stock verschmelzen; Kennzeichnung kommt.
(41:00) - Ausblick:
Weg vom Einheitsbrei zur eigenen Bildsprache.
Gute Bilder kosten – KI oder Kamera.
Handwerk bleibt, C2PA rückt näher. Fazit: dranbleiben.
Mehr
Über diesen Podcast
Im KI-Podcast unterhalten sich Dr. Jürgen Scriba und Boris Eldagsen
mit wechselnden Gästen über aktuelle Auswirkungen von KI auf
Fotografie. Medienkünstler Jürgen Scriba ist promovierter Physiker,
war Wissenschaftsredakteur bei „Focus“ und „DER SPIEGEL“,
Geschäftsführer DFA und leitet die Arbeitsgruppe technischer
Fortschritt des Deutschen Fotorats. Boris Eldagsen ist
international anerkannter Experte für KI-generierte Bilder. Seine
Absage des Sony World Photo Awards löste 2023 eine weltweite
Debatte aus. Er unterrichtet "KI für Kreative" an der LABASAD
Barcelona.
Kommentare (0)