Episoden

#14 Von Nano Banana 2 zu Pilzen & UFOs | Zu Gast: Jens Schröter
09.03.2026
1 Stunde 12 Minuten
Im aktuellen Rückblick sprechen wir über die neuen Modelle Nano Banana 2, Seedream 5 Light und das neue Videomodell Seedance 2.0. Außerdem geht es um die massive Disruption der Produktfotografie, den Umgang mit Trainingsdaten und die Frage, warum wissenschaftliche Daten plötzlich bezahlt werden, kreative Werke aber oft nicht.Im Gespräch mit Medienwissenschaftler Prof. Dr. Jens Schröter von der Rheinischen Friedrich-Wilhelms-Universität Bonn wird es dann grundsätzlich: Was ist Kreativität, was bleibt von der Fotografie, und wie verändert KI unseren Begriff von Authentizität, Kunst und Wirklichkeit? Und was haben UFOs, Pilze und KI gemeinsam? HIGHLIGHTS (0:08) – Februar-Rückblick & Modellschub Rückblick auf den Februar 2026: Mehrere Releases und Leaks sorgen für Dynamik im KI-Toolmarkt. (0:27) – Nano Banana 2 & Seedream 5 Light Einordnung der neuen Bildmodelle und des Naming-Chaos: Nano Banana – Nano Banana – Nano Banana 2. Testergebnis: schneller, günstiger und stabiler als Seedream 5 Light, das teils inkonsistent reagiert und stärker zensiert ist. (3:29) – Vision Grounded Search Nano Banana 2 und Seedream 5 Light nutzen eine neue Logik: Das Modell kann während der Generierung online nach visuellen Referenzen suchen. (9:47) – Seedance 2.0 & verschobener Release Das neue ByteDance-Videomodell kursiert bereits online, ist offiziell noch nicht veröffentlicht. Der Release wurde offenbar mehrfach verschoben, während das Netz bereits mit Demo-Clips gefüllt ist. (10:47) – Hollywood reagiert auf KI-Deepfakes Studios und Rechteinhaber protestieren gegen die Nutzung ihrer Figuren und Gesichter ohne Zustimmung. Gleichzeitig stellt sich die Frage, ob westliche Firmen juristisch gegen ByteDance vorgehen können. (14:08) – Warum Seedance 2.0 überzeugt Aus einfachen Prompts entstehen cineastische 15-Sekunden-Clips mit Schnitt, Kameraführung, Dramaturgie und Sounddesign. Das Modell versteht filmische Sprache überraschend gut und wirkt derzeit stärker als Googles oder Klings Videomodelle. Problematisch bleibt eine chaotische, sich ständig ändernde Zensur in Beta. (19:23) – KI in der Produktfotografie Ein neues Google-Tool zeigt, wie aus einfachem Ausgangsmaterial sofort professionelle Produktbilder und Szenen entstehen. Der Markt für klassische Produktfotografie könnte sich dadurch stark verändern. (22:50) – ZDF-Fall: KI-Material im Nachrichtenkontext Diskutiert wird ein KI-generierter Clip in einem ZDF-Beitrag mit sichtbar gebliebenem Sora-Logo. Die Kritik richtet sich nicht nur auf fehlende Kennzeichnung, sondern auch auf redaktionelle Abläufe, Verifikation und Krisenkommunikation. (32:14) – Zu Gast ist Jens Schröter: Medienkultur, Pilze, UFOs Mit dem Medienwissenschaftler Prof. Dr. Jens Schröter verschiebt sich das Gespräch zu Grundsatzfragen. Beispiele aus Mushroom Studies und UFO-Forschung dienen als Metapher dafür, wie Kultur mit radikal Fremdem umgeht – auch mit KI. (37:49) – KI als fremde Intelligenz Schröter schlägt vor, KI nicht nur als Spiegel menschlicher Kultur zu sehen, sondern als mögliche Form andersartiger Intelligenz. Boris hält dagegen: Das Fremde wird meist durch menschliche Kategorien gedacht. (42:00) – Kreativität: Simulation oder Praxis Diskutiert wird, ob KI Kreativität nur simuliert oder bereits kreativ handelt. Schröter argumentiert, dass auch menschliche Kreativität meist auf vorhandenen Mustern und kulturellen Feldern basiert. (49:39) – Margaret Boden & Regelbruch Boris bringt Margaret Bodens Kreativitätstheorie ins Spiel: Kombination, Mustererkennung und möglicher Regelbruch. Offen bleibt, ob KI echte Regelüberschreitung leisten kann. (1:00:33) – Fotografie im Wandel Fotografie war historisch immer ein Feld technischer Umbrüche – von Chemie über Elektronik bis zur Digitalisierung. (1:05:29) – Authentizität, Herkunft, Kontext Entscheidend ist weniger die Frage „Ist das noch Fotografie?“, sondern unter welchen Verfahren Bilder als authentisch gelten. Transparenz und institutionelle Regeln werden zentral.
Mehr
#13 Von Multishot zu Multi-Doom
19.02.2026
50 Minuten
Im Januar 2026 ist viel passiert rund um KI, Bilder und Video. Das chinesische Videomodell Kling 3.0 kann jetzt 4K-Videos, mehrere Kameraperspektiven in einem Clip und immer realistischere Szenen erzeugen, "Flux 2 Klein" ist die Minivariante von Flux 2. Wir fragen uns, was "Lügnerdividende" ist und schauen etwas genauer auf die Negativszenarien des CEOs von Anthropic. Wir untersuchen die Kennzeichnungspflicht des EU AI Acts, besprechen die Microsoft-Studie zur weltweiten Nutzung von KI und sind erstaunt, dass die USA nur im Mittelfeld und hinter Deutschland liegen. Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. HIGHLIGHTS: (0:00) – Jahresauftakt & Plattform-Update Rückblick auf Januar 2026 (Folge 13). Podcast jetzt auch auf Spotify, bald iTunes. Weniger neue KI-Modelle als erwartet. (0:52) – Neue Bild- & Videomodelle Flux 2 klein: schnelles, lokal laufendes Bildmodell. Bytedance kündigt neue Modelle an. „Kling 3.0“ (China): 4K, 15 Sekunden, Multishot (mehrere Kameraeinstellungen im Prompt), Ton- & Stimmenklonen. Trend: Video wird als generierter 3D-Raum gedacht – Bild und Film verschmelzen. (4:22) – KI im Foto-Alltag Workshops zeigen: KI wird für hybride Aufgaben genutzt (Menschen ergänzen, Retusche, Begrünung, etc.). Kommerzielle Fotografie war immer inszeniert – KI verstärkt das. Zentrale Frage: Wird das künftig als „Deepfake“ gelten? (9:37) – EU AI Act & Kennzeichnung KI-generierte Inhalte sollen gekennzeichnet werden. Problem: Definition knüpft am Werkzeug (KI) an, nicht an Authentizität. Gefahr: Inszenierte Fotos gelten als „echt“, KI-Bilder als „Fake“. Forderung: Durchgängige Metadaten statt reiner KI-Markierung. (21:03) – Politische KI-Beispiele KI-Inszenierungen mit historischen Figuren. Manipulierte Bilder aus politischen Kontexten. Polizeiliche KI-Symbolbilder zur Emotionalisierung. Problem: Behörden erzeugen eigene Bildrealitäten – Glaubwürdigkeit leidet. (27:10) – KI-Erkennung scheitert Studie zeigt: Chatbots erkennen KI-Videos nicht zuverlässig. Technische Erkennung allein reicht nicht. (29:06) – Neue Kennzeichnungsideen Vorschlag: Transparenz nach Autorenschaft Ausführung Verfeinerung Verifikation (Mensch/KI/Assisted). Ansatz: Medienübergreifendes System statt einfacher „KI“-Labels. (35:44) – Vertrauenskrise neu definiert „Lügner-Dividende“: Echte Bilder können als KI-Fake diskreditiert werden. KI-Restaurierungen verändern reale Personen subtil. Notwendig: Vertrauenszonen je nach Kontext (Journalismus, Werbung, freie Kunst). (38:48) – KI-Nutzung weltweit Microsoft-Studie zeigt: Hohe Nutzung in VAE und Singapur. Deutschland im Mittelfeld. USA nicht führend bei Nutzung. Digitalisierte Staaten adaptieren schneller. (41:37) – Kreative vs. KI-Training Initiativen gegen ungefragtes Training mit urheberrechtlich geschütztem Material. Beispiel: Bücher werden gekauft, gescannt, zerstört – rechtlich zulässig in den USA. (44:54) – Risiken: Doom-Szenario oder Realismus? Essay von Dario Amodei (CEO Anthropic): Risiken durch Überwachung, Autoritarismus, Missbrauch. Weniger Superintelligenz, mehr reale Machtfragen.
Mehr
#12 Vom neuen Realismus zur Zukunft des EU AI Acts | Zu Gast: Sabine Richly
02.02.2026
55 Minuten
Zum Jahreswechsel überbieten sich amerikanische und chinesische Anbieter mit neuen Modellen. OpenAI versucht mit ChatGPT 1.5 an die Modelle von Google und Bytedance Anschluss zu finden. Hautunreinheiten sind wieder begehrt: Higgsfield, Magnific und Topaz bieten einen "Skin Enhancer" für einen neuen Realismus. Im Videobereich arbeiten sich chinesische Modelle immer näher an Google VEO 3.1 heran. Ali Baba Cloud bietet Wan 2.6 mit Sound, Bytedance bietet mit Seedream 1.5 Pro ein Videomodell mit Sound, Multiframe und Storyboard, das eine echte Konkurrent geworden ist. Wir schauen auf das viral gewordene KI-Weihnachtsvideo von McDonald, die Jahresansprache des Instagram CEO zur Zukunft der Contentproduktion und unterhalten uns mit unserem Gast Sabine Richly über den aktuellen Stand des EU AI Acts. ... Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. LINKS: ⁠Rechtsanwältin Sabine Richly⁠ MacDonalds Satire IPTC KI-Bilder Konvergenz HIGHLIGHTS: (00:08) - Selbstironischer Start (01:19) - KI-Weihnachtswerbung & Backlash: Coca-Cola: mittelmäßig, McDonald’s NL: massiver Shitstorm. Spot „The Most Terrible Time of the Year“: Anti-Weihnachtsbotschaft + KI-Look Ablehnung. Verteidigung der Agentur („Our fingers hurts from typing prompts“) wird Meme. Cleveres Reaction-Video einer anderen Agentur kontert KI mit KI, thematisiert Copyright & Austauschbarkeit von KI-Figuren. (06:20) - Disney & OpenAI: Disney lizenziert Charaktere und investiert nach vorheriger Drohkulisse. Strategie: erst alles zulassen, Markt schaffen, dann lizensieren. Fanfiction wird Marketing-Asset (UGC 2.0). Profit vor allem für große Player. (10:44) - Metadaten & Transparenz: IPTC 25.1 führt detaillierte KI-Felder ein (Modell, Version, Prompt etc.). Wichtig für kommende Kennzeichnungspflichten; offen bleibt, ob IPTC, C2PA oder anderes Standard wird. Politik: mögliche Verzögerungen wegen „Komplexität“. (14:34) - Tool- & Modell-Update: ChatGPT Images: wenig Innovation, klarer Fokus auf Mainstream-User. Marktführer aus Praxis: Google (Nano Banana Pro) & ByteDance (Seedream 4.5). Trend: Realismus-Nachbearbeitung (Skin Enhancer, Pickel als „Echtheitsmarker“). Video: Kling mit starkem Sound-Generator; Foley wird automatisiert. Higgsfield Angles: Bilder als latente 3D-Räume neue Perspektiven aus 2D. Video-Modelle: ByteDance und Google aktuell vorne; kein „bestes Modell“, alles use-case-abhängig. (29:46) - Instagram & Authentizität: Insta CEO Adam Mosseri erklärt Hochglanz-Ästhetik für tot. Widerspruch: Auch „unperfekt“ kann KI faken. Idee: Reservate für echte Fotos wären sinnvoller als noch mehr Realismus. (34:35) Zu Gast: Sabine Richly EU AI Act: Code of Practice zu Transparenz/Kennzeichnung Kennzeichnung maschinenlesbar, nicht sichtbar fürs Auge. Problem: Freiwilligkeit, geopolitische Spannungen, Durchsetzung. Plattformen (Deployers) sollen visuelle Labels einblenden. Deepfake-Begriff unscharf; Rechtsprechung wird nachschärfen.
Mehr
#11 Zum Jahresende überbieten sich alle mit neuen Modellen
15.12.2025
56 Minuten
Zum Jahresende zeigt sich eine massive Beschleunigung der generativen KI: Drei Jahre nach ChatGPT ist der Markt fragmentierter und professioneller geworden. Im Bildbereich setzt sich das chinesische Modell Seedream 4.5 gegen Googles Nano Banana Pro durch, vor allem durch höhere Prompt-Treue und bessere Eignung für professionelle Workflows, während Detailverliebtheit allein nicht mehr reicht. Mit Flux 2 und Z-Image versuchen zwei Open Source Modelle dazu aufzuschließen. Bei Video-KI eskaliert der Wettbewerb mit neuen Editing-, Audio- und Cameo-Funktionen, wobei Google (Veo) aktuell vorne liegt, die chinesische Modellen von Kling (O1 und 2.6) aber mit weniger Zensur aufholen. Runway veröffentlich Gen 4.5. Parallel verschieben sich die Grundfragen: Urheberrecht, Regulierung, journalistisches Vertrauen und kulturelles Erbe werden zur eigentlichen Frontlinie – nicht die nächste Modellversion. Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. LINKS: Symposium des Deutschen Fotorates, Hamburg, 21.11.2025 HIGHLIGHTS: 00:00:08 | Rückblick auf November/Dezember, 3 Jahre ChatGPT / generative KI. 00:04:03 | Black Forest Labs: 3-Mrd-Bewertung, europäische Grundlagenarbeit, Substanz vs. Marketing. 00:05:48 | Neue KI-Bildmodelle & erste Einordnung: FLUX 2: Gutes Open-Source-Modell - aber schwächer als Konkurrenz. Microsoft MAI: angekündigt, noch ungetestet. Nano Banana Pro (Google) vs. Seedream 4 4.5 (ByteDance). Z-Image Turbo (Alibaba): Open Source, lokal, offline, schnell, wenig Zensur. 00:08:43 | Video-KI-Overkill Ende Nov / Anfang Dez: Runway 4.5 angekündigt, ab Mitte Dezember verfügbar Kling Omni (O1): nachträgliches Video-Editing per Prompt & Referenz. Vergleich zu Sora 2 Cameo / Veo: Deepfake-Potenzial, erste Demos. Kling 2.6: Video + Ton + Sprache + Musik (stark bei Musik, schwach bei Schauspiel). Zwischenfazit Video: Veo 3.1 vorne, Kling holt auf, Zensur als Faktor. 00:12:39 | Geopolitik & Zensur: Chinesische Modelle: günstiger, weniger zensiert, Open-Source-Strategie als Marktangriff. Persönliches Nutzungsfazit: Bild = China vorn, Video = China schließt auf. 00:14:10 | Großer Bild-Modell-Vergleich: Nano Banana Pro vs. Seedream 4.5 Style- & Color-Transfer: Prompt-Verständnis als Schwachstelle. Renaissance des Textprompts beim Prompt Editing. Corporate / Auftrags-Usecases: Seedream stabiler, Nano Banana detailverliebt. Rollen-Prompts („Du bist Helmut Newton“): Referenztreue vs. Stilfreiheit. Usecase Werbung 00:26:16 | Vorhergehender Test Nano Banana Pro vs Seedream 4.0 00:29:06 | Klares Jahresfazit: Seedream 4.5 aktuell bestes Modell für Prompt Editing. 00:29:13 | Strategische Positionierung der Player: OpenAI: Masse, Gamification, Social. Google: professionelle Tools, Infografiken, strukturierte Prompts. 00:32:10 | Kreativer Prozess & Bewertung Google-Ansatz: KI evaluiert eigenen Output gegen Prompt. Kernproblem: Automatisierung vs. Mittelmaß. China-Studie: Juniors Ideen, Seniors Bewertung & Feinschliff. Kreativität, Stil, Vorhersehbarkeit, Comedy-Experimente. 00:38:30 | Mitarbeit in UNESCO-Arbeitsgruppe: KI-Werke & Weltkulturerbe. 00:39:30 | Urheberrecht & Rechtspolitik: Provokation: „Entertaste = Auslöser“ menschliche Autorschaft. Gefahr juristischer Scheinpräzision (Prompt-Länge, Iterationen). USA vs. EU: Deregulierung, Zölle, Machtkampf. GEMA vs. OpenAI: Präzedenzfall Trainingsdaten. Historischer Exkurs: Fake-Image-Debatte schon 1912. 00:47:20 | Das Symposium des Fotorates: AI Act & „Deepfake“-Kennzeichnung: Begrifflich und praktisch problematisch. Branchenreaktionen (Werbung, Amazon). Vertrauensverlust: „Ich glaube euch kein Bild mehr.“ Konsequenz: Provenienz, Signaturen, Verifikation. Vision: Foto-„Reservate“, redaktionelle Standards, Vertrauen statt Label-Inflation.
Mehr
#10 Von Authentizität zur Zukunft der Bildagenturen | Zu Gast: Alexander Karst
15.11.2025
44 Minuten
Wie verändert sich die Bildagentur-Landschaft durch KI? Unser Gast ist diesmal Alexander Karst, Geschäftsführer von "DieBildbeschaffer" und Berater für "Bildrecherche, Bildeinkauf,Bildrechte, Lizenzierung und Archivierung."  Wir sprechen mit ihm über den Wandel derletzten Jahre und was KI für Bildagenturen und Bildberater*innen bedeutet. Dazugibt es einen vollgepackten Rückblick auf alle Neuerungen bei KI-Bild undVideomodellen - und ein Special zum Thema "Prompt-Editing".   Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter derArbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und BorisEldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelleAuswirkungen von KI auf Fotografie.   LINKS: Die Bildbeschaffer: https://www.die-bildbeschaffer.de Symposium des Deutschen Fotorats: Dr.Jürgen Scriba über"Bildjournalismus im Zeitalter Generativer KI"https://www.youtube.com/watch?v=MYxDe9I2IH8&t=8628s   HIGHLIGHTS:   (00:00) - Start (00:08) - Einstieg: Ausstellungen, Hamburg-Fotorat & erste Video-Experimente (03:10) - KI-Bubble, Geldkreislauf & Nvidia: Blase oder Investitionswelle? Kapital zirkuliert bei Big Playern, Nvidia profitiert durch Chips + CUDA. Ideen: Orbital-Rechenzentren, Teslas als verteiltes Compute. (06:30) - Authentizität, KI-Kamera & Canva/Affinity: Sony-Firmware unterscheidet reale 3D-Szenen von abgefilmten Screens. KI-Kamera als iPhone-Add-on mit generativen Filtern. Canva kauft Affinity; Suite quasi gratis, Monetarisierung über KI-Abos. (09:30) - Preisverfall bei Aggregatoren: Preise stürzen: Gratisjahre, Flatrates, APIs statt eigener Modelle. China drückt Preise, Markt wird laut und unübersichtlich. (12:30) - Bildmodelle & Prompt Editing: Neue Modelle: Qwen Edit, Seedream4, Reve, Nano Banana. Rollenprompting, Negatives ohne Extrafelder, neue Referenzen. Camera Angle Control rekonstruiert Blickwinkel. Fall „Afghan Girl“ auf der Paris Photo: neue Perspektive oder Aneignung? (17:10) - Videotrends & latente 3D-Räume: Veo 3.1 ändert Kamera nachträglich; ChronoEdit baut 3D aus fünf Frames. Trend: Bilder/Videos als rekonstruierte 3D-Szenen. Abo-Frage: Einzeltools vs. Aggregatoren (Runway nutzt Fremdmodelle). (21:10) - Fun Facts: China-Namen, Branding & Sora Kulturelle Modellnamen, neue Modelle (Flux 2, Microsoft). Branding: „Nano Banana“ vs. „ChatGPT Image“. Sora 2 mit Cameo-Cloning, jetzt auch Android. (26:01) - Zu Gast: Alexander Karst („Die Bildbeschaffer“): Beratung, Recherche, Lizenzen; Ex-Getty. Disruptionen: Krise, Napster, Fotolia, Social KI als nächste Welle. (31:00) - KI vs. Stock: KI ersetzt generischen Stock, Reportage bleibt. Adobe trennt Stock/Firefly; Stock wird Massenware, Markt kippt zu Großkunden. (34:30) - Qualität, Geschmack & Übersättigung: Generieren schlägt Suchen; ohne Auge entstehen Fehler. Bewertung wird zentral: Kultur, Kontext, Marke. KI und Stock verschmelzen; Kennzeichnung kommt. (41:00) - Ausblick: Weg vom Einheitsbrei zur eigenen Bildsprache. Gute Bilder kosten – KI oder Kamera. Handwerk bleibt, C2PA rückt näher. Fazit: dranbleiben.
Mehr

Über diesen Podcast

Im KI-Podcast unterhalten sich Dr. Jürgen Scriba und Boris Eldagsen mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. Medienkünstler Jürgen Scriba ist promovierter Physiker, war Wissenschaftsredakteur bei „Focus“ und „DER SPIEGEL“, Geschäftsführer DFA und leitet die Arbeitsgruppe technischer Fortschritt des Deutschen Fotorats. Boris Eldagsen ist international anerkannter Experte für KI-generierte Bilder. Seine Absage des Sony World Photo Awards löste 2023 eine weltweite Debatte aus. Er unterrichtet "KI für Kreative" an der LABASAD Barcelona.

Kommentare (0)

Lade Inhalte...

Abonnenten

15
15