Photonen und Pixel

Photonen und Pixel

0 0
0 0

Episoden

#16 Von Algorithmischer Fotografie zu Deepfake-Erkennung | Zu Gast: Christoph Behl
18.05.2026
1 Stunde 13 Minuten
KI-Bild- und Videomodelle entwickeln sich gerade in einem Tempo, bei dem selbst Profis kaum hinterherkommen: Midjourney korrigiert seinen Kurs, ChatGPT Image 2 holt überraschend auf, und aus China kommen neue Videomodelle wie Wan 2.7 und Happy Horse. Gleichzeitig wird sichtbar, dass diese kreative Explosion teuer ist — in Geld, Rechenleistung, Energie und neuen Nutzungslimits. Die Folge diskutiert außerdem, warum KI-Bilder Fotografie, Journalismus und Wettbewerbe unter Druck setzen. Boris erklärt, warum Joan Fontcubertas „algorithmische Fotografie“ ein Nonsense-Begriff ist. Im Gespräch mit unserem Gast Christoph Behl von "It’s Real" geht es schließlich darum, wie wir in einer Welt perfekter synthetischer Bilder wieder Vertrauen schaffen können: durch Detektion, Provenienzdaten und neue „Trust Zones“ für echte Bilder.





-----


Im KI-Podcast unterhalten sich Dr. ⁠Jürgen Scriba⁠, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und ⁠Boris Eldagsen⁠ (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie.





HIGHLIGHTS:





(00:08) - EU-Guidelines zur juristischen Definition von Deepfakes i


Fehlen weiterhin. Bis dahin wird praktisch weiter getestet, wie Deepfakes und synthetische Medien entstehen.





(00:31) - Bei KI-Bildmodellen gab es große Bewegung


Midjourney 8.1 korrigiert viele Schwächen von Version 8.0. Die neue Architektur bringt das alte „Midjourney-Feeling“ zurück.





(02:17) - ChatGPT Image 2 wird neu bewertet


In der Beta war es enttäuschend, inzwischen liegt es in vielen Use Cases fast gleichauf mit Nano Banana 2.





(04:53) - In praktischen Bildtests zeigt sich:


ChatGPT Image 2 überzeugt bei Bildrestauration, Lichtübertragung, Pose-Transfer und komplexen Bildkombinationen. Nano Banana 2 ist stärker bei Realismus, Farbpaletten und manchen Stilübertragungen.





(12:41) - Im Videobereich bringt Alibaba zwei Modelle


Wan 2.7 und Happy Horse. Beide kommen aus unterschiedlichen Alibaba-Labs; Happy Horse zielt stärker auf Talking Heads, Short Drama und menschliche Figuren.





(15:51) - Die Kostenfrage


KI-Infrastruktur, Tokenverbrauch und Rechenleistung explodieren. Nutzer merken das an Limits, langsameren Diensten und teuren Pro-Tarifen. Der Energie- und Ressourcenverbrauch wird zu einem zentralen Problem.





(21:07) - KI-Bilder in Fotowettbewerben


Beispiele aus Hasselblad- und Naturfoto-Wettbewerben zeigen, wie schwer Jury und Publikum echte Fotos von synthetischen Bildern unterscheiden können.





(24:03) - Re-Light


Nachträgliche Lichtveränderung in Fotos werden Standard.





(30:00) - Philosophische Debatte


Sind KI-generierte Bilder Fotografie? Boris widerspricht Joan Fontcubertas These von „algorithmischer Fotografie“ und argumentiert, KI-Bilder seien Teil eines größeren Metamediums: Latent Space.





(40:47) - Zu Gast: Christoph Behl


Behl erklärt, wie sein Unternehmen KI-generierte und manipulierte Bilder durch einen multisignalen Ansatz erkennt. Die Detektion basiert auf semantischen Mustern: Bildsprache, Symmetrie, Texturen, Rauschen, Frequenzen, Entropie und typische KI-Artefakte werden kombiniert.





(55:09) - Beispiele


An Beispielen zeigt "It’s Real", wie komplett generierte Bilder, authentische Bilder und teilweise manipulierte Bilder unterschieden werden.





(58:01) - Zielgruppen sind breiter als geplant


Medien, Bildagenturen, Behörden, Polizei, Militär, Versicherungen und E-Commerce interessieren sich für Bildprüfung. Besonders relevant sind Betrug, Desinformation, Bildarchive und journalistische Verifikation.





(1:03:04) - „Deepfake“


Der Begriff wird kritisch gesehen, weil er juristisch und praktisch unscharf ist. Statt alles KI-generierte zu labeln, schlägt Christoph vor, stärker das Echte zu zertifizieren: Trust Zones, Provenienzdaten und geprüfte Authentizität.





(1:09:41) - Fazit


Vertrauen in Bilder wird künftig aktiv hergestellt werden müssen — technisch, juristisch und kulturell.





Mehr
#15 Von Verlierern zu Gewinnern | Zu Gast: Anke Schierholz & Christoph Künne
25.04.2026
55 Minuten
Im aktuellen Rückblick sprechen wir über die Gründe von OpenAI, Sora 2 einzustellen. Google dominiert Bildmodelle, ByteDance/Seedance 2.0 setzt neue Maßstäbe bei Video. KI-Restaurierung, Kriegspropaganda und KI-Influencer destabilisieren Erinnerung, Wahrheit und politische Kommunikation.


Wie lassen sich KI-Training, Nutzung und Vergütung fair regulieren? Fotograf:innen geraten ökonomisch unter Druck, besonders bei Brot-und-Butterjobs und hybrider Postproduktion.


Wir fragen unsere Gäste: Dr. Anke Schierholz, Leiterin der Rechtsabteilung der VG Bildkunst und Christoph Künne, Kulturwissenschaftler und Mitbegründer des DOCMA Magazins.


-----


Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie.





HIGHLIGHTS





(00:08) - Sora 2 wird eingestellt


OpenAI beendet Sora 2 offiziell wegen Rechenkapazitäten und neuer Prioritäten wie Weltsimulation und Robotik.





(02:57) - OpenAI verliert den Vorsprung


Sora 2 sollte offenbar vom Profi-Tool zum Mainstream-Produkt werden. Diese Strategie scheint gescheitert, während OpenAI bei Bild, Video und Coding nicht mehr eindeutig vorne liegt.





(04:21) - Bildmodelle: Google vorn, Midjourney schwächelt


Google/Nano Banana bleibt vorn. Midjourney 8 wirkt trotz neuer Architektur wie ein Dinosaurier.





(09:23) - Google gegen ByteDance im Video-Wettbewerb


Google setzt auf billigere Light-/Fast-Versionen, Seedance 2.0 von ByteDance auf Qualität. Nach Hollywood-Druck reagiert ByteDance mit Kennzeichnung, Watermarking und Filtern für geschützte Figuren oder echte Gesichter.





(15:10) - KI-Restaurierung und Erinnerung


KI-Restaurierung alter Fotos kann emotional stärkere Bilder erzeugen, verändert aber oft Gesichter und Charaktere.





(18:13) - Authentizität oder Wirkung?


Boris fragt, ob dokumentarische Authentizität nötig ist, wenn ein verfälschtes Bild emotional stärker wirkt.





(20:33) - KI-Propaganda und synthetische Influencer


KI-generierte Bilder destabilisieren Kriegskommunikation, Quellenvertrauen und historische Rekonstruktion. Figuren wie „Jessica Foster“ zeigen, wie KI-Influencer politische, militärische und erotische Fantasien bedienen.





Zu Gast: Dr Anke Schierholz und Christoph Künne





(23:34) - Fotografie, Einkommen und KI-Schock


Der zweite Teil fragt, was mit fotografischen Einnahmen passiert, wenn Bilder für Centbeträge generiert werden.





(25:49) - Von Photoshop zu KI-Workflows


Bildbearbeitung verschiebt sich von klassischer Retusche zu generativen Workflows. Kund:innen erwarten zunehmend hybride Arbeit aus Foto und KI.





(28:07) - Fotobranche unter Druck


Besonders gefährdet sind Brot-und-Butterjobs, die oft anspruchsvollere Arbeit mitfinanzieren.





(32:30) - KI-Nutzung als Stigma


Viele Fotograf:innen nutzen KI längst für Retusche oder Postproduktion, sprechen aber ungern darüber.





(36:08) - Der gordische Knoten der Vergütung


KI-Systeme nutzen geistiges Eigentum vergangener Jahre und bedrohen nun diejenigen, die davon leben wollten. Ein globales Vergütungssystem wirkt unrealistisch.





(37:48) - Umsatzbeteiligung und Nachweisproblem


Anke hält Umsatzbeteiligung für denkbar, dafür müsste Training aber klar lizenzpflichtig werden. Das Hauptproblem bleibt: Urheber:innen können meist kaum beweisen, dass ihre Werke genutzt wurden.





(45:01) - KI-Bilder und Schutzfähigkeit


Boris fragt, ob komplex erzeugte KI-Bilder wie „The Electrician“ meldbar sein können.





(49:18) - KI als Kulturbruch


KI wird mit früheren Medienumbrüchen wie Fotografie und Digitalisierung verglichen. Neu ist die Breite: KI verändert nicht nur Bilder, sondern Arbeit, Denken und Zusammenleben.





(53:50) - Das Mehl darf nicht gratis sein


Das TDM-Fundament muss neu gefasst werden, damit kreative Arbeit nicht weiter kostenloser Rohstoff bleibt. Auch der Bäcker bekommt sein Mehl nicht umsonst.





#deutscherfotorat #kibilder #fotografie


Mehr
#14 Von Nano Banana 2 zu Pilzen & UFOs | Zu Gast: Jens Schröter
09.03.2026
1 Stunde 12 Minuten
Im aktuellen Rückblick sprechen wir über die neuen Modelle Nano Banana 2, Seedream 5 Light und das neue Videomodell Seedance 2.0. Außerdem geht es um die massive Disruption der Produktfotografie, den Umgang mit Trainingsdaten und die Frage, warum wissenschaftliche Daten plötzlich bezahlt werden, kreative Werke aber oft nicht.Im Gespräch mit Medienwissenschaftler Prof. Dr. Jens Schröter von der Rheinischen Friedrich-Wilhelms-Universität Bonn wird es dann grundsätzlich: Was ist Kreativität, was bleibt von der Fotografie, und wie verändert KI unseren Begriff von Authentizität, Kunst und Wirklichkeit? Und was haben UFOs, Pilze und KI gemeinsam?


HIGHLIGHTS





(0:08) – Februar-Rückblick & Modellschub


Rückblick auf den Februar 2026: Mehrere Releases und Leaks sorgen für Dynamik im KI-Toolmarkt.


(0:27) – Nano Banana 2 & Seedream 5 Light


Einordnung der neuen Bildmodelle und des Naming-Chaos: Nano Banana – Nano Banana – Nano Banana 2. Testergebnis: schneller, günstiger und stabiler als Seedream 5 Light, das teils inkonsistent reagiert und stärker zensiert ist.


(3:29) – Vision Grounded Search


Nano Banana 2 und Seedream 5 Light nutzen eine neue Logik: Das Modell kann während der Generierung online nach visuellen Referenzen suchen.


(9:47) – Seedance 2.0 & verschobener Release


Das neue ByteDance-Videomodell kursiert bereits online, ist offiziell noch nicht veröffentlicht. Der Release wurde offenbar mehrfach verschoben, während das Netz bereits mit Demo-Clips gefüllt ist.


(10:47) – Hollywood reagiert auf KI-Deepfakes


Studios und Rechteinhaber protestieren gegen die Nutzung ihrer Figuren und Gesichter ohne Zustimmung. Gleichzeitig stellt sich die Frage, ob westliche Firmen juristisch gegen ByteDance vorgehen können.


(14:08) – Warum Seedance 2.0 überzeugt


Aus einfachen Prompts entstehen cineastische 15-Sekunden-Clips mit Schnitt, Kameraführung, Dramaturgie und Sounddesign. Das Modell versteht filmische Sprache überraschend gut und wirkt derzeit stärker als Googles oder Klings Videomodelle. Problematisch bleibt eine chaotische, sich ständig ändernde Zensur in Beta.


(19:23) – KI in der Produktfotografie


Ein neues Google-Tool zeigt, wie aus einfachem Ausgangsmaterial sofort professionelle Produktbilder und Szenen entstehen. Der Markt für klassische Produktfotografie könnte sich dadurch stark verändern.


(22:50) – ZDF-Fall: KI-Material im Nachrichtenkontext


Diskutiert wird ein KI-generierter Clip in einem ZDF-Beitrag mit sichtbar gebliebenem Sora-Logo. Die Kritik richtet sich nicht nur auf fehlende Kennzeichnung, sondern auch auf redaktionelle Abläufe, Verifikation und Krisenkommunikation.


(32:14) – Zu Gast ist Jens Schröter: Medienkultur, Pilze, UFOs


Mit dem Medienwissenschaftler Prof. Dr. Jens Schröter verschiebt sich das Gespräch zu Grundsatzfragen. Beispiele aus Mushroom Studies und UFO-Forschung dienen als Metapher dafür, wie Kultur mit radikal Fremdem umgeht – auch mit KI.


(37:49) – KI als fremde Intelligenz


Schröter schlägt vor, KI nicht nur als Spiegel menschlicher Kultur zu sehen, sondern als mögliche Form andersartiger Intelligenz. Boris hält dagegen: Das Fremde wird meist durch menschliche Kategorien gedacht.


(42:00) – Kreativität: Simulation oder Praxis


Diskutiert wird, ob KI Kreativität nur simuliert oder bereits kreativ handelt. Schröter argumentiert, dass auch menschliche Kreativität meist auf vorhandenen Mustern und kulturellen Feldern basiert.


(49:39) – Margaret Boden & Regelbruch


Boris bringt Margaret Bodens Kreativitätstheorie ins Spiel: Kombination, Mustererkennung und möglicher Regelbruch. Offen bleibt, ob KI echte Regelüberschreitung leisten kann.


(1:00:33) – Fotografie im Wandel


Fotografie war historisch immer ein Feld technischer Umbrüche – von Chemie über Elektronik bis zur Digitalisierung.


(1:05:29) – Authentizität, Herkunft, Kontext


Entscheidend ist weniger die Frage „Ist das noch Fotografie?“, sondern unter welchen Verfahren Bilder als authentisch gelten. Transparenz und institutionelle Regeln werden zentral.


Mehr
#13 Von Multishot zu Multi-Doom
19.02.2026
50 Minuten
Im Januar 2026 ist viel passiert rund um KI, Bilder und Video. Das chinesische Videomodell Kling 3.0 kann jetzt 4K-Videos, mehrere Kameraperspektiven in einem Clip und immer realistischere Szenen erzeugen, "Flux 2 Klein" ist die Minivariante von Flux 2. Wir fragen uns, was "Lügnerdividende" ist und schauen etwas genauer auf die Negativszenarien des CEOs von Anthropic. Wir untersuchen die Kennzeichnungspflicht des EU AI Acts, besprechen die Microsoft-Studie zur weltweiten Nutzung von KI und sind erstaunt, dass die USA nur im Mittelfeld und hinter Deutschland liegen.


Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie.





HIGHLIGHTS:


(0:00) – Jahresauftakt & Plattform-Update


Rückblick auf Januar 2026 (Folge 13). Podcast jetzt auch auf Spotify, bald iTunes. Weniger neue KI-Modelle als erwartet.





(0:52) – Neue Bild- & Videomodelle


Flux 2 klein: schnelles, lokal laufendes Bildmodell. Bytedance kündigt neue Modelle an. „Kling 3.0“ (China): 4K, 15 Sekunden, Multishot (mehrere Kameraeinstellungen im Prompt), Ton- & Stimmenklonen. Trend: Video wird als generierter 3D-Raum gedacht – Bild und Film verschmelzen.





(4:22) – KI im Foto-Alltag


Workshops zeigen:


KI wird für hybride Aufgaben genutzt (Menschen ergänzen, Retusche, Begrünung, etc.). Kommerzielle Fotografie war immer inszeniert – KI verstärkt das. Zentrale Frage: Wird das künftig als „Deepfake“ gelten?





(9:37) – EU AI Act & Kennzeichnung


KI-generierte Inhalte sollen gekennzeichnet werden. Problem: Definition knüpft am Werkzeug (KI) an, nicht an Authentizität. Gefahr: Inszenierte Fotos gelten als „echt“, KI-Bilder als „Fake“. Forderung: Durchgängige Metadaten statt reiner KI-Markierung.





(21:03) – Politische KI-Beispiele


KI-Inszenierungen mit historischen Figuren. Manipulierte Bilder aus politischen Kontexten. Polizeiliche KI-Symbolbilder zur Emotionalisierung. Problem: Behörden erzeugen eigene Bildrealitäten – Glaubwürdigkeit leidet.





(27:10) – KI-Erkennung scheitert


Studie zeigt: Chatbots erkennen KI-Videos nicht zuverlässig. Technische Erkennung allein reicht nicht.





(29:06) – Neue Kennzeichnungsideen


Vorschlag: Transparenz nach Autorenschaft Ausführung Verfeinerung Verifikation (Mensch/KI/Assisted). Ansatz: Medienübergreifendes System statt einfacher „KI“-Labels.





(35:44) – Vertrauenskrise neu definiert


„Lügner-Dividende“: Echte Bilder können als KI-Fake diskreditiert werden. KI-Restaurierungen verändern reale Personen subtil. Notwendig: Vertrauenszonen je nach Kontext (Journalismus, Werbung, freie Kunst).





(38:48) – KI-Nutzung weltweit


Microsoft-Studie zeigt: Hohe Nutzung in VAE und Singapur. Deutschland im Mittelfeld. USA nicht führend bei Nutzung. Digitalisierte Staaten adaptieren schneller.





(41:37) – Kreative vs. KI-Training


Initiativen gegen ungefragtes Training mit urheberrechtlich geschütztem Material. Beispiel: Bücher werden gekauft, gescannt, zerstört – rechtlich zulässig in den USA.





(44:54) – Risiken: Doom-Szenario oder Realismus?


Essay von Dario Amodei (CEO Anthropic): Risiken durch Überwachung, Autoritarismus, Missbrauch. Weniger Superintelligenz, mehr reale Machtfragen.


Mehr
#12 Vom neuen Realismus zur Zukunft des EU AI Acts | Zu Gast: Sabine Richly
02.02.2026
55 Minuten
Zum Jahreswechsel überbieten sich amerikanische und chinesische Anbieter mit neuen Modellen. OpenAI versucht mit ChatGPT 1.5 an die Modelle von Google und Bytedance Anschluss zu finden.


Hautunreinheiten sind wieder begehrt: Higgsfield, Magnific und Topaz bieten einen "Skin Enhancer" für einen neuen Realismus.


Im Videobereich arbeiten sich chinesische Modelle immer näher an Google VEO 3.1 heran. Ali Baba Cloud bietet Wan 2.6 mit Sound, Bytedance bietet mit Seedream 1.5 Pro ein Videomodell mit Sound, Multiframe und Storyboard, das eine echte Konkurrent geworden ist.


Wir schauen auf das viral gewordene KI-Weihnachtsvideo von McDonald, die Jahresansprache des Instagram CEO zur Zukunft der Contentproduktion und unterhalten uns mit unserem Gast Sabine Richly über den aktuellen Stand des EU AI Acts.


...


Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie.





LINKS:


⁠Rechtsanwältin Sabine Richly⁠ MacDonalds Satire IPTC KI-Bilder Konvergenz


HIGHLIGHTS:





(00:08) - Selbstironischer Start


(01:19) - KI-Weihnachtswerbung & Backlash:


Coca-Cola: mittelmäßig, McDonald’s NL: massiver Shitstorm. Spot „The Most Terrible Time of the Year“: Anti-Weihnachtsbotschaft + KI-Look Ablehnung. Verteidigung der Agentur („Our fingers hurts from typing prompts“) wird Meme. Cleveres Reaction-Video einer anderen Agentur kontert KI mit KI, thematisiert Copyright & Austauschbarkeit von KI-Figuren.


(06:20) - Disney & OpenAI:


Disney lizenziert Charaktere und investiert nach vorheriger Drohkulisse. Strategie: erst alles zulassen, Markt schaffen, dann lizensieren. Fanfiction wird Marketing-Asset (UGC 2.0). Profit vor allem für große Player.


(10:44) - Metadaten & Transparenz:


IPTC 25.1 führt detaillierte KI-Felder ein (Modell, Version, Prompt etc.). Wichtig für kommende Kennzeichnungspflichten; offen bleibt, ob IPTC, C2PA oder anderes Standard wird. Politik: mögliche Verzögerungen wegen „Komplexität“.


(14:34) - Tool- & Modell-Update:


ChatGPT Images: wenig Innovation, klarer Fokus auf Mainstream-User. Marktführer aus Praxis: Google (Nano Banana Pro) & ByteDance (Seedream 4.5). Trend: Realismus-Nachbearbeitung (Skin Enhancer, Pickel als „Echtheitsmarker“). Video: Kling mit starkem Sound-Generator; Foley wird automatisiert. Higgsfield Angles: Bilder als latente 3D-Räume neue Perspektiven aus 2D. Video-Modelle: ByteDance und Google aktuell vorne; kein „bestes Modell“, alles use-case-abhängig.


(29:46) - Instagram & Authentizität:


Insta CEO Adam Mosseri erklärt Hochglanz-Ästhetik für tot. Widerspruch: Auch „unperfekt“ kann KI faken. Idee: Reservate für echte Fotos wären sinnvoller als noch mehr Realismus.


(34:35) Zu Gast: Sabine Richly


EU AI Act: Code of Practice zu Transparenz/Kennzeichnung Kennzeichnung maschinenlesbar, nicht sichtbar fürs Auge. Problem: Freiwilligkeit, geopolitische Spannungen, Durchsetzung. Plattformen (Deployers) sollen visuelle Labels einblenden. Deepfake-Begriff unscharf; Rechtsprechung wird nachschärfen.


Mehr

Über diesen Podcast

Im KI-Podcast unterhalten sich Dr. Jürgen Scriba und Boris Eldagsen mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. Medienkünstler Jürgen Scriba ist promovierter Physiker, war Wissenschaftsredakteur bei „Focus“ und „DER SPIEGEL“, Geschäftsführer DFA und leitet die Arbeitsgruppe technischer Fortschritt des Deutschen Fotorats. Boris Eldagsen ist international anerkannter Experte für KI-generierte Bilder. Seine Absage des Sony World Photo Awards löste 2023 eine weltweite Debatte aus. Er unterrichtet "KI für Kreative" an der LABASAD Barcelona.
15
15
Close