Ethical AI - Warum es nicht reicht die KI Outputs fair gestalten zu wollen | Barbara Lampl

Ethical AI - Warum es nicht reicht die KI Outputs fair gestalten zu wollen | Barbara Lampl

vor 1 Jahr
1 Stunde 3 Minuten
0
0 0
Podcast
Podcaster
How to enhance your data usage

Beschreibung

vor 1 Jahr

TRIGGERWARNUNG – Wir sprechen unmenschliche Arbeitsbedingungen
und Menschen die mit unangemessene Inhalte sichten und prüfen
müssen.


Wenn Daten doch die Grundlage von KI sind und wir eine ethical AI
mal Ende zu Ende betrachten wollen, dann müssen wir doch
eigentlich genau an der Quelle anfangen. Aber warum wird darüber
so wenig gesprochen? Und was läuft hier schon alles falsch?


Darüber spricht Christian Krug, der Host des Podcasts „Unf*ck
Your Data“ mit Barbara Lampl, Geschäftsführerin von Empathic
Business.





Wenn es um das Thema Ethical AI geht, dann betrachten die meisten
Menschen gerne die Outputs. Also dass hier eine faire und
ausgewogene Mischung an Ergebnissen repräsentiert wird. Manchmal
wagt man noch den Blick darauf wie die Daten für das Training
zusammengestellt werden.


Aber wie genau diese Daten zugänglich gemacht oder erfasst
wurden, darüber wird nur selten berichtet. Denn das ist ein
Bereich, den die großen Tech Unternehmen oft nur zu gerne
unsichtbar halten würden.





Barbara Lampl nimmt uns mit auf eine Geschichtsstunde durch das
Datalabeling oder Dataannotation. Denn Daten und Informationen
waren schon immer ein Wettbewerbsvorteil. In der digitalen
vernetzten Welt wird dies besonders schnell sichtbar. Angefangen
von Yahoo deren Surfer das frühe Internet kartografiert haben bis
zu den heutigen Taskern, die die Grundlage für die modernen KI
Systeme legen. Data is king!


Gut sortierte, kategorisierte und beschriftete Daten sind der
entscheidenden Vorteil. Vom Labeling für KI Modelle bis zur
Content Moderation auf den sozialen Medien. Wer die besten Daten
hat, hat die zuverlässigsten Algorithmen.





Das Bizarre: Die Menschen die die Grundlagen dafür legen, dass
andere Milliardäre werden, verdienen oft nur wenige Dollar die
Stunde. Und das für Arbeit im Sekundentakt die oft unter prekären
Bedingungen stattfindet und bei der die Menschen zum Teil ohne
Ausbildung oder Betreuung mit extremen Inhalten konfrontiert
werden.


Kein Wunder, dass diese Karawane immer weiter zieht, denn
Ausbeutung ist nicht nachhaltig und viele der Tasker lernen
schnell die Systeme die sie aufbauen selbst zu nutzen um ihre
Arbeit zu erleichtern.





Doch auch dieser unbequemen Wahrheit müssen wir uns stellen, wenn
wir KI Systeme nutzen. Und uns manchmal fragen – Warum sind die
Ergebnisse so seltsam?








Profile:





Zum LinkedIn-Profil von AI Babsi:
https://www.linkedin.com/in/barbaralampl/





Zum LinkedIn-Profil von Christian:
https://www.linkedin.com/in/christian-krug/





Christians Wonderlink: https://wonderl.ink/@christiankrug





UNF#CK YOUR DATA auf Linkedin:
https://www.linkedin.com/company/unfck-your-data





Buchempfehlung:





Buchempfehlung von Barbara: Feeding the Machine – Mark Graham





Alle Empfehlungen in Melenas Bücherladen:


https://gunzenhausen.buchhandlung.de/unfuckyourdata








Hier findest Du Unf*ck Your Data:





Zum Podcast auf Spotify:
https://open.spotify.com/show/6Ow7ySMbgnir27etMYkpxT?si=dc0fd2b3c6454bfa





Zum Podcast auf iTunes:
https://podcasts.apple.com/de/podcast/unf-ck-your-data/id1673832019





Zum Podcast auf Deezer:
https://deezer.page.link/FnT5kRSjf2k54iib6





Zum Podcast auf Youtube: https://www.youtube.com/@unfckyourdata





Merch:





https://unfckyourdata-shop.de/





Kontakt:





E-Mail: christian@uyd-podcast.com





Timestamps:


00:00 Einführung in Ethical AI und Datenverantwortung


04:00 Die Rolle der Daten im KI-Training


09:51 Geschichte der Datenannotation und Crowdsourcing


15:46 Content Moderation und ihre ethischen Herausforderungen


24:03 Die Herausforderungen der Polizeiarbeit


26:59 Die Realität der Clickworker


30:14 Die ethischen Implikationen der Datenannotation


32:59 Die Problematik der Edge-Cases in KI


36:14 Die Rolle des Menschen im KI-Training


38:58 Die Herausforderungen der Textbewertung in KI


43:19 Kulturelle Wahrnehmung und Sprache


44:05 Absurdistan: Die Herausforderungen der Datenverarbeitung


45:50 Die Rolle von Clickworkern in der Datenlabeling-Welt


48:34 Die Dimensionen des Datenlabelings


51:45 Die Herausforderungen der Content Moderation


54:57 Die ethischen Implikationen von KI und Daten


57:32 Faire Bedingungen in der KI-Wertschöpfungskette



Abonnenten

MLindaK
Euskirchen
tihenkel
Mücke
BOFH
Lampertheim
sfenn
Augsburg
15
15
Close