#741 KI nach dem Hype: Semantische Suche – schneller finden, besser entscheiden

#741 KI nach dem Hype: Semantische Suche – schneller finden, besser entscheiden

Back to the Future – KI: Bestandesaufnahme & Vorgehen mit Patrick Arnecke, Data Scientist beim Statistischen Amt des Kantons Zürich
17 Minuten

Beschreibung

vor 3 Wochen
Duri Bonin hat Patrick Arnecke zu sich in den Podcast eingeladen,
weil ich verstehen will, wie KI im realen Workflow hilft. Daraus
ist die Serie «Back to the Future» entstanden: eine ruhige
Bestandesaufnahme nach dem Hype – was heute schon funktioniert und
wie man es sauber in die Praxis bringt. In dieser Folge geht es um
semantische Suche. Ausgangslage: In der Verwaltung liegen Millionen
von Dokumenten. Wer die relevanten Dokumente schneller findet, kann
sich länger und besser der eigentlichen Arbeit widmen. Patrick
erklärt, wie Machine-Learning-Modelle Texte inhaltlich verorten
(Embedding-Raum) und wie daraus eine hybride Suche entsteht –
lexikalisch und semantisch. Konkret zeigt er das am
Staatsarchiv-Projekt: eine intelligente Suche über historische
Bestände aus zwei Jahrhunderten (u. a. Kantonsratsprotokolle,
Regierungsratsbeschlüsse, Gesetzessammlungen). Warum das wichtig
ist? Weil sich Begriffe ändern – semantische Suche findet relevante
Dokumente auch dann, wenn die Terminologie von damals nicht bekannt
ist. Patrick zeigt zudem, wie man Qualität prüft: mit Testdaten,
gezielten Schlüsselbegriffen und realen Suchaufgaben. Und er
erklärt, weshalb 100 % Perfektion weder möglich noch nötig ist,
solange Ergebnisse praxistauglich sind. Weiter erklärt er, wie die
Technik trainiert wird, wo Grenzen liegen und warum der Nutzen
durch Einführung und Schulung entsteht: Viele sind an strenge
Stichwortmasken gewöhnt; semantische Suche eröffnet neue Muster –
bis hin zur Ähnlichkeitssuche mit ganzen Dokumenten. Auch die
Infrastrukturfrage kommt zur Sprache: Öffentliche Daten dürfen in
die Cloud, vertrauliche und geheime Daten laufen auf Servern des
Kantons. Die Kosten bleiben für Suchlösungen überschaubar. Wichtig
ist die Skalierung: Ein Pilot für einige Hundert Nutzende ist etwas
anderes als ein Betriebsprodukt für 35’000 Mitarbeitende – genau
dort setzt Patricks Team an. Die Folge zeigt: Semantische Suche ist
kein Hype-Feature, sondern ein Arbeitsinstrument, das bleibt. Sie
spart Zeit, erhöht die Trefferqualität und macht historische wie
aktuelle Open-Data-Bestände noch einmal ganz anders nutzbar.
Gleichzeitig gilt weiterhin Patricks Prinzip: Problem vor Tool,
klein starten, Wirkung messen, reversibel bleiben und das
ausrollen, was im Alltag trägt. In der nächsten Folge möchte Duri
mit ihm über Audiotranskription sprechen. Für wen ist diese Folge
spannend? Für alle, die mit grossen Textmengen arbeiten –
Verwaltung, Justiz, Bildung, Medien, KMU – und wissen wollen, wie
man semantische Suche einführt, bewertet und skalierbar macht. Die
Podcasts "Auf dem Weg als Anwält:in" sind unter
https://www.duribonin.ch/podcast/ oder auf allen üblichen
Plattformen zu hören . Dort einfach nach 'Duri Bonin' suchen und
abonnieren.

Kommentare (0)

Lade Inhalte...

Abonnenten

15
15