#18 IT-Betrieb unter Echtzeitdruck: Wie Observability und AIOps Medieninfrastrukturen stabil halten

#18 IT-Betrieb unter Echtzeitdruck: Wie Observability und AIOps Medieninfrastrukturen stabil halten

26 Minuten
Podcast
Podcaster

Beschreibung

vor 1 Woche

In dieser Episode von FKTG Media Technology
Insights spricht Angela Bünger mit Andreas Jordan,
Managing Consultant bei DXC Technology, über ein Thema, das meist
im Hintergrund läuft – im Ernstfall aber über Stabilität oder
Ausfall komplexer Medien-IT entscheidet: Monitoring, Logging und
den Einsatz von KI im IT-Betrieb.


Im Fokus steht die Frage, wie sich der Betrieb moderner,
hochvernetzter Systeme verändert hat. Klassisches Monitoring mit
Dashboards und Schwellenwerten stößt in dynamischen
IT-Landschaften zunehmend an Grenzen. Cloud-Infrastrukturen,
Microservices und containerisierte Workflows erzeugen eine
Komplexität, in der Probleme oft erst sichtbar werden, wenn
mehrere Systeme gleichzeitig reagieren.


Im Gespräch wird deutlich, warum sich der Fokus vieler
Organisationen von reinem Monitoring hin
zu Observability und AIOps verschiebt
– also zu Ansätzen, die nicht nur Störungen melden, sondern
Zusammenhänge analysieren, Muster erkennen und mögliche Probleme
frühzeitig identifizieren.


Dabei geht es unter anderem um:




den Unterschied zwischen klassischem Monitoring,
Observability und AIOps – und warum diese
Begriffe im Betrieb komplexer Systeme mehr sind als nur neue
Schlagworte




die Rolle von Logs, Metriken und
Ereigniskorrelation, wenn es darum geht, Ursachen
statt nur Symptome zu erkennen




wie KI helfen kann, Event-Fluten zu reduzieren,
Muster zu erkennen und Ursachen schneller
einzugrenzen




typische Fehlannahmen beim Einsatz von AIOps – und warum
Technologie allein selten die Lösung ist




den Ansatz der „Intelligent
Operations“, bei dem Monitoring, Logging, Analyse
und Betriebsprozesse zusammengeführt werden




Ein besonderer Fokus liegt auf der Übertragbarkeit
auf Medien- und Broadcast-Infrastrukturen.
Live-Produktion, Playout und Streaming stellen ähnlich hohe
Anforderungen an Verfügbarkeit, Latenz und Systemstabilität wie
andere kritische IT-Umgebungen. Fehler wirken hier unmittelbar
nach außen – Monitoring wird damit zum Frühwarnsystem für den
laufenden Betrieb.


Zum Abschluss diskutieren Host und Gast, wie sich IT-Betrieb in
den kommenden Jahren weiterentwickeln könnte: weniger isolierte
Alarme, mehr Kontext, stärker datengetriebene Entscheidungen und
ein Betrieb, der zunehmend vorausschauend statt reaktiv arbeitet.


Eine Folge für alle, die verstehen wollen, wie sich
der Betrieb komplexer Medien-IT unter
Echtzeitbedingungen verändert – und welche Rolle
Daten, Automatisierung und KI dabei künftig spielen.
15
15
Close