Überblick
Schlüsselergebnisse
-
Die Verwendung von AIOps-Plattformen zur Erweiterung von IT-Funktionen, wie z. B. Ereigniskorrelation und -analyse, Erkennung von Anomalien, Ursachenanalyse und Natural Language Processing, wächst schnell. Die Anwendung von AIOps bei Funktionen wie ITSM und DevOps schreitet jedoch langsamer voran.
-
Die Angebote der AIOps-Plattform haben sich in zwei Ansätze aufgeteilt: domänenunabhängige und domänenzentrierte Lösungen.
-
Unternehmen, die AIOps-Plattformen einsetzen, nutzen sie als Kraftverstärker für Überwachungswerkzeuge, die über die Überwachung der Anwendungsleistung (APM), die Überwachung der IT-Infrastruktur (ITIM), die Überwachung der Netzwerkleistung und Diagnosetools sowie die Überwachung der digitalen Erfahrung korrelieren.
-
Die Reife der AIOps-Plattform, die IT-Fähigkeiten und die Betriebsreife sind die wichtigsten Faktoren bei der Verzögerung einer schnellen Time-to-Value. Zu den weiteren Herausforderungen bei der erweiterten Entwicklung gehören die Datenqualität und mangelnde Data-Science-Kenntnisse innerhalb der I&O.
Empfehlungen
I&O-Führungskräfte, die sich auf Infrastruktur, Betrieb und Cloud-Management konzentrieren, sollten:
-
die Wahrscheinlichkeit einer erfolgreichen AIOps-Plattform-Bereitstellung erhöhen, indem Sie sich auf einen bestimmten Anwendungsfall konzentrieren und einen inkrementellen Ansatz verfolgen, der mit der Ablösung der regelbasierten Ereignisanalyse beginnt und sich auf domänenzentrierte Arbeitsabläufe wie Anwendungs- und Netzwerkdiagnose ausdehnt.
-
auf spezifische Anwendungsfälle eingehen, indem Sie entweder domänenzentrierte AIOps-Plattformfunktionen, die in ein Überwachungstool integriert sind, nutzen, oder eine domänenunabhängige Lösung verwenden, die jeweils Ereignisse, Metriken und Traces erfasst.
-
Aufgabenautomatisierung, Wissensmanagement und Änderungsanalyse unterstützen, indem Sie eine AIOps-Plattform auswählen, die auf diese ITSM-Anwendungsfälle angewendet werden kann.
-
kontinuierliche Einblicke in das IT-Betriebsmanagement (ITOM) ermöglichen, indem Sie die folgenden drei Aspekte von AIOps-Plattformen unterstützen: beobachten, einsetzen und agieren.
Strategische Planungsannahme
Bis zum Jahr 2023 werden 40 % der DevOps-Teams die Anwendungs- und Infrastruktur-Überwachungstools mit künstlicher Intelligenz zur Unterstützung von IT-Betriebsplattformen (AIOps) ausbauen.
Definition des Marktes
AIOps-Plattformen erfüllen den Bedarf der I&O-Führungskräfte nach operativer Unterstützung, indem sie große Datenmengen und maschinelle Lernfunktionen kombinieren, um die ständig wachsende Menge, Vielfalt und Geschwindigkeit der Daten zu analysieren, die von der IT als Reaktion auf die digitale Transformation erzeugt werden. Es hat sich eine identifizierbare Gruppe von Anbietern herauskristallisiert, die die Unternehmensanforderungen für diese Einsicht erfüllen, auch wenn sie für diese Anforderungen unterschiedliche Prioritäten setzen und die Unterstützung dieser Anforderungen unterschiedlich gestalten.
Marktbeschreibung
AIOps-Plattformen verbessern eine breite Palette an IT-Betriebsprozessen, u. a. die Erkennung von Anomalien, Ereigniskorrelation und Ursachenanalyse (RCA), um Überwachung, Servicemanagement und Automatisierungsaufgaben zu verbessern.
Die zentralen Funktionen von AIOps-Plattformen umfassen:
-
Erfassen von Daten aus mehreren Quellen, einschließlich Infrastruktur, Netzwerke, Anwendungen, Cloud oder vorhandene Überwachungstools (für domänenübergreifende Analysen)
-
Ermöglichung der Datenanalyse durch maschinelles Lernen an zwei Punkten:
-
Speicherung und Bereitstellung des Zugriffs auf die Daten
-
Vorschläge für präskriptive Antworten auf die Analyse
-
Einleitung einer Handlung oder eines nächsten Schrittes auf der Grundlage der Vorgabe (Ergebnis der Analyse)
Das Ziel der Analysebemühungen ist die Entdeckung von Mustern – natürlich in den Daten vorkommende Cluster oder Gruppen, die zur Vorhersage möglicher Vorfälle und auftauchenden Verhaltens verwendet werden. Diese Muster werden verwendet, um die Grundursachen aktueller Systemprobleme zu ermitteln und die Automatisierung intelligent voranzutreiben, um diese Probleme zu lösen (siehe Abbildung 1).
Abbildung 1. AIOps-Plattformen ermöglichen kontinuierliche Einblicke in die IT-Betriebsüberwachung (IT Operations Monitoring, ITOM)
Marktrichtung
Gartner schätzt die Größe des AIOps-Plattformenmarkts auf zwischen 300 und 500 Millionen US-Dollar pro Jahr. AI-Technologien, wie z. B. maschinelles Lernen, haben im Lauf der letzten 20 Jahre die Entstehung des ITOMs maßgeblich beeinflusst. Und AIOps-Plattformen sind nur das jüngste Beispiel dieses Einflusses. Der Einsatz von AI im IT-Betrieb wurde durch die Einführung digitaler Transformationen und die damit verbundene Notwendigkeit vorangetrieben, sich mit den folgenden Punkten zu befassen:
-
schnelles Wachstum bei von IT-Systemen, -Netzwerken und -Anwendungen generierten Datenvolumen
-
Erhöhung der Datenvielfalt und die notwendige Analyse der Ereignisse, Kennzahlen, Fehlerprotokollierung (Transaktionen), drahtgebundene Daten, Netzwerkflussdaten, Streaming-Telemetriedaten, Kundenstimmung und Weiteres
-
die wachsende Geschwindigkeit, mit der Daten generiert werden, die zunehmende Änderungsrate innerhalb der IT-Architekturen und die Herausforderungen, die durch die Einführung von Cloud-native-Architekturen und ephemeren Architekturen in Bezug auf die Beobachtbarkeit und eine bessere Einbindung entstehen
-
die Notwendigkeit, wiederkehrende Aufgaben intelligent und adaptiv zu automatisieren und den Änderungserfolg sowie SLA-Fehler vorherzusagen
Die Unfähigkeit, mit diesen Datenanforderungen umzugehen, kann angesichts der in allen Bereichen des Unternehmens erforderlichen Erkenntnisse kostspielig sein. AIOps-Plattformen müssen in der Lage sein, die vier Stufen der IT-Betriebsüberwachung schrittweise einzusetzen (siehe Abbildung 2).
Abbildung 2. Vier Stufen der IT-Betriebsüberwachung
I&O-Führungskräfte konzentrieren sich allmählich auch auf Anwendungsfälle in Bereichen, die über die IT-Betriebsüberwachung hinausgehen, wie z. B. IT-Service-Management (ITSM), Digital Experience Monitoring (DEM) und DevOps (siehe Anmerkung 2 und Verbesserung der Ereignisverwaltung mit DevOps-Techniken für kontinuierliche Überwachung und Automatisierung). Darüber hinaus umfasst das Spektrum von Anwendungsfällen einer AIOps-Plattform den gesamten Lebenszyklus der Anwendungen und Teams (siehe Abbildung 3).
Abbildung 3. Anwendung von AIOps-Plattformen in einem Spektrum an Anwendungsfällen während des gesamten Lebenszyklus einer Anwendung
Außerdem bedingt die digitale Transformation einen erhöhten Bedarf an Geschwindigkeit bei der IT. Dadurch werden Tools notwendig, die folgende Fähigkeiten erfüllen können:
-
Reduzierung von Rauschen (wie z. B. falsche Alarme) durch Clustering- und Mustererkennungsalgorithmen
-
Bestimmung der Kausalität, Identifizierung der wahrscheinlichen Ursache von Vorfällen unter Verwendung von Topologie und ML und Zuordnung dieser Probleme auf eine Customer Journey unter Verwendung von Algorithmen wie Entscheidungsbäumen, Random-Forest- und Diagrammanalysen
-
Erfassen multivariater Anomalien, die über statische Schwellenwerte oder numerische Ausreißer hinausgehen, um proaktiv anomale Zustände und Verhaltensweisen zu erkennen und sie mit dem geschäftlichen Einfluss in Beziehung zu setzen
-
Erkennen von Trends, die zu Ausfällen führen können, bevor ihre Auswirkungen spürbar sind
-
Vorantreiben der Automatisierung von wiederkehrenden Aufgaben mit niedrigem und mittlerem Risiko
-
Verbesserung der Effektivität und Automatisierung mithilfe von Chatbots und virtuellen Support-Assistenten (VSAs), um den Zugriff auf Wissen zu demokratisieren und wiederkehrende Aufgaben zu automatisieren
-
Triage-Probleme, Hilfe bei der Priorisierung und Angebot von möglichen Maßnahmen zur Lösung (entweder direkt oder über die Integration auf Basis früherer Szenarien)
Gartner erwartet, dass über die nächsten fünf Jahre weitreichende domänenunabhängige AIOps-Plattformen und domänenorientierte AIOps-Tools mit eingeschränkter Reichweite, wie ITIM, APM oder ITSM-Suiten, die beiden Wege zum Bereitstellen von AIOps-Funktionalität werden (siehe Anmerkung 3).
Wenn die Vielfalt an Datenquellen den Umfang eines domänenorientierten Tools überschreitet, ist ein weitreichendes Werkzeug erforderlich. Das bedeutet nicht unbedingt, dass das domänenorientierte Tool nicht verwendet wird. Da maschinelles Lernen weiterhin in Monitoring-Tools eingebettet wird, wird die AIOps-Plattform zu einer gebündelten Umgebung. In dieser Umgebung wird AI auf Domainebene innerhalb eines domänenorientierten Tools verwendet. Da Datenströme aus mehreren Quellen verfügbar sind, wird die Ausgabe der Domain-Tools an die weitreichende, domänenunabhängige AIOps-Plattform für domänenübergreifende Korrelationen gesendet.
Angesichts der Entwicklung des Marktes beobachtet Gartner die Entwicklung der AIOps-Fähigkeiten über verschiedene Dimensionen:
-
Domänenunabhängige AIOps – Anbieter, die mit einer Allzweck-AIOps-Plattform auf den Markt gehen. Diese Produkte beruhen meist auf Überwachungstools, um die Datenerfassung durchzuführen und um auf die breitesten Anwendungsfälle einzugehen.
-
Domänenorientierte AIOps – Anbieter, die die wichtigsten Komponenten haben, aber nur über einen eingeschränkten Satz an Anwendungsfällen verfügen. Sie tun im Wesentlichen dasselbe wie zuvor, aber sie ersetzen Regeln, Heuristik und Fingerabdrücke mit Mathematik (Algorithmen). Diese Anbieter konzentrieren sich auf eine Domain (z. B. Netzwerk, Endpunktsysteme oder APM). Es gab jedoch einige Anstrengungen von domänenorientierten Lösungen, diese Kategorien zu hybridisieren und zu entwickeln, um die Aufnahme von Daten aus anderen Quellen als ihre eigenen Tools zu integrieren und diese Daten in ihre Analysen einzuschließen.
-
Do-it-yourself (DIY) – – Einige Open-Source-Projekte ermöglichen es Benutzern, ihre eigenen AIOps-Plattformen zusammenzustellen, indem sie Werkzeuge für die Dateneingabe, eine große Datenplattform, ML und eine Visualisierungsschicht anbieten. Endbenutzer können die Komponenten von mehreren Anbietern kombinieren und aufeinander abstimmen. Ein paar Unternehmen bauen aktiv AIOps-Plattformen auf, indem sie alle erforderlichen Schichten zusammenstellen, beginnend mit dem Streaming, um Daten zu erfassen (z. B. mit Prometheus), gefolgt von Aggregation (z. B. in InfluxDatas InfluxDB) und einem Visualisierungstool (z. B. Grafana oder Elastic Kibana). Einige fortschrittliche Anwender von DIY-AIOps-Plattformen haben Lösungen entwickelt, die die Vertraulichkeitsstufe ihrer Entwicklungen analysieren, um Risiken abzuschätzen, Kundenabwanderung vorherzusagen und Probleme zu erkennen und automatisch zu lösen, bevor sie geschäftliche Auswirkungen haben. Diese Entwicklungen sind jedoch aufgrund der Fähigkeiten, die zu deren Unterstützung sowie für Wartungsaufwand und -unterstützung erforderlich sind, in der Minderheit.
Marktanalyse
Heute liefern wenige Anbieter die volle Leistung von AIOps-Plattformen, schnelle Einblicke in große Mengen hochvolatiler Daten zu bieten. Die Architektur und die Plattform haben sich verbessert, aber die Technologie ist immer noch in der Entwicklungsphase und benötigt Zeit und Bemühungen, um erstklassige Ergebnisse zu erzielen. Um ein klareres Bild darüber zu erhalten, wie sich der Markt entwickelt und wo die Anbieter in Bezug aufeinander positioniert sind, berücksichtigen Sie die folgenden AIOps-Plattformfunktionen:
Datenaufnahme und -handhabung
AIOps-Plattformen müssen in der Lage sein, ruhende Daten (historisch) und bewegte Daten (Echtzeit, Streaming) zu erfassen. Diese Plattformen ermöglichen die Aufnahme, das Indizieren und die Speicherung von Ereignisdaten, drahtgebundenen Daten, Kennzahlen, Fehlerprotokollierung und Diagramm- und Dokumentdaten. Diese Tools für den IT-Betrieb müssen Daten auch direkt bei der Aufnahme in Echtzeit analysieren, ohne dass die Daten vor ihrer Analyse zuerst in einer Datenbank gespeichert werden müssen. Sie müssen auch eine korrelierte Analyse über mehrere Ströme von Echtzeit- und historischen Daten bereitstellen können.
Analyse des maschinellen Lernens
Es werden folgende Arten analytischer Ansätze verwendet:
-
Statistische, probabilistische Analyse – Eine Kombination aus univariater und multivariater Analyse, einschließlich der Verwendung von Korrelation, Clustering, Klassifizierung und Extrapolation auf Kennzahlen, die über IT-Einheiten erfasst wurden.
-
Automatische Mustererkennung und -vorhersage – Erkennung von Mustern, Clustern oder Gruppen, die implizit Korrelationen in historischen und/oder Streaming-Daten beschreiben. Mit ihrer Hilfe können dann Prognosen zu Vorfällen mit unterschiedlichen Wahrscheinlichkeiten getroffen werden.
-
Erkennung von Anomalien – Verwendung der durch die vorherigen Komponenten erkannten Muster zur Bestimmung des normalen Systemverhaltens und dann zur Erkennung von Abweichungen vom normalen Verhalten, sowohl uni- als auch multivariat. Die Erkennung von Anomalien sollte die Saisonalität unterstützen und entscheiden, ob das Verhalten innerhalb eines Zeitraums, der Season genannt wird, anomal ist. AIOps-Plattformen sollten in der Lage sein, die natürlich auftretenden Seasons in Daten zu erkennen und zu lernen, wann dieses Verhalten nicht mehr anomal ist. Um hier von Wert zu sein, müssen die Algorithmen berücksichtigen, ob die Anomalie eine Auswirkung hat oder nicht. Bei einer umfangreichen Entwicklung werden immer Anomalien auftreten, und einige werden von größerer Bedeutung sein als andere. Über die bloße Erkennung von Ausreißern hinaus müssen sie mit potenziellen Geschäftsauswirkungen und anderen gleichzeitigen Prozessen wie Metadaten-Tags für das Release-Management korreliert werden, um voll und ganz nützlich zu sein und nicht nur mehr Alerts zu erzeugen.
-
Bestimmung der Grundursache – Auflösung des Netzwerks von Korrelationen, die durch die automatische Mustererkennung und die Aufnahme von Diagrammdaten etabliert wurden, um Kausalitätsketten zwischen Ursache und Wirkung zu definieren.
-
Topologische Analyse – Damit die Muster, die AIOps-Plattformen erkennen, relevant und umsetzbar sind, muss ein Kontext um die aufgenommenen Daten gelegt werden. Dieser Kontext ist in Form von Diagrammdaten die Topologie. Ohne den Kontext und die de-facto-Einschränkung der Topologie können die Muster, die während der Gültigkeit erkannt wurden, weder hilfreich noch ablenkend sein. Durch die Ableitung von Mustern aus Daten innerhalb einer Topologie wird die Relevanz bestimmt und ausgeblendete Abhängigkeiten veranschaulicht. Die Verwendung der Topologie als Teil der Kausalitätsbestimmung kann ihre Genauigkeit und Effektivität erheblich steigern. Die Erfassung von Ereignissen und deren vor- und nachgelagerten Abhängigkeiten mit Hilfe von Grafiken und Engpassanalysen kann einen großen Einblick in die Frage geben, worauf sich die Abhilfemaßnahmen konzentrieren müssen.
-
Präskriptive Beratung – Vorschläge zur Lösung eines Problems. Diese Vorschläge können auf einer Datenbank historischer Lösungen (Tribal-Wissen) zu wiederkehrenden Problemen basieren oder über Crowdsourcing ermittelt werden.
Abhilfemaßnahmen
Wenn die Technologie ausgereift ist, werden Nutzer in der Lage sein, präskriptive Ratschläge der Plattform zu nutzen, was die Aktionsphase ermöglicht (siehe Anmerkung 4). Die Schritte hierfür sind in Abbildung 4 dargestellt.
Abbildung 4. Die Zukunft der AI-unterstützten Automatisierung: Triage und Behebung von Problemen
Ein automatisierter Closed-Loop-Prozess, der als selbstfahrendes ITOM bezeichnet wird, ist sehr wünschenswert, aber dennoch ehrgeizig. Es wurden nur sehr wenige präskriptive Lösungen in kommerziellen Tools beobachtet, die über solche hinausgehen, die lediglich ein Skript vom Typ Bounce the Server oder Open a Ticket automatisieren. Die wahrscheinlichen Kandidaten für automatisierte Aktionen durch präskriptive Instrumente sind diejenigen, die ein geringes Risiko aufweisen. Dies sind diejenigen, die relativ wenig Schaden anrichten, wenn sie versagen oder unerwartete Nebenwirkungen verursachen. Abhängig von der Umgebung können vorbestimmte Aktionen wie ein Patch-Update erfolgreich sein sowie Aktionen zur Durchführung von Arbeitsaufwand-Optimierung, wie z. B. eine zusätzliche virtuelle Maschine (VM) oder ein Container.
Die verschiedenen Wege zu AIOps
AIOps-Plattformen können bei der ITSM-Einbindung helfen, indem sie AIOps verwenden, um die Automatisierung intelligent voranzutreiben und die gesamte Effektivität, Effizienz und Fehlerreduzierung von ITSM-Tools zu verbessern (siehe Anmerkung 3).
Verwenden Sie AIOps zur:
-
Unterstützung von Service-Desk-Mitarbeitern bei der Zuweisung, Kategorisierung und Weiterleitung von Tickets
-
Aufgabenautomatisierung (zum Beispiel die Bereitstellung von Software, die Bearbeitung von Passwortrücksetzanforderungen, die Aktualisierung von VPN-Clients und die Überprüfung von Text in E-Mails, um Anfragen zu initiieren)
-
Nutzung historischer Daten zur Verbesserung der Leistung der Mitarbeiter und Erhöhung der Effizienz
-
Strategische Erkenntnisse für Aktivitäten wie Änderungsmanagement, Vorhersagen von Änderungserfolg, Identifizierung von Änderungskonflikten und von bald auslaufenden Verträgen, Ermittlung der besten Zeit, um das Eigentum zu patchen usw.
-
Vorhersagende Analysen (Predictive Analytics) zur Kennzeichnung von Anträgen und Vorfällen, die ein SLA verletzen könnten
-
Verwendung von Natural Language Processing (NLP) für Chatbots und VSAs, um die Handhabung von grundlegenden Anfragen und Aufgaben, wie z. B. Passwortrücksetzungen, vom Servicedesk zu übernehmen, um die Wissensbasis mit Benutzern zu teilen und die Automatisierung von Aufgaben zu ermöglichen
AIOps in DevOps
IT-Organisationen haben auch damit begonnen, AIOps in einem DevOps-Kontext zu untersuchen, der in die Anwendungsfreigabeautomatisierung integriert ist, um Risiken und Gefahren im Code und auch in Builds zu bewerten. Dies erfordert die Erfassung von Metadaten, einschließlich Tags aus dem Release-Management, die bei der Kategorisierung und Zuordnung neuer Funktionen helfen. Sie nutzen auch AIOps, um potenzielle Sicherheitsprobleme zu erkennen.
NLP wird häufig in ITSM-Tools übernommen, einige APM-Anbieter haben jedoch begonnen, NLP als Teil ihrer AIOps-Funktion zu integrieren. Das Ziel ist, eine flexiblere ChatOps für die DevOps-Teams zu ermöglichen und eine bessere Schnittstelle zu APM-Daten und -Automatisierung anzubieten.
Repräsentative Anbieter
Die Auflistung von Anbietern im vorliegenden Marktleitfaden hat keinen Anspruch auf Vollständigkeit. Der folgende Abschnitt soll dem Leser ein Verständnis für den Markt und die vorhandenen Angebote vermitteln.
Markteinführung
Anbieter von AIOps-Plattformen stellen eine enorme Bandbreite von Funktionen bereit, die immer mehr wächst. Die Anbieter unterscheiden sich in ihrer Datenaufnahme und den fertigen Anwendungsfällen, die mit einer minimalen Konfiguration verfügbar gemacht werden. In Tabelle 1 stellen wir eine repräsentative Beispielliste der Anbieter zur Verfügung, die AIOps-Plattformfunktionen über eine Reihe von Domänen hinweg bereitstellen (siehe Anmerkung 1).
Tabelle 1. Repräsentative Anbieter bei AIOps-Plattformen
Anbieter
|
Domäne
|
Gründungsjahr
|
Hauptsitz |
|
Domänenunabhängige (DA) AIOps
|
|
|
|
|
|
DA
|
2014
|
Vereinigte Staaten und Israel
|
|
|
DA
|
2012
|
Vereinigte Staaten
|
|
|
DA, DC: ITSM
|
1980
|
Vereinigte Staaten
|
|
|
DA
|
2008
|
Japan
|
|
|
DA, DC: APM
|
1974
|
Vereinigte Staaten
|
|
|
DA
|
2011
|
Vereinigte Staaten
|
|
|
DA
|
2015
|
Vereinigte Staaten
|
|
|
DA, DC: ITIM, DA
|
2012
|
Vereinigte Staaten
|
|
|
DA und Vertical-Market-Solutions
|
1911
|
Vereinigte Staaten
|
|
|
DA
|
1993
|
Vereinigtes Königreich
|
|
|
DA
|
2014
|
Vereinigte Staaten
|
|
|
DC: ITIM, SIEM (Crowdsourcing)
|
2014
|
Vereinigte Staaten und Israel
|
|
|
DA
|
2015
|
Vereinigte Staaten
|
|
|
DA
|
2011
|
Vereinigte Staaten
|
|
|
DA
|
2013
|
Vereinigte Staaten
|
|
|
DA
|
2011
|
Vereinigte Staaten
|
|
|
DA (DC: ITIM für SignalFx)
|
2003
|
Vereinigte Staaten
|
|
|
DA, DC: ITIM, Serviceüberwachung, Modellierung
|
2015
|
Vereinigte Staaten
|
|
|
DC: ITIM
|
2010
|
Vereinigte Staaten
|
|
|
DA
|
2010
|
Israel
|
|
|
DA
|
2014
|
Indien
|
|
Domänenorientierte (DC) AIOps
|
|
|
|
|
ITSM
|
|
|
|
|
|
DC: ITSM
|
2017
|
Vereinigte Staaten
|
|
|
DC: ITSM
|
2016
|
Vereinigte Staaten
|
|
|
DC: Änderungs-management
|
2007
|
Vereinigte Staaten
|
|
|
DC: ITSM (VSA)
|
1998
|
Vereinigte Staaten
|
|
|
DC: ITSM, BAM
|
2012
|
Vereinigte Staaten
|
|
|
DC: ITSM
|
2004
|
Vereinigte Staaten
|
|
DevOps
|
|
|
|
|
|
DC: DevOps
|
2016
|
Vereinigte Staaten
|
|
|
DC: Entw.
|
2011
|
Vereinigte Staaten
|
|
APM
|
|
|
|
|
|
DC: APM, NPMD
|
2008
|
Vereinigte Staaten
|
|
|
DC: APM, NLP
|
2005
|
Vereinigte Staaten
|
|
|
DC: APM, ITIM
|
2008
|
Vereinigte Staaten
|
|
NPMD
|
|
|
|
|
|
DC: NPMD
|
2007
|
Vereinigte Staaten
|
|
|
DC: NPMD
|
2014
|
Vereinigte Staaten
|
|
|
DC: NPMD
|
2000
|
Irland
|
|
ITIM
|
|
|
|
|
|
DC: ITIM, APM
|
2010
|
Vereinigte Staaten
|
|
|
DC: ITIM
|
2014
|
Vereinigte Staaten
|
|
|
DC: ITIM
|
2003
|
Vereinigte Staaten
|
|
|
DC: ITIM
|
2008
|
Vereinigte Staaten
|
|
|
DC: ITIM (Crowdsourcing)
|
2005
|
Vereinigte Staaten
|
|
NPMD = Netzwerkleistungsüberwachung und -diagnose; BAM = Überwachung der Geschäftsaktivität
|
Quelle: Gartner (November 2019)
Marktempfehlungen
Einen schrittweisen Ansatz für AIOps anwenden
Wenn Sie AIOps-Plattformen einführen, beginnen Sie mit weniger kritischen Anwendungen und wenden Sie Folgendes an:
-
Ereigniskategorisierung
-
Korrelation
-
Erkennung von Anomalien
Stellen Sie sicher, dass Ihre Anwendungsfälle Maßnahmen ergreifen, um die Geschäftsergebnisse zu verbessern, und dass durch die AIOps-Plattform entweder ein manueller nächster Schritt folgt oder die Einführung eines Skripts oder eines Betriebshandbuchs, um den aktuellen Zustand zu verbessern. Diese Skripts und Betriebshandbücher sind für Situationen mit geringem Risiko, z. B. beim Öffnen eines Tickets oder beim Starten eines zusätzlichen Containers.
Beginnen Sie bei der Verwendung von NLP mit Chatbots für die Ausführung von wiederkehrenden Aufgaben und für die kostengünstige Weitergabe von Wissen an Mitarbeiter und Benutzer, sowie mit virtuellen Kundenassistenten für transaktionsbezogene Interaktionen mit den Benutzern.
Beginnen Sie mit einem geringeren Umfang eines domänenorientierten Tools, das integrierte AIOps-Funktionen besitzt. Um den Erfolg zu messen, wird die verringerte Anzahl an Fehlalarmen und nicht umsetzbarer Tickets am Servicedesk verfolgt, um dadurch die Auswirkungen erkannter Anomalien zu vermeiden und die Leistung zu verbessern. Wechseln Sie von der Aufnahme von Ereignissen hin zu Kennzahlen, um eine größere Auswirkung zu erzielen. Beginnen Sie dann mit der Aufnahme der Überwachung und analysieren Sie alles im Kontext von Topologie, Beziehungen und Auswirkungen auf das digitale Geschäft.
Erstellen Sie ein Programm, um das I&O-Personal zu Data Science zu schulen (siehe Anmerkung 5).
Die Anwendungsfälle, denen AIOps-Plattformen zugewiesen werden können, hängen von ihrem Umfang ab. Manche benötigen möglicherweise mehr Daten, als es optimal wäre, und andere mehr Data-Science-Kenntnisse als eventuell in I&O verfügbar.
Moderne IT-Betriebe erfordern Sichtbarkeit über IT-Einheiten hinweg, die Aufschlüsselung von Silos inkl. Anwendungen, ihrer Beziehungen, Abhängigkeiten und frühere Transformationen, um Einblicke in den aktuellen Zustand der IT-Landschaft zu erhalten. Die fortschreitende Art der Entwicklungsreife und der entstehenden Anwendungsfälle erfordert eine Bereitschaft zur Aufnahme einer Vielzahl von Datenquellen (siehe Anmerkung 6). Die I&O-Führungskräfte sollten später die AIOps-Plattformen auswählen, die in der Lage sind, eine Vielzahl von historischen und Streaming-Datentypen aufzunehmen und den Zugriff auf sie zu ermöglichen, um domänenunabhängige Anwendungsfälle zu unterstützen.
Wählen Sie Werkzeuge aus, mit denen Sie die Tiefe und Breite der Analyse schrittweise erhöhen können (siehe Abbildung 5).
Abbildung 5. Entwickeln Sie Ihre AIOps-Stufen
Entwickeln Sie Ihre AIOps-Stufen durch:
-
Verwendung eines kommerziellen Software-Tools zur Erkennung von Mustern, die große Datenmengen organisieren können. Dies ist am hilfreichsten bei der Trennung von niedrigen Entropieereignissen, die zu Fehlalarmen führen könnten, von solchen, die sofortige Aufmerksamkeit erfordern.
-
Prüfung, inwieweit diese Muster es den Benutzern erlauben, manuelle Maßnahmen zur Statusverbesserung vorzunehmen. Bestimmung, ob die Mustererfassung hinsichtlich ihrer Auswirkungen auf die wichtigsten Geschäftsergebnisse wichtig ist.
-
Vorhersage zukünftiger Auswirkungen von Ereignissen und Vorfällen.
-
Arbeiten mit Ursachenanalyse-Funktionen entweder innerhalb einer domänenorientierten AIOps-Plattform oder durch Verwendung eines domänenunabhängigen AIOps-Tools über Daten aus mehreren Domänen hinweg.
-
Verwendung von AIOps mit ITSM, beginnend mit virtuellen Support-Assistenten/Chatbots, Ticket-Analysen und schließlich Ändern der Risikoanalyse.
Alle Stufen der AIOps-Reife sind wichtig. Unternehmen sollten Tools auswählen, die so viele dieser Stufen wie möglich unterstützen und die Übertragbarkeit über Werkzeuge hinweg ermöglichen (siehe Anmerkung 7). Diese Stufen sollten schrittweise verwendet werden, um sicherzustellen, dass IT-Betriebsmitarbeiter aus dem Gelernten einen Nutzen ziehen können.
Akronym-Schlüssel und Glossarbegriffe
| APM |
Anwendungsleistungsüberwachung
|
| BAM |
Überwachung der Geschäftsaktivitäten
|
| DA |
Domänenunabhängig
|
| DC |
Domänenorientiert
|
| ITIM |
Überwachung der IT-Infrastruktur
|
| ITOM |
IT-Operations-Management
|
| ITSM |
IT-Serviceüberwachung
|
| NLP |
Natural Language Processing
|
| NPMD |
Überwachung von Netzwerkleistung und Diagnose
|
| SIEM |
Sicherheitsinformationen und Ereignismanagement
|
Nachweise
Die Anfragen von Gartner-Analysten und Endnutzern haben in den letzten 12 Monaten mehr als 25 % zugenommen. Sie betrafen verschiedene Aspekte von AIOps. Zu den Themen dieser Anfragen gehörten:
-
-
-
Mehrere AIOps-Anwendungsfälle innerhalb und außerhalb der IT zur Unterstützung von Visualisierung, Entscheidungen und Diagnose
Von den AIOps-Interaktionen waren 5 % mit dem DevOps-Anwendungsfall verbunden und 15 % mit einer Ereigniskorrelation.
Anmerkung 1Repräsentative Lieferantenauswahl
Die in dieser Untersuchung aufgeführten Anbieter wurden auf Basis einer oder zwei der folgenden Merkmale als Beispiel ausgewählt:
-
Domänenunabhängige Lösungen mit der Möglichkeit, Daten aus mehreren Quellen zu erfassen, darunter historische und Echtzeit-Streaming.
-
Domänenorientierte Lösungen mit ML, die in das Tool integriert sind.
-
Verschiedene Angebote, die proprietäre, Open-Source-, kostenlose und kommerzialisierte Versionen beinhalten, einschließlich der Entwicklung, die über lokale und SaaS-basierte Optionen hinausgeht.
Anmerkung 2AIOps-Anwendungsfälle erweitern
AIOps-Funktionen wurden bislang hauptsächlich für IT-Betriebsprozesse zur Überwachung oder Beobachtung von IT-Infrastruktur, Anwendungsverhalten oder digitaler Erfahrung eingesetzt. Fast immer sind die Investitionen in AIOps-Plattformen gerechtfertigt, weil sie in der Lage sind, die durchschnittliche Zeit bis zur Problemlösung zu reduzieren und somit die Kosten zu senken. Und sie sind auch im Hinblick darauf gerechtfertigt, ob dies die Verwendung von maschinellem Lernen erfordert, um:
-
Ereignisvolumen und Fehlalarme zu reduzieren.
-
ungewöhnliche Werte in Zeitreihendaten zu erkennen.
-
eine Ursachenanalyse durchzuführen, indem sie Bytecode-Geräte oder verteilte Verfolgungsdaten zusammen mit einer Diagrammanalyse in einem APM-Kontext verwenden.
Dies ändert sich jedoch, um auch anderen Arten von Anwendungsfällen gerecht zu werden.
AIOps wird bei der Überwachung digitaler Erfahrungen eingesetzt, um die Produktivität der Mitarbeiter durch die Verwendung von Chatbots zu verbessern und dadurch reibungsfreie Antworten auf Probleme zu liefern, denen Mitarbeiter ausgesetzt sein können.
In einigen Fällen suchen Teams aus den Bereichen IT-Sicherheit und IT-Betrieb nach Möglichkeiten, eine gemeinsame Plattform zu nutzen. Im Laufe ihrer Weiterentwicklung werden AIOps-Plattformen verwendet werden, um Anwendungsfälle zu ermöglichen, die eine Korrelation zwischen IT- und Sicherheitsbetrieb erfordern.
Nicht-IT-Gruppen wie Geschäftsverantwortliche und Teams, die sich außerhalb des IT-Betriebs befinden (wie Anwendungsentwickler und DevOps), zeigen zunehmend Interesse an AIOps-Technologien, um Einblicke über mehrere Datensätze hinweg zu erhalten.
Seit Januar 2019 haben die Kunden von Gartner wachsendes Interesse an der Gestaltung von Dashboards bekundet, die Echtzeit-Analysen von Kundenzufriedenheit, Customer Journeys, Bestellprozess und wirtschaftlicher Gesundheit zeigen. Das Ziel in diesem Fall ist es, den Geschäftsverantwortlichen durch AIOps in Echtzeit bereitgestellte Einblicke in die Auswirkungen der IT auf das Geschäft zu präsentieren, um sie auf dem Laufenden zu halten und es ihnen zu ermöglichen, Entscheidungen auf Grundlage relevanter Daten zu treffen.
Anmerkung 3AITSM
AITSM ist kein Akronym. Es handelt sich um einen Begriff, der sich auf die Anwendung von Kontext, Hilfe, Aktionen sowie Schnittstellen von KI, Automatisierung und Big Data auf ITSM-Tools und -Praktiken bezieht, um die allgemeine Effektivität, Effizienz und Fehlerreduzierung für I&O-Mitarbeiter zu verbessern. AITSM ist für intermediäre und fortgeschrittene Anwendungsfälle wichtig, um komplexe Umgebungen zu automatisieren und zu unterstützen.
Anmerkung 4Herausforderungen bei der Automatisierung von Aktionen auf der Grundlage präskriptiver Empfehlungen
Automatisierte Aktionen fallen unter mehrere Kategorien:
-
Aufgaben einer vorbestimmten Natur, die im Voraus geplant werden können (zum Beispiel Patch-Management oder Entwicklung neuer Builds)
-
Aufgaben, die nicht im Voraus geplant werden können, jedoch bekannte Auslöser haben, die häufig wiederkehren könnten. In diesem Fall sind die Verfahren gut dokumentiert (z. B. Workload-Optimierung in einer virtualisierten Umgebung).
-
Aufgaben mit unvorhersehbaren Auslösern, bei denen die Aktionen bekannt, aber nicht gut dokumentiert sind (z. B. bekannte Anomalien).
I&O-Führungskräfte möchten die Aktion normalerweise nicht vollständig den Maschinen überlassen und fordern zumindest einen Validierungsschritt, bevor sie eine Automatisierung auslösen. Dieser Mangel an Vertrauen ist eines der Haupthemmnisse in Bezug auf die häufige Verwendung automatisierter Aktionen.
Von diesen drei automatisierten Aktionen sehen wir das größte Interesse bei der dritten Kategorie. Die technischen Probleme bei der Handhabung dieser Aufgabe sind jedoch schwierig, sodass bis heute noch keine häufige Anwendung stattfindet.
Anmerkung 5Schulung für Citizen-Data-Scientists
Ein Citizen-Data-Scientist kann auf Basis seiner Interessen und mathematischen oder statistischen Fähigkeiten bestimmt werden oder sich freiwillig melden. Das Ziel dieser Schulung ist es nicht unbedingt, Ihre eigenen Algorithmen zu erstellen. Stattdessen sollte es darum gehen, die Ergebnisse probabilistischer Algorithmen besser zu verstehen und darauf vorbereitet zu sein, die Auswirkungen von Anwendungsfällen zu verstehen, die sich von der Verwendung unbeaufsichtigter Algorithmen hin zu solchen entwickeln, die überwachte Algorithmen für prädiktive und präskriptive Algorithmen verwenden.
Anmerkung 6Datenquellen für AIOps-Plattformen
Zu den Datenquellen für AIOps-Plattformen gehören:
-
API
-
Anwendungsprotokolle
-
CRM-Daten
-
Kundendaten
-
Ereignisse
-
Diagramm
-
ITSM
-
Metadaten
-
Kennzahlen
-
Sozial
-
Fehlerprotokollierung
-
Drahtgebunden
Leider limitiert die Beschränkung auf einen Datentyp immer auch die Einblicke in das Systemverhalten, unabhängig davon, wie groß ein gegebener Datensatz ist oder wie oft er aktualisiert wird. Moderne IT-Systeme – mit ihrer Modularität und ihrer Dynamik – erfordern einen multiperspektivischen Ansatz, um zu verstehen, was während ihrer Beobachtung passiert.
Anmerkung 7Übertragbarkeit
Sobald die Einführung von AIOps in einem Unternehmen mit funktionalen Modellen und Qualitätsergebnissen reift, wird ein Anbieterwechsel schwierig. Die Umstellung auf einen anderen Anbieter zur Replizierung vorhandener hochwertiger Dashboards wird Zeit brauchen, in der kein Nutzen durch direkte Kosteneinsparungen erzielt wird. Gartner hat beobachtet, dass in Unternehmen mit reiferen Einsätzen gerade aus diesem Grund bei Vertragsverlängerungen eine gewisse Zurückhaltung zu einem Anbieterwechsel besteht.
Der Bedarf an brauchbaren Alternativen als Herausforderung an die etablierten Unternehmen hat Fragen bezüglich der Portabilität der Algorithmen zwischen den Anbietern ausgelöst. Dieser Bedarf kommt aus sehr kleinen Bereichen, einigen wenigen reifen Unternehmen, in denen die Einführung von AIOps im Unternehmen inzwischen ausgereift ist. Der Markt ist immer noch in einer Phase starken Wachstums, und es wird mindestens ein paar Jahre dauern, bis wir einen steigenden Druck von Unternehmen auf die Portabilität und eine Reaktion der Anbieter als Differenzierungsmerkmal sehen werden.
Einige Anbieter bieten Transfer-Learning an, das sich noch im Anfangsstadium befindet. In seiner einfacheren Form wird den Endanwendern die Möglichkeit geboten, ein ausgewähltes Modell anhand von historischen Daten zu trainieren. Die Ergebnisse des Algorithmus werden mit Echtzeit-Ergebnissen verglichen. Sobald die Ergebnisse ein angemessenes Maß an Genauigkeit mit akzeptablen Fehlergrenzen aufweisen, kann der Endanwender denselben Algorithmus für die Analyse von Echtzeitdaten verwenden. Diese Funktion funktioniert am besten zwischen Vorproduktions- und Produktionsumgebungen oder zwischen der Edge- und der Rechenzentrumsumgebung. Die Entwicklung komplexerer Anwendungsfälle erfordert Reife und fortgeschrittene Fähigkeiten sowohl auf der Anbieter- als auch auf der Endbenutzerseite.