Sommaire
Principales conclusions
-
L’utilisation des plateformes AIOps pour renforcer les fonctions informatiques telles que la corrélation et l’analyse des événements, la détection des anomalies, l’analyse des causes profondes et le traitement du langage naturel est en augmentation rapide. Cependant, l’application de l’AIOps aux fonctions telles que l’ITSM et les DevOps progresse à un rythme plus lent.
-
Les offres de plateformes AIOps sont divisées en deux approches : les solutions indépendantes du domaine et les solutions centrées sur le domaine.
-
Pour les entreprises qui adoptent les plateformes AIOps, celles-ci jouent le rôle de multiplicateur de force pour les outils de surveillance corrélés entre la surveillance des performances applicatives (APM), la surveillance de l’infrastructure informatique (ITIM), les outils de surveillance des performances du réseau et les outils de diagnostic, et à la surveillance des expériences numériques.
-
La maturité de la plateforme AIOps et des opérations, de même que les compétences informatiques constituent les principaux obstacles à un délai de rentabilisation rapide. Les autres défis émergents liés aux déploiements avancés comprennent la qualité des données et le manque de compétences en science des données au sein de l’I&O.
Recommandations
Les responsables I&O portés sur la gestion de l’infrastructure, des opérations et du cloud doivent :
-
Augmenter les chances de succès du déploiement d’une plateforme AIOps en se concentrant sur un cas d’utilisation spécifique et en adoptant une approche progressive qui commence par le remplacement de l’analytique des événements basée sur des règles et s’étend aux flux de travail centrés sur le domaine, comme les diagnostics réseau et les applications.
-
Gérer des cas d’utilisation spécifiques, en adoptant des fonctionnalités de plateforme AIOps centrées sur le domaine et intégrées dans un outil de surveillance ou une solution autonome indépendante du domaine – autant d’options qui ingèrent des événements, des indicateurs et des traces.
-
Favoriser l’automatisation des tâches, la gestion des connaissances et l’analyse du changement en sélectionnant une plateforme AIOps pouvant être appliquée à ces cas d’utilisation d’ITSM.
-
Permettre des informations continues sur la gestion des opérations informatiques (ITOM, pour IT Operations Management) en prenant en charge ces trois aspects des plateformes AIOps : observer, mobiliser et agir.
Hypothèse de planification stratégique
D’ici 2023, 40 % des équipes DevOps utiliseront l’intelligence artificielle afin de renforcer les outils de surveillance d’applications et d’infrastructures pour les capacités de plateforme des opérations informatiques (AIOps).
Définition du marché
Grâce à la combinaison du big data et de la fonctionnalité d’apprentissage machine pour analyser le volume, la diversité et la vélocité en croissance constante des données générées par l’informatique en réponse à la transformation numérique, les plateformes AIOps sont en mesure de répondre aux besoins des responsables I&O en matière de soutien des opérations. Un groupe identifiable de fournisseurs a ainsi émergé pour répondre aux exigences des entreprises pour cet aspect, bien qu’ils varient dans la priorité et l’architecture de la prise en charge de celles-ci.
Description du marché
Les plateformes AIOps améliorent un large éventail de processus d’opérations informatiques, notamment la détection des anomalies, la corrélation des événements et l’analyse des causes profondes (RCA, pour Root Cause Analysis), afin d’améliorer la surveillance, la gestion des services et les tâches d’automatisation.
Les fonctions centrales des plateformes AIOps comprennent :
-
L’ingestion de données provenant de sources multiples dont notamment l’infrastructure, les réseaux, les applications, le cloud ou les outils de surveillance existants (pour l’analyse interdomaine)
-
L’activation de l’analyse des données à l’aide de l’apprentissage machine sur deux points :
-
Le stockage et la fourniture d’un accès à ces données
-
La suggestion de réponses prescriptives à l’analyse
-
La mise en place d’une action ou d’une étape suivante, basée sur la prescription (résultat de l’analyse)
L’objectif de l’effort d’analytique est la découverte de modèles – clusters ou groupes qui se produisent naturellement dans les données utilisées afin de prédire les incidents potentiels et comportements émergents. Ces modèles sont utilisés afin de déterminer les causes profondes des problèmes actuels du système et piloter intelligemment l’automatisation pour les résoudre (voir la Figure 1).
Figure 1. Plateforme AIOps permettant la connaissance continue de l’ensemble de la surveillance des opérations informatiques (ITOM)
Orientation du marché
Gartner estime la taille du marché des plateformes AIOps entre 300 millions USD et 500 millions USD par an. Les technologies d’intelligence artificielle (IA), comme l’apprentissage machine, ont influencé l’évolution de l’ITOM de manière sporadique au cours des deux dernières décennies, et les plateformes AIOps n’en sont que l’exemple le plus récent. L’utilisation de l’IA dans les opérations informatiques a été motivée par l’adoption de la transformation numérique, et ce qui en résulte doit gérer les aspects suivants :
-
Croissance rapide des volumes de données générés par les systèmes informatiques, réseaux et applications
-
Augmentation de la variété des données, impliquant la nécessité d’analyser les événements, les indicateurs, les traces (transactions), les données filaires, les données de flux réseau, les données de télémétrie en continu, le ressenti du client et autres
-
La vitesse croissante de la génération des données, parallèlement à l’augmentation du rythme de changement au sein des architectures informatiques et aux défis en matière de maintien de l’observabilité et d’amélioration de l’engagement, compte tenu de l’adoption d’architectures cloud natives et éphémères
-
Le besoin d’automatiser de manière intelligente et souple les tâches récurrentes et de prévoir la réussite du changement et l’échec des SLA
Toute incapacité à gérer ces exigences de données peut s’avérer coûteuse compte tenu des connaissances requises dans tous les domaines de l’organisation. Les plateformes AIOps doivent donc être capables de prendre en charge la capacité à déployer progressivement les quatre étapes de la surveillance des opérations informatiques (voir la Figure 2).
Figure 2. Quatre étapes de la surveillance des opérations informatiques
Les responsables I&O commencent à se concentrer sur les cas d’utilisation de domaines dépassant largement la surveillance des opérations informatiques, dont notamment la gestion du service informatique (ITSM), la surveillance de l’expérience numérique (DEM, pour Digital Experience Monitoring) et les DevOps (voir la Note 2 et l’article « Améliorer la gestion des événements grâce aux techniques continues DevOps de surveillance et d’automatisation »). De plus, l’éventail des cas d’utilisation de plateforme AIOps couvre le cycle de vie des applications et des équipes (voir la Figure 3).
Figure 3. Application des plateformes AIOps à l’ensemble des cas d’utilisation tout au long du cycle de vie d’une application
La transformation numérique entraîne en outre un besoin accru de vitesse de l’informatique. Celle-ci stimule à son tour le besoin d’outils capables de fournir les capacités suivantes :
-
Réduction du bruit (tel que les fausses alarmes) grâce à des algorithmes de regroupement et de mise en correspondance des modèles
-
Détermination de la causalité, identification de la cause probable des incidents à l’aide de la topologie et de ML, et mise en relation de ces problèmes avec un parcours client, via des algorithmes tels que les arbres décisionnels, l’analyse des forêts d’arbres décisionnels et des graphiques
-
Saisie des anomalies multivariées dépassant les seuils statiques ou des valeurs numériques aberrantes, afin de détecter de manière proactive les conditions et comportements anormaux et les relier à l’impact commercial
-
Détection des tendances susceptibles de provoquer des pannes avant que leur impact ne soit ressenti
-
Favorisation de l’automatisation des tâches récurrentes présentant un risque faible à modéré
-
Amélioration de l’efficacité de l’utilisateur et de l’automatisation grâce à des chatbots et assistants virtuels (AV) de manière à démocratiser l’accès aux connaissances et automatiser les tâches récurrentes
-
Tri des problèmes, en favorisant leur hiérarchisation prioritaire, et propositions de mesures pouvant être prises pour les résoudre (directement ou via l’intégration basée sur les scénarios antérieurs)
Gartner prévoit que dans les cinq années à venir, les plateformes AIOps à large périmètre, indépendantes du domaine, et les outils AIOps, à faible périmètre, axés sur un domaine – tels que les suites ITIM, APM ou ITSM – constitueront les deux options de la fourniture d’une fonctionnalité AIOps (voir Note 3).
Lorsque la variété des sources de données dépasse le périmètre d’un outil centré sur le domaine, un outil à large périmètre sera nécessaire. Cela ne signifie pas nécessairement que l’outil centré sur le domaine ne sera pas utilisé. En effet, à mesure que l’apprentissage machine continue d’être intégré dans les outils de surveillance, la plateforme AIOps ressemblera davantage à un environnement fédéré. Dans cet environnement, l’IA sera utilisée au niveau du domaine, dans un outil centré sur le domaine. À mesure que les flux de données provenant de sources multiples deviennent disponibles, la production des outils de domaine sera envoyée à la plateforme AIOps à large périmètre et indépendante du domaine pour la corrélation interdomaine.
Le marché poursuit son évolution, et Gartner étudie la transformation des capacités AIOps dans diverses dimensions :
-
AIOps indépendante du domaine — Fournisseurs entrant sur le marché avec une plateforme AIOps généraliste. Ces produits ont tendance à s’appuyer essentiellement sur des outils de surveillance pour effectuer la saisie des données et répondre aux cas d’utilisation les plus larges.
-
AIOps centrée sur un domaine — Fournisseurs proposant les composants essentiels, mais avec un ensemble restreint de cas d’utilisation. Ils font essentiellement la même chose qu’auparavant, mais ils remplacent désormais les règles, l’heuristique et les empreintes digitales par les mathématiques (algorithmes). Ces fournisseurs se concentrent sur un seul domaine (par exemple, le réseau, les systèmes de terminaux ou l’APM). Des solutions axées sur le domaine ont toutefois consenti des efforts pour hybrider ces catégories et évoluer vers l’ingestion de données provenant d’autres sources que leurs propres outils d’instrumentation, et l’inclusion de ces données dans leur analyse.
-
Assemblage personnel — Certains projets open source permettent aux utilisateurs d’assembler leurs propres plateformes AIOps en offrant des outils pour les l’ingestion des données, une plateforme de big data, le ML et une couche de visualisation. Les utilisateurs finaux peuvent ainsi combiner et associer les composants de plusieurs fournisseurs. Quelques entreprises adoptent une approche active de la création des plateformes AIOps, en regroupant toutes les couches requises en commençant par la diffusion en continu pour acquérir des données (en utilisant Prometheus, par exemple), puis par l’agrégation (dans InfluxDB d’InfluxData, par exemple), puis par un outil de visualisation (tel que Grafana ou Elastic Kibana). Certains adeptes avancés des plateformes AIOps en DIY ont développé des solutions capables d’analyser le niveau de confiance de leurs déploiements, afin de mesurer les risques, de prévoir les pertes de clients, de détecter et de résoudre automatiquement les problèmes avant qu’ils n’aient un impact sur l’entreprise. Ces déploiements sont toutefois minoritaires compte tenu des compétences nécessaires pour les prendre en charge, et des exigences de maintenance et de support.
Analyse du marché
Aujourd’hui, rares sont les fournisseurs qui tiennent parfaitement la promesse des plateformes AIOps de fournir une vision instantanée de vastes volumes de données hautement volatiles. Malgré l’amélioration de l’architecture et de la plateforme, la technologie reste encore émergente et nécessite du temps et des efforts pour obtenir des résultats de qualité. Pour obtenir une image plus claire de l’évolution du marché et du positionnement des fournisseurs les uns par rapport aux autres, envisagez les capacités de plateforme AIOps suivantes :
Ingestion et gestion des données
Les plateformes AIOps doivent être capables d’ingérer les données au repos (historiques) et les données en mouvement (en temps réel, streaming). Ces plateformes permettent l’ingestion, l’indexation et le stockage des données d’événements, des données filaires, des indicateurs, des traces, ainsi que des données graphiques et de document. Ces outils pour les opérations informatiques doivent également analyser directement les données au point d’ingestion en temps réel, sans les enregistrer au préalable dans une base de données avant leur analyse. Ils doivent également fournir une analyse corrélée sur plusieurs flux de données historiques et en temps réel.
Analytique de l’apprentissage machine
Les types d’approches de l’analytique suivants sont utilisés :
-
Analyse statistique, probabiliste — Combinaison d’une analyse à mono et multivariables, y compris le recours à la corrélation, au regroupement, à la classification et à l’extrapolation sur les indicateurs saisis dans les différentes entités informatiques.
-
Découverte et prédiction automatisées des modèles — Découverte de modèles, clusters ou groupes décrivant implicitement les corrélations dans les données historiques et/ou de flux. Ces modèles peuvent ensuite être utilisés pour anticiper les incidents, avec des degrés de probabilité variables.
-
Détection d’anomalie — Utilisation des modèles découverts par les précédents composants, afin de déterminer un comportement normal, puis d’identifier les divergences par rapport à ce comportement normal, à la fois mono et multivariables. La détection des anomalies doit tenir compte de la saisonnalité, en déterminant si le comportement est anormal pendant une période appelée saison. Les plateformes AIOps doivent pouvoir détecter les saisons naturellement présentes dans les données et être en mesure d’apprendre lorsque ce comportement n’est plus anormal. Pour que cela soit utile, les algorithmes doivent de plus déterminer si l’anomalie a un impact ou non. Dans un déploiement à grande échelle, il y aura toujours des anomalies, et certaines seront bien plus importantes que d’autres. Pour être pleinement utiles et pas uniquement créer plus d’alertes, celles-ci doivent être corrélées avec leur impact potentiel sur l’entreprise et d’autres processus simultanés (tels que la diffusion de balises de métadonnées de gestion), et dépasser ainsi la seule détection des valeurs aberrantes.
-
Détermination des causes profondes — Élagage du réseau des corrélations définies par la découverte automatisée des modèles et l’ingestion des données graphiques, de manière à définir les chaînes de causalités reliant la cause et l’effet.
-
Analyse topologique — Pour les modèles que les plateformes AIOps détectent comme pertinents et exploitables, un contexte doit être donné autour des données ingérées. Ce contexte représente la topologie sous la forme de données graphiques. Sans le contexte et la contrainte de facto de la topologie, les modèles détectés, bien que valides, peuvent s’avérer inutiles et non pertinents. La dérivation de modèles à partir des données d’une topologie définira la pertinence et illustrera les dépendances cachées. L’utilisation de la topologie dans le cadre de la détermination de la causalité peut considérablement augmenter sa précision et son efficacité. La saisie du lieu de survenance des événements et de leurs dépendances en amont et en aval utilise l’analyse des graphiques et des goulots d’étranglement, ce qui permet de mieux comprendre où concentrer les efforts de remédiation.
-
Conseils prescriptifs — Suggestion de solutions afin de résoudre un problème. Ces suggestions peuvent se baser sur une base de données allant de solutions historiques (connaissances « tribales ») à des problèmes récurrents ou déterminées par la production participative (crowdsourcing).
Remédiation
Maintenant que la technologie arrive à maturité, les utilisateurs pourront tirer parti des conseils prescriptifs de la plateforme, ce qui permet d’activer la phase d’action (voir la Note 4). Les étapes de cette phase sont illustrées dans la Figure 4.
Figure 4. L’avenir de l’automatisation assistée par IA : tri et résolution des problèmes
Bien que fortement souhaité, le processus automatisé et en boucle fermée, baptisé « ITOM autopiloté », n’est encore qu’un vœu pieux. Au-delà de celles qui automatisent simplement un type de script « rebond du serveur » ou « ouvrir un ticket », rares sont les solutions prescriptives qui ont été effectivement observées dans les outils commerciaux. Les candidats probables pour les actions automatisées à partir d’outils prescriptifs sont ceux qui présentent un faible risque. Ce sont ceux qui provoquent relativement peu de dégâts en cas d’échec ou d’effets secondaires inattendus. En fonction de l’environnement, des actions prédéterminées telles qu’une mise à jour de correctif peuvent s’avérer efficaces, de même que des actions permettant d’optimiser la charge de travail, telles que le démarrage d’une machine virtuelle (VM) ou d’un conteneur supplémentaire.
Les voies vers l’AIOps
Les plateformes AIOps peuvent contribuer au processus de mobilisation de l’ITSM en utilisant l’AIOps pour stimuler intelligemment l’automatisation et améliorer l’efficacité globale, l’efficience et la réduction des erreurs des outils ITSM (voir la Note 3).
Utilisez l’AIOps pour :
-
Aider les agents du service d’assistance à attribuer, catégoriser et acheminer les tickets
-
Automatiser les tâches (par exemple, déploiement de logiciel, gestion des demandes de réinitialisation de mot de passe, mise à jour des clients VPN et révision du texte des e-mails pour initier des demandes)
-
Exploiter les données historiques, afin d’améliorer les performances et augmenter l’efficacité des agents
-
Une vision stratégique des activités telles que la gestion du changement, la prédiction du succès du changement, l’identification des conflits du changement, l’identification des contrats sur le point d’expirer, la détermination du meilleur moment pour corriger les actifs, etc.
-
L’analyse prédictive, afin de signaler les demandes et incidents relatifs à la violation d’un SLA
-
Utilisation du traitement du langage naturel (NLP, pour Natural Language Processing) pour alimenter les chatbots et les AV et décharger le bureau de service de la gestion des requêtes et tâches de base, telles que les réinitialisations de mot de passe, et afin de partager la base de connaissances avec les utilisateurs et de permettre l’automatisation des tâches
L’AIOps dans les DevOps
Afin d’évaluer et d’éviter respectivement le risque dans le code et les constructions, les organisations informatiques ont également commencé à explorer l’AIOps, dans un contexte de DevOps intégrées dans l’automatisation de la diffusion des applications. Cela exige l’ingestion de métadonnées, notamment de balises de gestion des versions, afin d’aider la catégorisation et la relation des nouvelles fonctions diffusées. Les DevOps utilisent également l’AIOps pour détecter les problèmes de sécurité potentiels.
Le NLP est largement adopté dans les outils d’ITSM, bien que certains fournisseurs d’APM ont commencé à inclure le NLP dans le cadre de leur capacité AIOps. L’objectif est de permettre des ChatOps plus flexibles, pour les équipes de DevOps, et d’offrir une meilleure interface aux données et à l’automatisation APM.
Fournisseurs représentatifs
Les fournisseurs énumérés dans ce guide du marché ne constituent pas une liste exhaustive. Cette section vise à fournir une meilleure compréhension du marché et ses offres.
Présentation du marché
Les fournisseurs de plateformes AIOps disposent d’une large gamme de capacités qui continue de se développer. Les fournisseurs varient dans leurs cas d’utilisation d’ingestion des données et cas d’utilisation prêts à l’emploi commercialisés avec une configuration minimale. Dans le Tableau 1, nous fournissons une liste représentative de fournisseurs commercialisant la fonctionnalité de plateforme AIOps sur un certain nombre de domaines (voir la Note 1).
Tableau 1. Fournisseurs représentatifs dans les plateformes AIOps
Fournisseurs
|
Domaine
|
Année de création
|
Siège social |
|
AIOps indépendante du domaine (DA)
|
|
|
|
|
|
DA
|
2014
|
États-Unis et Israël
|
|
|
DA
|
2012
|
États-Unis
|
|
|
DA, DC : L’ITSM
|
1980
|
États-Unis
|
|
|
DA
|
2008
|
Japon
|
|
|
DA, DC : APM
|
1974
|
États-Unis
|
|
|
DA
|
2011
|
États-Unis
|
|
|
DA
|
2015
|
États-Unis
|
|
|
DA, DC : ITIM, DA
|
2012
|
États-Unis
|
|
|
DA et solutions de marché vertical
|
1911
|
États-Unis
|
|
|
DA
|
1993
|
Royaume-Uni
|
|
|
DA
|
2014
|
États-Unis
|
|
|
DC : ITIM, SIEM (Production participative/Crowdsourcing)
|
2014
|
États-Unis et Israël
|
|
|
DA
|
2015
|
États-Unis
|
|
|
DA
|
2011
|
États-Unis
|
|
|
DA
|
2013
|
États-Unis
|
|
|
DA
|
2011
|
États-Unis
|
|
|
DA (DC : ITIM for SignalFx)
|
2003
|
États-Unis
|
|
|
DA (DC : ITIM pour SignalFx)
|
2015
|
États-Unis
|
|
|
DC : ITIM
|
2010
|
États-Unis
|
|
|
DA
|
2010
|
Israël
|
|
|
DA
|
2014
|
Inde
|
|
AIOps centrées sur un domaine (DC)
|
|
|
|
|
ITSM
|
|
|
|
|
|
DC : L’ITSM
|
2017
|
États-Unis
|
|
|
DC : L’ITSM
|
2016
|
États-Unis
|
|
|
DC : Gestion du changement
|
2007
|
États-Unis
|
|
|
DC : ITSM (AV)
|
1998
|
États-Unis
|
|
|
DC : ITSM, BAM
|
2012
|
États-Unis
|
|
|
DC : L’ITSM
|
2004
|
États-Unis
|
|
DevOps
|
|
|
|
|
|
DC : DevOps
|
2016
|
États-Unis
|
|
|
DC : Dév
|
2011
|
États-Unis
|
|
APM
|
|
|
|
|
|
DC : APM, NPMD
|
2008
|
États-Unis
|
|
|
DC : APM, NLP
|
2005
|
États-Unis
|
|
|
DC : APM, ITIM
|
2008
|
États-Unis
|
|
NPMD
|
|
|
|
|
|
DC : NPMD
|
2007
|
États-Unis
|
|
|
DC : NPMD
|
2014
|
États-Unis
|
|
|
DC : NPMD
|
2000
|
Irlande
|
|
ITIM
|
|
|
|
|
|
DC : ITIM, APM
|
2010
|
États-Unis
|
|
|
DC : ITIM
|
2014
|
États-Unis
|
|
|
DC : ITIM
|
2003
|
États-Unis
|
|
|
DC : ITIM
|
2008
|
États-Unis
|
|
|
DC : ITIM (Production participative/crowdsourcing)
|
2005
|
États-Unis
|
|
NPMD = network performance monitoring and diagnostics (surveillance et diagnostics des performances réseau) ; BAM = business activity monitoring (surveillance de l’activité commerciale)
|
Source : Gartner (novembre 2019)
Recommandations du marché
Adopter une approche progressive des AIOps
Lors de l’adoption des plateformes AIOps, commencez par des applications moins primordiales et appliquez les principes suivants :
Vérifiez que vos cas d’utilisation permettent l’amélioration des résultats commerciaux et que le résultat de la production de la plateforme AIOps consiste soit en une étape manuelle suivante, soit au lancement d’un script ou d’un livre d’exécution afin d’améliorer l’état actuel. Ces scripts et livres d’exécution doivent concerner des situations présentant un faible risque, tels que l’ouverture d’un ticket ou le lancement d’un conteneur supplémentaire.
Commencez à utiliser le NLP avec les chatbots pour l’exécution de tâches récurrentes et pour le partage à bas coût des connaissances avec les employés et les utilisateurs, et avec des assistants clients virtuels pour les engagements transactionnels avec les utilisateurs.
Commencez par le périmètre plus restreint d’un outil centré sur le domaine, doté de capacités AIOps intégrées. Le succès sera mesuré par le suivi de la diminution du nombre de fausses alarmes et de tickets non suivis d’action au niveau du bureau d’assistance, en évitant l’impact des anomalies détectées et en améliorant les performances. Faites progresser l’ingestion des événements dans les indicateurs pour un impact accru. Puis, commencez à ingérer des traces, en analysant tout dans le contexte de la topologie, des relations et de l’impact sur l’activité numérique.
Créez un programme pour commencer à former le personnel I&O sur la science des données (voir la Note 5).
Les cas d’utilisation auxquels les plateformes AIOps peuvent être appliquées dépendront de leur périmètre. Certains peuvent nécessiter plus de données que ce qui serait optimal, alors que d’autres peuvent exiger davantage de compétences en science des données que celles disponibles au sein de l’I&O.
Des opérations informatiques modernes exigent une visibilité sur les entités informatiques, l’élimination des silos, comprenant les applications, leurs relations, les interdépendances et les transformations passées afin d’obtenir une vision de l’état actuel du paysage informatique. La nature progressive de la maturité de déploiement et l’évolution des cas d’utilisation nécessitent une préparation à l’ingestion d’un large éventail de sources de données (voir la Note 6). Les responsables I&O doivent ensuite sélectionner des plateformes AIOps capables d’ingérer et de fournir un accès à un vaste ensemble de types de données historiques et de flux afin de prendre en charge les cas d’utilisation indépendants du domaine.
Choisissez des outils permettant d’augmenter progressivement la profondeur et l’étendue de l’analyse (voir la Figure 5).
Figure 5. Faites évoluer vos phases d’AIOps
Faites évoluer vos phases d’AIOps en :
-
Utilisant un outil logiciel commercial, afin de révéler les modèles qui organisent de gros volumes de données. Cela est très utile pour séparer les événements à faible entropie susceptibles de se terminer par de fausses alarmes de ceux nécessitant une attention immédiate.
-
Testant dans quelle mesure ces modèles permettent aux utilisateurs de prendre des mesures manuelles pour améliorer l’état. Déterminez si la saisie des modèles est significative en termes d’impact sur les résultats commerciaux essentiels.
-
Anticipant l’impact futur des événements et incidents.
-
Travaillant avec la fonctionnalité d’analyse des causes profondes soit au sein d’une plateforme AIOps centrée sur le domaine, soit en utilisant un outil AIOps indépendant du domaine sur les données de plusieurs domaines.
-
Utilisant l’AIOps avec l’ITSM, en commençant par des assistants/chatbots de support virtuel, l’analyse des tickets et en modifiant en dernier lieu l’analyse des risques.
Toutes les étapes de maturité des AIOps sont essentielles. Les entreprises doivent sélectionner des outils capables de prendre en charge le plus grand nombre de ces étapes possible et favorisant la portabilité entre les outils (voir la Note 7). Ces étapes doivent être utilisées de manière progressive, afin de garantir que le personnel des opérations informatiques puisse en tirer parti au fur et à mesure de leur apprentissage.
Principaux acronymes et termes du glossaire
| APM |
surveillance des performances applicatives (application performance monitoring)
|
| BAM |
surveillance de l’activité commerciale (business activity monitoring)
|
| DA |
indépendant du domaine (domain-agnostic)
|
| DC |
centré sur le domaine (domain-centric)
|
| ITIM |
surveillance de l’infrastructure informatique (IT infrastructure monitoring)
|
| ITOM |
gestion des opérations informatiques (IT operations management)
|
| ITSM |
surveillance des services informatiques (IT service monitoring)
|
| NLP |
traitement de langage naturel
|
| NPMD |
surveillance et diagnostics des performances réseau (network performance monitoring and diagnostics)
|
| SIEM |
gestion des informations et des événements de sécurité (security information and event management)
|
Matériel de référence
Une augmentation de plus de 25 % a été observée dans les demandes de renseignements entre les analystes de Gartner et les utilisateurs finaux au cours des 12 derniers mois, couvrant divers aspects de l’AIOps. Les sujets de ces questions comprenaient :
-
-
-
Nombreux cas d’utilisation de l’AIOps dans et hors du service informatique, afin de faciliter la visualisation, les décisions et le diagnostic
Sur les échanges concernant l’AIOps, 5 % étaient liés au cas d’utilisation des DevOps et 15 % à la corrélation des événements.
Note 1Sélection des fournisseurs représentatifs
Les fournisseurs mentionnés dans cette recherche ont été choisis comme échantillon, sur la base d’une ou deux des caractéristiques suivantes :
-
Solutions indépendantes du domaine, avec la possibilité d’ingérer des données à partir de sources multiples, y compris le streaming des données historiques et en temps réel.
-
Solutions centrées sur le domaine, le ML étant intégré à l’outil.
-
Différentes offres incluant des versions exclusives, open-source, gratuites et commercialisées, y compris un déploiement recoupant les options sur site et basées sur SaaS.
Note 2Extension des cas d’utilisation de l’AIOps
Jusqu’à aujourd’hui, la fonctionnalité AIOps a été essentiellement utilisée pour la prise en charge des processus opérationnels informatiques capables d’assurer la surveillance ou l’observation de l’infrastructure informatique, du comportement de l’application ou de l’expérience numérique. Presque toujours, les investissements dans la plateforme AIOps ont été justifiés sur la base de leur capacité à réduire le délai moyen de résolution des problèmes et de la diminution des coûts en résultant. Ils ont également été justifiés, qu’ils incluent ou non l’utilisation de l’apprentissage machine pour :
-
Réduire les volumes d’événements et les fausses alarmes.
-
Détecter des valeurs anormales dans les données de séries temporelles.
-
Effectuer une analyse des causes profondes en utilisant les instruments de type bytecode ou les données de traçage distribué parallèlement à l’analyse des graphiques dans un contexte d’APM.
Cette situation évolue toutefois afin de satisfaire également d’autres types de cas d’utilisation.
AIOps est en effet utilisée dans la surveillance de l’expérience numérique afin d’améliorer la productivité des employés grâce au recours aux chatbots afin de fournir des réponses sans friction aux problèmes auxquels les employés peuvent être confrontés.
Dans certains cas, les équipes de la sécurité et des opérations informatiques explorent les opportunités d’exploiter une plateforme commune. À mesure que les plateformes AIOps progressent en maturité, elles seront utilisées pour accepter des cas d’utilisation nécessitant une corrélation entre les opérations informatiques et de sécurité.
Les groupes non informatiques, tels que les propriétaires de lignes d’activité et les équipes qui extérieures aux opérations informatiques (comme les développeurs d’applications et DevOps), se tournent de plus en plus vers les technologies AIOps pour faire émerger les connaissances d’une multitude d’ensembles de données.
Depuis janvier 2019, les clients de Gartner expriment leur intérêt croissant pour la conception de tableaux de bord affichant une analyse en temps réel de la satisfaction client, du parcours client, du processus de commande et de la santé commerciale. Dans ce cas, l’objectif est de présenter aux propriétaires de ligne d’activité des informations en temps réel relatives à l’impact du service informatique sur l’activité, de les tenir informés et de leur permettre de prendre des décisions basées sur des données pertinentes.
Note 3AITSM
L’AITSM n’est pas un acronyme. Il s’agit d’un terme qui fait référence à l’application de contexte, d’assistance, d’actions et d’interfaces d’IA, d’automatisation et de big data aux outils et pratiques d’ITSM de manière à améliorer l’efficacité, l’efficience et la réduction générales des erreurs pour le personnel I&O. L’AITSM est essentiel pour les cas d’utilisation intermédiaires et avancés afin d’automatiser et prendre en charge des environnements complexes.
Note 4Défis de l’automatisation des actions basées sur des conseils prescriptifs
Les actions automatisées relèvent de plusieurs catégories :
-
Les tâches de nature prédéterminée pouvant être planifiées largement à l’avance (par exemple, gestion des correctifs ou déploiement de nouvelles constructions)
-
Les tâches qui ne peuvent pas être planifiées largement à l’avance, mais qui sont dotées de déclencheurs connus qui peuvent ou non revenir fréquemment. Dans ce cas, les procédures sont bien documentées (par exemple, optimisation de la charge de travail dans un environnement virtualisé).
-
Les tâches dotées de déclencheurs imprévisibles lorsque les actions sont bien connues, mais non bien documentées (par exemple, anomalies connues).
Les responsables I&O ne veulent généralement pas laisser l’action entièrement aux machines et exigent au moins une étape de validation avant de déclencher une automatisation. Ce manque de confiance constitue l’un des principaux obstacles empêchant l’utilisation courante d’actions automatisées.
Note 5Formation des scientifiques de données citoyens
Un scientifique de données citoyen peut être désigné ou « volontaire », en fonction de son intérêt et de ses compétences mathématiques ou statistiques. L’objectif de cette formation n’est pas nécessairement de créer vos propres algorithmes. Il s’agit plutôt de mieux comprendre les résultats des algorithmes probabilistes et d’être prêt à comprendre les implications de l’évolution des cas d’utilisation, qui passent de l’utilisation d’algorithmes non supervisés à celle d’algorithmes supervisés pour des solutions plus prédictives et prescriptives.
Note 6Sources de données des plateformes AIOps
Les sources de données pour les plateformes AIOps comprennent :
Malheureusement, quelle que soit l’ampleur ou la fréquence de mise à jour d’un ensemble de données spécifique, la restriction à une seule source de données a tendance à limiter les connaissances sur le comportement d’un système. Les systèmes informatiques modernes, par leur modularité et leur dynamisme, nécessitent une approche plurielle, même lorsqu’il s’agit de comprendre ce qui se produit lorsqu’ils sont observés.
Note 7Portabilité
À mesure que l’adoption de l’AIOps par une entreprise gagne en maturité avec des modèles fonctionnels et des résultats de qualité, changer de fournisseur devient difficile. Passer à un autre fournisseur afin de répliquer les tableaux de bord de haute qualité existants prendra du temps, ce qui élimine toute valeur obtenue par les économies de coûts directes. Gartner a ainsi observé au sein des entreprises ayant des déploiements plus matures une réticence à changer de fournisseur lors du renouvellement de contrat, précisément pour cette raison.
La nécessité d’options viables afin de mettre en question les fournisseurs existants a suscité un questionnement sur la portabilité des algorithmes entre les fournisseurs. Ce besoin provient de très petites poches, de quelques entreprises matures, dans lesquelles l’adoption de l’AIOps a évolué au sein de l’entreprise. Le marché est toujours dans une phase de croissance élevée, et cette tendance se poursuivra pendant au moins quelques années avant que nous ne constations une pression croissante des entreprises en faveur de la portabilité et la réponse des fournisseurs comme facteur de différenciation.
Certains fournisseurs proposent un apprentissage de transfert, qui n’en est qu’à ses prémices. Sous sa forme simplifiée, les utilisateurs finaux ont une option de formation sur un modèle sélectionné en utilisant des données historiques. Les résultats de l’algorithme sont comparés aux résultats en temps réel. Lorsque les résultats montrent un degré de précision correct avec des marges d’erreur acceptables, l’utilisateur final peut utiliser le même algorithme pour analyser les données en temps réel. Cette capacité fonctionne mieux entre les environnements de préproduction et de production, ou entre les environnements de centre de données et de périphérie. L’évolution de cas d’utilisation plus complexes exigera une maturité et des compétences avancées tant au niveau du fournisseur que de l’utilisateur final.