Gestion des incidents
From Wikipedia, the free encyclopedia

La gestion des incidents (GDI) est un processus de gestion du cycle de vie de tous les incidents. Elle s’assure que l'exploitation normale des services soit rétablie le plus rapidement possible et que l’impact sur le business soit réduit au minimum[1].
L’exploitation normale des services est définie dans l’accord sur les niveaux de service (SLA). Il décrit le service informatique, documente les cibles de niveau de service et spécifie les responsabilités du fournisseur de service informatique et du client[2].
La gestion des incidents est un processus inclus dans la démarche ITIL et ISO 20000.
Selon ITIL, l'objectif de la Gestion des Incidents est la suivante :
« Restaurer aussi vite que possible le fonctionnement normal des services et minimiser l’impact négatif sur les activités métiers et s’assurer ainsi que les meilleurs niveaux de qualité de service et de disponibilité sont maintenus[3]. »
Un Incident est défini par ITIL comme étant :
« Tout événement qui ne fait pas partie du fonctionnement standard d’un service et qui cause, ou peut causer, une interruption ou une diminution de la qualité de ce service. »
De façon générale, le terme Incident correspond à un dysfonctionnement signalé par un utilisateur[4]. Les incidents peuvent être classés en trois catégories : Logiciel, matériel et Requête de service. Il faut prendre en compte le fait que les requêtes de service ne sont pas toujours vues comme des incidents, mais plutôt comme des demandes de Changement (RFCs). Cependant, le traitement des pannes et le traitement des requêtes de services sont similaires, ce qui les inclut dans la définition et dans le cadre des processus de la gestion des incidents. Les incidents sont donc les événements qui peuvent entraîner des pertes ou des perturbations pour l’Organisation comme pour les services ou les fonctions au sein de l’entreprise. Si ces problèmes ne sont pas correctement résolus, cela pourrait engendrer une urgence ou une crise. Par conséquent, la gestion des incidents est le processus ayant pour but de limiter ces éléments nuisibles au bon fonctionnement de l’entreprise.
La gestion des incidents est habituellement suivie d’une analyse post-incident (on parle de post mortem de l'incident[5],[6]) dans laquelle on détermine comment il est apparu malgré les précautions et les contrôles mis en place. Cette analyse est normalement supervisée par les dirigeants des organisations. Le but de cette supervision est de pouvoir mettre en place des mesures de précaution pour éviter la réitération de l’incident. Les informations obtenues seront ensuite utilisées comme des feedbacks pour améliorer la politique de sécurité et/ou son implémentation au sein de l’organisation. Aux États-Unis, le système de gestion des incidents développé par le département de sécurité, intègre des pratiques efficaces dans une gestion de l’urgence à l’échelle nationale.
Sans une gestion des problèmes efficace, un incident peut perturber rapidement les opérations d’affaires, la sécurité informatique, les systèmes d’information, les employés, les relations clients et d’autres fonctions vitales.
Démarche ITIL
L'ITIL est un référentiel de bonnes pratiques destinées à améliorer la gestion des systèmes d’information. Son objectif est de fournir aux directions informatiques des outils et des documents leur permettant d'améliorer la qualité de leurs prestations, tout en répondant au mieux aux objectifs stratégiques de l'organisation.
Pour maintenir un haut niveau de performance, les organisations sont dans l’obligation de proposer à leurs clients des produits et des services compétitifs. Elles doivent donc être capables de s’adapter le plus vite possible au changement du climat économique et au climat du marché. Ainsi, tous ces produits et services proposés devraient permettre aux entreprises de se transformer et de se développer. La gestion des services ITIL supporte ces transformations à travers l’utilisation du «service cycle de vie» qui comprend cinq étapes :
- Service strategy
- Service design
- Service transition
- Service operation
- Continual service improvement
La gestion des incidents se situe au niveau du Service Operation(SO) dont l’objectif est de s’assurer que la gestion des technologies de l’information soit efficace et efficiente. Le Service Operation répond aux requêtes des utilisateurs, il résout les pannes de service, il répare les problèmes et il effectue les opérations de routine. Il est composé de cinq procédures :
- SO 4.1 : gestion des événements
- SO 4.2 : gestion des incidents
- SO 4.3 : exécution des requêtes
- SO 4.4 : gestion des problèmes
- SO 4.5 : gestion des accès
Processus de gestion des incidents (ITIL)
Processus de gestion des incidents, défini par l’ITIL
L’objectif de la gestion des incidents est de rétablir les services le plus vite possible sans en faire obligatoirement un système parfait. Si le service peut être rétabli plus rapidement par un contournement temporaire plutôt qu’en corrigeant les causes racines de l’incident alors la situation est acceptable. Après la restauration du service, la correction des causes racines est réalisée par l’équipe de gestion des problèmes lors d’un processus appelé l’analyse de causes racines. Un exemple de restauration de services par un contournement (workaround) temporaire est celui qui a été effectué dans Apollo 13.
La principale priorité de la gestion des incidents est de s’assurer de la restauration du système en supervisant et dirigeant les ressources internes et externes de l’entreprise. Une restauration prompte d’un système ainsi que la minimisation de tout impact pour l’utilisateur sont prioritaires sur une collection de données longue et intensive pour l’enquête des causes racines.
Il est possible d’améliorer le centre de gestion des incidents par la formation des techniciens. La formation peut leur permettre de prendre conscience de leur rôle auprès des utilisateurs. De plus, une mise à jour régulière de la base de données du service et de la base de gestion des configurations permet de recouper les informations sur les erreurs connues, leurs résolutions et leurs solutions de contournement. ITIL décompose la gestion des incidents en six éléments basiques :
- La détection et l’enregistrement des incidents ;
- La classification et l’aide initiale ;
- L’enquête et le diagnostic ;
- La résolution et la restauration ;
- La clôture de l’incident ;
- La propriété, le pilotage, le suivi et la communication (piloter la progression de la résolution de l’incident et garder à jour ceux qui sont affectés par l’incident).
Activités de la gestion des incidents, définies par l’ITIL V3
- Identification
- détecter ou rendre compte d’un incident ;
- Enregistrement
- les incidents sont enregistrés dans le système de gestion des incidents ;
- Classement
- les incidents sont classés par priorité ;
- Priorisation
- l’incident est classé par ordre de priorité, sur la base de son impact et de son urgence, pour une meilleure utilisation des ressources et du temps disponible par l’équipe de support ;
- Escalade
- l’équipe de support doit-elle obtenir de l’aide de la part d’un autre service ? Si oui, on engage une procédure de demande de service sinon, la résolution de l'incident s’effectue au niveau du support initial.
- Diagnostic
- révélation du symptôme complet de l’incident ;
- Résolution et rétablissement
- une fois que la solution est trouvée et que la correction est apportée alors l’incident est résolu ; La solution peut alors être ajoutée à la base des erreurs connues dans l'optique de résoudre plus rapidement un incident similaire dans le futur.
- Clôture de l’incident
- l’enregistrement de l’incident dans le système de gestion du management est clôturé en appliquant le statut « terminé » à celui-ci.
Avantages et difficultés de la mise en place de la gestion des incidents
Bénéfices
La mise en place de la gestion des incidents est bénéfique pour l’entreprise. En effet, elle va réduire l’impact des incidents sur les activités ce qui va améliorer leur performance. Ensuite, elle va apporter d’autres avantages pour la production informatique comme une détection et une résolution plus rapide afin d’éviter l’apparition de nouveaux incidents. De plus, cela permet une meilleure utilisation des ressources de l’entreprise en fonction des évènements qu’elles soient physiques, humaines ou immatérielles. La qualité de l’information sera améliorée grâce à la mise en place de base de données facilitant le traitement d’incidents. Pour finir, la mise en place de la gestion des incidents apportera une satisfaction améliorée des utilisateurs.
Difficultés à prévoir
La mise en place de la gestion des incidents au sein d’une entreprise peut rencontrer des barrières l’empêchant de bien s’implanter et donc de pouvoir agir efficacement au sein de celle-ci. La première barrière est la résistance au changement des employés de l’organisation. Cette résistance est naturelle et apparaît à chaque nouveauté dans une organisation. Cette résistance peut être plus ou moins forte selon la méthode d’implémentation au sein de l’entreprise. Dans le cas de la gestion des incidents cela peut entrainer une inutilisation du service en continuant d’utiliser l’ancienne méthode. La seconde barrière est le manque d’engagement des dirigeants qui vont donc accorder des fonds moindre pour ce service. Cela va entrainer une efficacité diminuée du service. La dernière barrière est plus spécifique aux PME et concerne l’utilisation des outils informatiques. Dans certaines de ces PME l’utilisation d’outil informatique se limite aux tableurs et ne permet donc pas l’application de la gestion des incidents. Cela est handicapant pour la PME qui n’a pas accès à des fonctions importantes qui pourraient améliorer son fonctionnement. Il faut savoir rester toutefois cohérent avec la taille de la structure et utiliser un système de gestion de l’incident raisonnable au vu de l’entreprise.
Distinction gestion des incidents et gestion des problèmes
La gestion des incidents et la gestion des problèmes sont deux processus (à ne pas confondre avec des procédures) différents faisant partie du Service Opération. La gestion des incidents correspond à un rétablissement du service interrompu. Dans ce cas, on effectue une action réactive à un incident déclaré au centre de support. La gestion des incidents est exécutée par les employés qui vont faire remonter les incidents le plus fréquemment par téléphone, email, ou portail Web. De son côté, la gestion des problèmes correspond à une démarche proactive. Cela signifie que l’on va, en plus de rechercher les causes des incidents, trouver des résolutions définitives pour éviter que ces incidents ne réapparaissent à l’avenir.
Pour mettre en œuvre un Service Opération, il est nécessaire d'implémenter en priorité le processus de gestion des incidents afin de mieux connaitre son environnement. Pour cela, il faut répartir les différents types d'incidents dans diverses catégories pour comprendre les causes des incidents et ainsi, trouver des résolutions définitives et appropriées.