samedi, juin 30, 2007

Découverte : Gestion de la qualité de service (Part 6)

Ce post et les suivants donnent les concepts de l'ASLM avec Oracle Enterprise Manager 10g Grid Control.


(Post précédent : tester les applications)


Les concepts
4.5
RCA (Root Cause Analysis)


Quand un problème survient, dégradation des performances ou arrêt de l’application par exemple, il est souvent difficile de trouver la ou les causes surtout quand l’architecture est complexe. Une architecture hautement disponible fait, par exemple, intervenir des serveurs HTTP, des serveurs Java, des bases de données ainsi que des composants tiers tels que des load-balancers, des firewalls et des baies de stockage.



Oracle Enterprise Manager 10g Grid Control apporte la solution avec son module de RCA (Root Cause Analysis) qui permet pour chaque service défini (cf chapitre précédent) de trouver la cause d’un incident dès que celui-ci se produit.

L’analyse des causes traite l’ensemble des composants de la chaîne applicative afin d’identifier celui ou ceux qui ont causé l’incident. L’administrateur dispose de l’information sans avoir à ce soucier d’analyser manuellement l’ensemble des logs des différents composants du système technique, tâche fastidieuse qui, généralement, ne permet pas de trouver le problème rapidement.L’administrateur peut visualiser le RCA via un tableau récapitulatif ou via la topologie.








Quand on parle de haute disponibilité, deux mesures sont primordiales:
  • Le temps moyen entre 2 pannes
  • Le temps moyen de réparation

Disponibilité = (Temps moyen entre 2 pannes / (Temps moyen entre 2 pannes + Temps de moyen réparation))

Le RCA entre dans un plan de mise en œuvre de solutions hautement disponibles car il permet de réduire le temps d’indisponibilité en offrant une identification extrêmement rapide de la cause du problème sans avoir à analyser l’ensemble des composants du système impliqués.

A suivre ...
(Post précédent :
tester les applications)