Qu'est-ce que la supervision ?

picto supervision

La supervision a pour but de vérifier l'ensemble des infrastructures 7j/7 24h/24 afin de déceler au plus vite non seulement toute panne mais aussi et surtout leurs causes exactes ainsi que de les prévenir.


Téléchargements

Fiches solutions

Les technologies

  • Nagios : la solution libre de supervision numéro 1
  • Cacti
  • SNMP
  • Développement de scripts ou plug-ins pour les applications métiers ou très spécifiques

Les différentes solutions de supervision

Il existe plusieurs niveaux de supervision, selon la granularité souhaitée :


La supervision réseau

La supervision réseau est la brique de base indispensable à toute bonne solution. Cela consiste à vérifier que chaque switch, chaque routeur voir même chaque serveur est bien joignable. Le test de base est un simple test de ping pour vérifier la disponibilité de l'équipement sur le réseau. Dès qu'un routeur tombe par exemple, l'outil de supervision va immédiatement s'en rendre compte et signaler la panne. Les cartes dynamiques créées par l'outil montrent alors de façon claire l'ensemble des équipements qui se retrouvent alors isolés tout en indiquant de façon précise l'équipement en défaut, à savoir le routeur.

Cette solution permet d'identifier rapidement le matériel en cause et ainsi de supprimer les fausses alertes.


La supervision système

La supervision système ou supervision de serveur est une granularité plus fine que la supervision réseau. Celle-ci, en plus de vérifier si les matériels sont joignables, va vérifier qu'ils sont en bonne santé. Le minimum qui est habituellement testé sur chaque équipement est la mémoire, la charge CPU et l'espace disque. Cela peut se faire en installant des agents sur les serveurs ou en utilisant des protocoles spécifiques comme le protocole SNMP. Il est alors possible de vérifier par exemple le débit et le nombre d'erreur sur chaque port d'un switch, de vérifier que l'antivirus est bien à jour, etc. Il est aussi possible de vérifier les services accessibles via le réseau en utilisant des agents de contrôle. On peut ainsi par exemple vérifier, en interrogeant ces services, qu'un serveur DNS, un serveur de messagerie (SMTP, POP3), un serveur Web ou tout autre service réseau fonctionne correctement.

Cette solution permet d'identifier rapidement le composant en cause et ainsi de pouvoir anticiper la majorité des problèmes comme un disque plein sur un serveur par exemple.


La supervision applicative

Les responsables dans les entreprises ne sont pas intéressés de savoir si l'espace disque de tel serveur est OK ou non, ce qui les intéresse est d'être sûr que l'application métier fonctionne correctement, que les clients peuvent passer des commandes, ou recevoir ce qu'ils ont commandé, etc. La supervision applicative consiste donc à vérifier l'ensemble du workflow nécessaire au bon fonctionnement des services fournis par une entreprise à ses clients. Pour cela, il est généralement prévu des scenarii de test pour vérifier qu'une application fonctionne de bout en bout. Ces solutions sont généralement aussi spécifique que l'application à tester.

Cette solution permet de contrôler des applications critiques dépendantes de nombreux services y compris dans des environnements plus complexes contenant par exemple des clusters.