8 Supervisión de servicios

Resumen

La monitorización de servicios es una monitorización a nivel de negocio que se puede usar para obtener una visión general del árbol completo de servicios de la infraestructura de TI, identificar puntos débiles de la infraestructura, calcular el SLA de varios servicios de TI y consultar otra información a un nivel superior. La monitorización de servicios se centra en la disponibilidad general de un servicio en lugar de en detalles de bajo nivel, como la falta de espacio en disco, la alta carga del procesador, etc. La monitorización de servicios también proporciona funcionalidad para encontrar la causa raíz de un problema si un servicio no funciona como se espera.

La monitorización de servicios permite crear una representación jerárquica de los datos monitorizados.

Una estructura de servicios muy simple puede verse así:

Service
|
|-Workstations
| |
| |-Workstation1
| |
| |-Workstation2
|
|-Servers

Cada nodo de la estructura tiene el atributo status. El status se calcula y se propaga a los niveles superiores según el algoritmo seleccionado. El status de los nodos individuales se ve afectado por el status de los problemas asignados. La asignación de problemas se realiza mediante etiquetado.

Zabbix puede enviar notificaciones o ejecutar automáticamente un script en el server de Zabbix en caso de que se detecte un cambio de status del servicio. Es posible definir reglas flexibles para determinar si un servicio padre debe entrar en un 'Problem state' en función de los status de los servicios hijos. Los datos de problemas de los servicios pueden utilizarse entonces para calcular el SLA y enviar informes de SLA basados en el conjunto flexible de condiciones.

La monitorización de servicios se configura en el menú Services, que consta de las siguientes secciones:

La sección Services permite construir una jerarquía de la infraestructura monitorizada añadiendo servicios padre y, después, servicios hijo a los servicios padre.

Además de configurar el árbol de servicios, esta sección proporciona una visión general de toda la infraestructura y permite identificar rápidamente los problemas que provocaron un cambio de status del servicio.

En esta sección puede definir acuerdos de nivel de servicio y establecer objetivos de nivel de servicio para servicios específicos.

En esta sección puede ver los informes de SLA.

Service actions

También puede configurar actions de servicio.

Las actions de servicio son opcionales y permiten:

  • enviar una notificación de que un servicio está caído
  • ejecutar un comando remoto en un server de Zabbix cuando cambie el status de un servicio
  • enviar una notificación de recuperación cuando un servicio vuelva a estar operativo.

Véase también: