2 Correlación de eventos globales

Descripción general

La correlación de eventos globales permite llegar a todas las métricas monitoreadas por Zabbix y crear correlaciones.

Es posible correlacionar eventos creados por iniciadores completamente diferentes y aplicar las mismas operaciones a todos ellos. Creando reglas de correlación inteligentes, es posible salvarse a sí mismo de miles de notificaciones repetitivas y centrarse en las causas fundamentales de un ¡problema!

La correlación de eventos globales es un mecanismo poderoso que le permite desligarse de la lógica de problema y resolución basada en un iniciador. Asi que hasta ahora, un único evento problemático era creado por un iniciador y estábamos pendientes de ese mismo iniciador para la resolución del problema. No podríamos resolver un problema creado por un iniciador con otro iniciador. Pero con la correlación de eventos basada en el etiquetado de eventos, si podemos.

Por ejemplo, un iniciador de registro puede informar problemas de la aplicación, mientras que el iniciador de sondeo puede informar que la aplicación está en funcionamiento. Tomando ventaja de las etiquetas de eventos, puede etiquetar el iniciador de registro como Estado: Inactivo Entonces, en una regla de correlación global puede relacionar estos iniciadores y asignar una operación adecuada a esta correlación como el cierre de los eventos antiguos.

En otro uso, la correlación global puede identificar iniciadores similares y aplicarles la misma operación. ¿Qué pasaría si pudiéramos obtener un solo problema? informe por problema de puerto de red? No es necesario denunciarlos a todos. Eso también es posible con la correlación de eventos global.

La correlación de eventos globales se configura en reglas de correlación. Una regla de correlación define cómo se emparejan los nuevos eventos del problema con eventos de problema existentes y qué hacer en caso de coincidencia (cierre el nuevo evento, cierre de los eventos antiguos coincidentes generando los eventos OK correspondientes). Si un problema se cierra por correlación global, se informa en la columna Info de MonitoreoProblemas.

La configuración de reglas de correlación global está disponible solo para usuarios del nivel de superadministrador.

La correlación de eventos debe configurarse con mucho cuidado, ya que puede afectar negativamente el rendimiento del procesamiento de eventos o, si está mal configurado, cerrar más eventos de los previstos (en el peor de los casos incluso todos los eventos problemáticos podrían cerrarse).

Para configurar la correlación global de forma segura, tenga en cuenta los siguientes consejos importantes:

  • Reducir el alcance de la correlación. Establezca siempre una etiqueta única para el nuevo evento que está emparejado con eventos antiguos y usa la condición de correlación Nueva etiqueta de evento ;
  • Agregue una condición basada en el evento anterior al usar la operación Cerrar evento antiguo (o de lo contrario se podrían cerrar todos los problemas existentes);
  • Evite usar nombres de etiquetas comunes que pueden terminar siendo utilizados por diferentes configuraciones de correlación;
  • Mantenga un número de reglas de correlación limitado a las que realmente necesita.

Ver también: problemas conocidos.

Configuración

Para configurar reglas de correlación de eventos globalmente:

  • Vaya a Recopilación de datosCorrelación de eventos
  • Haga clic en Crear correlación a la derecha (o en el nombre de correlación para editar una regla existente)
  • Ingrese los parámetros de la regla de correlación en el formulario

correlation_rule.png

Todos los campos de entrada obligatorios están marcados con un asterisco rojo.

Parámetro Descripción
Nombre Nombre de regla de correlación única.
Tipo de cálculo Las siguientes opciones para calcular las condiciones están disponibles:
Y - se deben cumplir todas las condiciones
O - suficiente si se cumple una condición
** Y/O** - Y con diferentes tipos de condición y O con el mismo tipo de condición
Expresión personalizada: una fórmula de cálculo definida por el usuario para evaluar las condiciones de la acción. Debe incluir todas las condiciones (representadas como letras mayúsculas A, B, C, ...) y puede incluir espacios, tabulaciones, corchetes (), y (distingue entre mayúsculas y minúsculas), o (distingue entre mayúsculas y minúsculas). , no (distingue entre mayúsculas y minúsculas).
Condiciones Lista de condiciones. Consulte a continuación para obtener detalles sobre cómo configurar una condición.
Descripción Descripción de la regla de correlación.
Operaciones Marque la casilla de verificación de la operación a realizar cuando el evento esté correlacionado. Las siguientes operaciones están disponibles:
Cerrar eventos antiguos: cierra eventos antiguos cuando ocurre un evento nuevo. Agregue siempre una condición basada en el evento anterior cuando utilice la operación Cerrar eventos antiguos o se podrían cerrar todos los problemas existentes.
Cerrar nuevo evento: cierre el nuevo evento cuando suceda
Habilitado Si marca esta casilla de verificación, la regla de correlación estará habilitada.

Para configurar los detalles de una nueva condición, haga clic en en el bloque de Condiciones. Se abrirá una ventana emergente donde podrá editar los detalles de la condición.

Parámetro Descripción
Nueva condición Seleccione una condición para correlacionar eventos.
Tenga en cuenta que si no se especifica ninguna condición de evento anterior, todos los eventos antiguos pueden coincidir y cerrarse. De manera similar, si no se especifica ninguna condición de evento nuevo, todos los eventos nuevos pueden coincidir y cerrarse.
Las siguientes condiciones están disponibles:
Etiqueta de evento anterior: especifique la etiqueta de evento anterior para la coincidencia.
* *Nueva etiqueta de evento: especifique la nueva etiqueta de evento para hacer coincidir.
Nuevo grupo de anfitriones de eventos: especifique el nuevo grupo de anfitriones de eventos para hacer coincidir.
Par de etiquetas de eventos: especifique un nuevo evento etiqueta y etiqueta de evento anterior para hacer coincidir. En este caso habrá una coincidencia si los valores de las etiquetas en ambos eventos coinciden. La etiqueta nombres no necesita coincidir.
Esta opción es útil para hacer coincidir valores de tiempo de ejecución, que pueden no conocerse en el momento de la configuración (consulte también Ejemplo 1) .
Valor de etiqueta de evento anterior: especifique el nombre y el valor de la etiqueta de evento anterior para hacer coincidir, utilizando los siguientes operadores:
es igual a: tiene el valor de etiqueta de evento anterior
no es igual - no tiene el valor de etiqueta de evento anterior
contiene - tiene la cadena en el valor de etiqueta de evento anterior
no contiene - no tiene la cadena en el valor de etiqueta de evento anterior
Nuevo valor de etiqueta de evento**: especifique el nombre y el valor de la nueva etiqueta de evento para que coincida, utilizando los siguientes operadores:
es igual a: tiene el nuevo valor de etiqueta de evento
no es igual: no tiene el nuevo valor de etiqueta de evento
contiene - tiene la cadena en el nuevo valor de etiqueta de evento
no contiene - no tiene la cadena en el nuevo valor de etiqueta de evento

Debido a que es posible una mala configuración, cuando pueden ser creadas etiquetas de eventos similares para problemas no relacionados; revise los casos que se detallan a continuación

  • Las etiquetas reales y los valores de las etiquetas solo se vuelven visibles cuando se activa un iniciador. Si la expresión regular utilizada no es válida, se reemplaza silenciosamente. con una cadena *UNKNOWN*. Si se omite el evento de problema inicial con un valor de etiqueta *UNKNOWN*, pueden aparecer eventos OK posteriores con el mismo valor de etiqueta *UNKNOWN* que pueden cerrar eventos de problema que no deberían haber cerrado.
  • Si un usuario utiliza la macro {ITEM.VALUE} sin funciones de macro como valor de etiqueta, se aplica la limitación de 255 caracteres. Cuando los mensajes de registro son largos y los primeros 255 caracteres no son específicos, esto puede también dar como resultado etiquetas de eventos similares para problemas no relacionados.

Ejemplo

Detenga eventos de problemas repetitivos desde el mismo puerto de red.

Esta regla de correlación global correlacionará los problemas si Host y Los valores de etiqueta Puerto existen en el iniciador y son los mismos en el evento original y el nuevo.

La operación cerrará nuevos eventos de problemas en el mismo puerto de red, manteniendo abierto sólo el problema original.