11 Mantenimiento

Resumen

Puede definir períodos de mantenimiento para hosts y grupos de hosts en Zabbix.

Además, es posible definir mantenimiento solo para un único trigger (o un subconjunto de triggers) especificando etiquetas de trigger. En este caso, el mantenimiento se activará solo para esos triggers; todos los demás triggers del host o del grupo de hosts no estarán en mantenimiento.

Hay dos tipos de mantenimiento: con recopilación de datos y sin recopilación de datos.

Durante un mantenimiento "con recopilación de datos", los triggers se procesan como de costumbre y los eventos se crean cuando es necesario. Sin embargo, las escaladas de problemas se pausan para hosts/triggers en mantenimiento si la opción Pause operations for suppressed problems está marcada en la configuración de la acción. En este caso, los pasos de escalada que pueden incluir el envío de notificaciones o comandos remotos se ignorarán mientras dure el período de mantenimiento. Tenga en cuenta que las operaciones de recuperación y actualización de problemas no se suprimen durante el mantenimiento, solo las escaladas.

Por ejemplo, si los pasos de escalada están programados a los 0, 30 y 60 minutos después del inicio de un problema, y hay un mantenimiento de media hora que dura desde los 10 hasta los 40 minutos después de que surge un problema real, los pasos dos y tres se ejecutarán media hora más tarde, es decir, a los 60 y 90 minutos (siempre que el problema siga existiendo). De forma similar, si un problema surge durante el mantenimiento, la escalada comenzará después del mantenimiento.

Para recibir normalmente las notificaciones de problemas durante el mantenimiento (sin retraso), debe desmarcar la opción Pause operations for suppressed problems en la configuración de la acción.

Si al menos un host (utilizado en la expresión del trigger) no está en modo de mantenimiento, Zabbix enviará una notificación de problema.

Zabbix server debe estar en ejecución durante el mantenimiento. Los mantenimientos se recalculan cada minuto o tan pronto como se recarga la caché de configuración si hay cambios en el período de mantenimiento.

Los procesos timer comprueban si el estado del host debe cambiar hacia/desde mantenimiento en el segundo 0 de cada minuto. Además, cada segundo el proceso timer comprueba si debe iniciarse/detenerse algún mantenimiento en función de si hay cambios en los [maintenance periods] después de la actualización de la configuración. Por lo tanto, la velocidad de inicio/detención de los períodos de mantenimiento depende del intervalo de update interval de la configuración (10 segundos de forma predeterminada). Tenga en cuenta que los cambios en el período de mantenimiento no incluyen los ajustes Active since/Active till. Además, si se añade un host/grupo de hosts a un período de mantenimiento activo existente, los cambios solo serán activados por el proceso timer al comienzo del siguiente minuto.

Tenga en cuenta que cuando un host entra en mantenimiento, los procesos timer de Zabbix server leerán todos los problemas abiertos para comprobar si es necesario suprimirlos. Esto puede afectar al rendimiento si hay muchos problemas abiertos. Zabbix server también leerá todos los problemas abiertos al iniciarse, incluso si no hay mantenimientos configurados en ese momento.

Tenga en cuenta que Zabbix server (o proxy) siempre recopila datos independientemente del tipo de mantenimiento (incluido el mantenimiento "sin datos"). Posteriormente, el server ignorará los datos si está configurado 'no data collection'.

Cuando finaliza un mantenimiento "sin datos", los triggers que usan la función nodata() no se activarán antes de la siguiente comprobación dentro del período que están comprobando.

Si se añade un item de log mientras un host está en mantenimiento y el mantenimiento finaliza, solo se recopilarán las nuevas entradas del archivo de log desde el final del mantenimiento.

Si se envía un valor con marca de tiempo para un host que está en un tipo de mantenimiento "sin datos" (por ejemplo, usando Zabbix sender), este valor se descartará; sin embargo, es posible enviar un valor con marca de tiempo para un período de mantenimiento expirado y será aceptado.

Si el usuario cambia el período de mantenimiento, los hosts, los grupos o las etiquetas, los cambios solo surtirán efecto después de la sincronización de la caché de configuración.

Configuración

Para configurar un período de mantenimiento:

  1. Vaya a: Recopilación de datos > Mantenimiento.
  2. Haga clic en Crear período de mantenimiento (o en el nombre de un período de mantenimiento existente).
  3. Introduzca los parámetros de mantenimiento en el formulario.

Todos los campos de entrada obligatorios están marcados con un asterisco rojo.

Parámetro Descripción
Name Nombre del período de mantenimiento.
Maintenance type Se pueden establecer dos tipos de mantenimiento:
Con recopilación de datos: el server recopilará datos durante el mantenimiento y los triggers se procesarán;
Sin recopilación de datos: el server no recopilará datos durante el mantenimiento.
Consulte Efecto de los períodos de mantenimiento para saber cómo afecta cada tipo al informe de disponibilidad.
Active since La fecha y hora a partir de las cuales la ejecución de los períodos de mantenimiento pasa a estar activa.
Nota: Establecer solo esta hora no activa un período de mantenimiento; los períodos de mantenimiento deben configurarse en Periods (véase más abajo).
Active till La fecha y hora en la que la ejecución de los períodos de mantenimiento deja de estar activa.
Periods Este bloque le permite definir los días y horas exactos en los que tiene lugar el mantenimiento. Al hacer clic en se abre una ventana emergente con un formulario flexible de Maintenance period en el que puede definir la programación del mantenimiento. Consulte Períodos de mantenimiento para ver una descripción detallada.
Host groups Seleccione los grupos de hosts para los que se activará el mantenimiento. El mantenimiento se activará para todos los hosts de los grupos de hosts especificados. Este campo tiene autocompletado, por lo que al empezar a escribir en él se mostrará una lista desplegable con todos los grupos de hosts disponibles.
Especificar un grupo de hosts padre selecciona implícitamente todos los grupos de hosts anidados. Por lo tanto, el mantenimiento también se activará en los hosts de los grupos anidados.
Hosts Seleccione los hosts para los que se activará el mantenimiento. Este campo tiene autocompletado, por lo que al empezar a escribir en él se mostrará una lista desplegable con todos los hosts disponibles.
Tags Especifique tags para suprimir problemas con tags coincidentes en los hosts en mantenimiento.
Se pueden establecer varias condiciones. La coincidencia del nombre de tag siempre distingue entre mayúsculas y minúsculas.

Hay dos operadores disponibles para cada condición:
Contiene: incluir los nombres de tag especificados cuando los valores de tag contengan la cadena introducida (coincidencia de subcadena, distingue entre mayúsculas y minúsculas);
Igual a: incluir los nombres y valores de tag especificados (distingue entre mayúsculas y minúsculas).

Hay dos tipos de cálculo para las condiciones:
And/Or: deben cumplirse todas las condiciones; las condiciones que tengan el mismo nombre de tag se agruparán mediante la condición Or;
Or: basta con que se cumpla una condición.

Los tags solo pueden especificarse si está seleccionado el modo With data collection.
Description Descripción del período de mantenimiento.
Períodos de mantenimiento

La ventana de período de mantenimiento sirve para programar un tiempo para un mantenimiento recurrente o único. El formulario es dinámico y los campos disponibles cambian según el Tipo de período seleccionado.

Tipo de período Descripción
Solo una vez Configurar un período de mantenimiento único:
Fecha - fecha y hora del período de mantenimiento;
Duración del período de mantenimiento - durante cuánto tiempo estará activo el mantenimiento.
Diario Configurar un período de mantenimiento diario:
Cada día(s) - frecuencia del mantenimiento (1 - (por defecto) cada día, 2 - cada dos días, etc.);
A las (hora:minuto) - hora del día en que comienza el mantenimiento;
Duración del período de mantenimiento - durante cuánto tiempo estará activo el mantenimiento.

Cuando el parámetro Cada día(s) es mayor que "1", el día de inicio es el día en que cae la hora de Activo desde. Ejemplos:
- si Activo desde está configurado en "2021-01-01 12:00", Cada día(s) está configurado en "2" y A las (hora:minuto) está configurado en "23:00", entonces el primer período de mantenimiento comenzará el 1 de enero a las 23:00, mientras que el segundo período de mantenimiento comenzará el 3 de enero a las 23:00;
- si Activo desde está configurado en "2021-01-01 12:00", Cada día(s) está configurado en "2" y A las (hora:minuto) está configurado en "01:00", entonces el primer período de mantenimiento comenzará el 3 de enero a la 01:00, mientras que el segundo período de mantenimiento comenzará el 5 de enero a la 01:00.
Semanal Configurar un período de mantenimiento semanal:
Cada semana(s) - frecuencia del mantenimiento (1 - (por defecto) cada semana, 2 - cada dos semanas, etc.);
Día de la semana - en qué día debe realizarse el mantenimiento;
A las (hora:minuto) - hora del día en que comienza el mantenimiento;
Duración del período de mantenimiento - durante cuánto tiempo estará activo el mantenimiento.

Cuando el parámetro Cada semana(s) es mayor que "1", la semana de inicio es la semana en la que cae la hora de Activo desde. Para ejemplos, consulte la descripción del parámetro Diario arriba.
Mensual Configurar un período de mantenimiento mensual:
Mes - seleccione todos los meses durante los cuales se realiza el mantenimiento regular;
Fecha: Día del mes - seleccione esta opción si el mantenimiento debe realizarse el mismo día de cada mes (por ejemplo, el primer día de cada mes), y luego seleccione el día requerido en el campo Día del mes que aparece;
Fecha: Día de la semana - seleccione esta opción si el mantenimiento debe realizarse solo en ciertos días (por ejemplo, cada primer lunes del mes), luego seleccione (en el desplegable) la semana requerida del mes (primera, segunda, tercera, cuarta o última), y luego marque las casillas de verificación para el/los día(s) de mantenimiento;
A las (hora:minuto) - hora del día en que comienza el mantenimiento;
Duración del período de mantenimiento - durante cuánto tiempo estará activo el mantenimiento.

Al crear un período de mantenimiento se utiliza la zona horaria del usuario que lo crea. Sin embargo, cuando se programan períodos de mantenimiento recurrentes (Diario, Semanal, Mensual), se utiliza la zona horaria del servidor Zabbix. Para garantizar un comportamiento predecible de los períodos de mantenimiento recurrentes, es necesario utilizar una zona horaria común para todas las partes de Zabbix.

Cuando termine, pulse Agregar para agregar el período de mantenimiento al bloque Períodos.

Tenga en cuenta que los cambios en el horario de verano (DST) no afectan a la duración del mantenimiento. Por ejemplo, digamos que tenemos configurado un mantenimiento de dos horas que suele empezar a las 01:00 y terminar a las 03:00:

  • si después de una hora de mantenimiento (a las 02:00) ocurre un cambio de horario de verano y la hora actual cambia de 02:00 a 03:00, el mantenimiento continuará durante una hora más (hasta las 04:00);
  • si después de dos horas de mantenimiento (a las 03:00) ocurre un cambio de horario de verano y la hora actual cambia de 03:00 a 02:00, el mantenimiento se detendrá porque han pasado dos horas;
  • si un período de mantenimiento comienza durante la hora omitida por un cambio de horario de verano, entonces el mantenimiento no comenzará.

Si un período de mantenimiento se establece en "1 día" (el período real del mantenimiento es de 24 horas, ya que Zabbix calcula los días en horas), comienza a las 00:00 y finaliza a las 00:00 del día siguiente:

  • el mantenimiento se detendrá a la 01:00 del día siguiente si la hora actual se adelanta una hora;
  • El mantenimiento se detendrá a las 23:00 de ese día si la hora actual se retrasa una hora.

Mostrar

Mostrar equipos en mantenimiento

Un icono de llave inglesa naranja junto al nombre del equipo indica que este equipo está en mantenimiento en:

  • Tableros
  • Supervisión > Problemas
  • Inventario > Equipos > Detalles del inventario del equipo
  • Recopilación de datos > Equipos (ver columna 'Estado')

Los detalles del mantenimiento se muestran cuando el puntero del ratón se sitúa sobre el icono.

Además, los equipos en mantenimiento obtienen un fondo naranja en Supervisión > Mapas.

Mostrar problemas suprimidos

Normalmente, los problemas de los equipos en mantenimiento se suprimen, es decir, no se muestran en la interfaz. Sin embargo, también es posible configurar que se muestren los problemas suprimidos, seleccionando la opción Mostrar problemas suprimidos en las siguientes ubicaciones:

  • Tableros (en la configuración de los widgets Equipos con problemas, Problemas, Problemas por severidad, Resumen de disparadores)
  • Supervisión > Problemas (en el filtro)
  • Supervisión > Mapas (en la configuración del mapa)
  • Notificaciones globales (en la configuración del perfil de usuario)

Cuando se muestran los problemas suprimidos, se muestra el siguiente icono: . Al pasar el ratón sobre el icono se muestran más detalles.

Cálculo de las colas durante el mantenimiento

Las colas mostradas en la interfaz de Zabbix (Administración > Cola) son calculadas por el servidor Zabbix. No incluyen los ítems en mantenimiento sin recolección de datos: la longitud de la cola es siempre cero para estos ítems, incluso cuando sus valores están retrasados. Los ítems retrasados en mantenimiento con recolección de datos aún se cuentan en la cola.

El proxy de Zabbix no es consciente de los periodos de mantenimiento porque no hay sincronización de la configuración de mantenimiento entre el servidor Zabbix y el proxy. Las comprobaciones internas calculadas en los proxies de Zabbix (por ejemplo, zabbix[queue,,] y zabbix[stats,,,queue,,]) informan de ítems retrasados independientemente del estado de mantenimiento en el servidor Zabbix.

Como resultado, pueden reportarse diferentes longitudes de cola para los mismos ítems en mantenimiento sin recolección de datos por la interfaz de Zabbix y por las comprobaciones internas en los proxies de Zabbix.