11 Mantenimiento

Resumen

Puede definir períodos de mantenimiento para hosts y grupos de hosts en Zabbix.

Además, es posible definir mantenimiento solo para un único trigger (o un subconjunto de triggers) especificando etiquetas de trigger. En este caso, el mantenimiento se activará solo para esos triggers; todos los demás triggers del host o grupo de hosts no estarán en mantenimiento.

Hay dos tipos de mantenimiento: con recopilación de datos y sin recopilación de datos.

Durante un mantenimiento "con recopilación de datos", los triggers se procesan como de costumbre y los eventos se crean cuando es necesario. Sin embargo, las escaladas de problemas se pausan para hosts/triggers en mantenimiento, si la opción Pause operations for suppressed problems está marcada en la configuración de acciones. En este caso, los pasos de escalada que pueden incluir el envío de notificaciones o comandos remotos se ignorarán mientras dure el período de mantenimiento. Tenga en cuenta que las operaciones de recuperación y actualización de problemas no se suprimen durante el mantenimiento, solo las escaladas.

Por ejemplo, si los pasos de escalada están programados a los 0, 30 y 60 minutos después del inicio de un problema, y hay un mantenimiento de media hora que dura desde los 10 hasta los 40 minutos después de que surge un problema real, los pasos dos y tres se ejecutarán media hora más tarde, es decir, a los 60 y 90 minutos (siempre que el problema siga existiendo). Del mismo modo, si un problema surge durante el mantenimiento, la escalada comenzará después del mantenimiento.

Para recibir notificaciones de problemas durante el mantenimiento de forma normal (sin retraso), debe desmarcar la opción Pause operations for suppressed problems en la configuración de acciones.

Si al menos un host (utilizado en la expresión del trigger) no está en modo de mantenimiento, Zabbix enviará una notificación de problema.

El Zabbix server debe estar en ejecución durante el mantenimiento. Los mantenimientos se recalculan cada minuto o tan pronto como se recarga la caché de configuración si hay cambios en el período de mantenimiento.

Los procesos timer comprueban si el estado del host debe cambiar a/desde mantenimiento en el segundo 0 de cada minuto. Además, cada segundo el proceso timer comprueba si debe iniciarse/detenerse algún mantenimiento en función de si hay cambios en los [períodos de mantenimiento] después de la actualización de la configuración. Por lo tanto, la velocidad de inicio/detención de los períodos de mantenimiento depende del intervalo de actualización de la configuración (10 segundos por defecto). Tenga en cuenta que los cambios en el período de mantenimiento no incluyen la configuración Active since/Active till. Además, si se añade un host/grupo de hosts a un período de mantenimiento activo existente, los cambios solo serán activados por el proceso timer al comienzo del siguiente minuto.

Tenga en cuenta que cuando un host entra en mantenimiento, los procesos timer de Zabbix server leerán todos los problemas abiertos para comprobar si es necesario suprimirlos. Esto puede afectar al rendimiento si hay muchos problemas abiertos. Zabbix server también leerá todos los problemas abiertos al iniciarse, incluso si en ese momento no hay mantenimientos configurados.

Tenga en cuenta que el Zabbix server (o proxy) siempre recopila datos independientemente del tipo de mantenimiento (incluido el mantenimiento "sin datos"). Posteriormente, el server ignorará los datos si está configurada la opción "sin recopilación de datos".

Cuando finaliza un mantenimiento "sin datos", los triggers que usan la función nodata() no se activarán antes de la siguiente comprobación dentro del período que están comprobando.

Si se añade un item de log mientras un host está en mantenimiento y el mantenimiento finaliza, solo se recopilarán las nuevas entradas del archivo de log desde el final del mantenimiento.

Si se envía un valor con marca de tiempo para un host que está en un tipo de mantenimiento "sin datos" (por ejemplo, usando Zabbix sender), este valor se descartará; sin embargo, es posible enviar un valor con marca de tiempo para un período de mantenimiento expirado y será aceptado.

Si el período de mantenimiento, los hosts, los grupos o las etiquetas son modificados por el usuario, los cambios solo surtirán efecto después de la sincronización de la caché de configuración.

Configuración

Para configurar un período de mantenimiento:

  1. Vaya a: Recopilación de datos > Mantenimiento.
  2. Haga clic en Crear período de mantenimiento (o en el nombre de un período de mantenimiento existente).
  3. Introduzca los parámetros de mantenimiento en el formulario.

Todos los campos de entrada obligatorios están marcados con un asterisco rojo.

Parámetro Descripción
Name Nombre del período de mantenimiento.
Maintenance type Se pueden establecer dos tipos de mantenimiento:
With data collection: el server recopilará datos durante el mantenimiento y los triggers se procesarán;
No data collection: el server no recopilará datos durante el mantenimiento.
Consulte Efecto de los períodos de mantenimiento para saber cómo afecta cada tipo al informe de disponibilidad.
Active since La fecha y hora a partir de las cuales la ejecución de los períodos de mantenimiento pasa a estar activa.
Nota: Configurar solo esta hora no activa un período de mantenimiento; los períodos de mantenimiento deben configurarse en Periods (véase más abajo).
Active till La fecha y hora en la que la ejecución de los períodos de mantenimiento deja de estar activa.
Periods Este bloque le permite definir los días y horas exactos en los que tiene lugar el mantenimiento. Al hacer clic en se abre una ventana emergente con un formulario flexible de Maintenance period en el que puede definir la programación del mantenimiento. Consulte Períodos de mantenimiento para ver una descripción detallada.
Host groups Seleccione los grupos de hosts para los que se activará el mantenimiento. El mantenimiento se activará para todos los hosts de los grupos de hosts especificados. Este campo tiene autocompletado, por lo que al empezar a escribir en él se mostrará una lista desplegable con todos los grupos de hosts disponibles.
Al especificar un grupo de hosts padre, se seleccionan implícitamente todos los grupos de hosts anidados. Por lo tanto, el mantenimiento también se activará en los hosts de los grupos anidados.
Hosts Seleccione los hosts para los que se activará el mantenimiento. Este campo tiene autocompletado, por lo que al empezar a escribir en él se mostrará una lista desplegable con todos los hosts disponibles.
Tags Especifique tags para suprimir problemas con tags coincidentes en los hosts en mantenimiento.
Se pueden establecer varias condiciones. La coincidencia del nombre del tag siempre distingue entre mayúsculas y minúsculas.

Hay dos operadores disponibles para cada condición:
Contains: incluir los nombres de tag especificados cuando los valores del tag contengan la cadena introducida (coincidencia de subcadena, distingue entre mayúsculas y minúsculas);
Equals: incluir los nombres y valores de tag especificados (distingue entre mayúsculas y minúsculas).

Hay dos tipos de cálculo para las condiciones:
And/Or: deben cumplirse todas las condiciones; las condiciones que tengan el mismo nombre de tag se agruparán mediante la condición Or;
Or: basta con que se cumpla una condición.

Los tags solo pueden especificarse si está seleccionado el modo With data collection.
Description Descripción del período de mantenimiento.
Períodos de mantenimiento

La ventana del período de mantenimiento es para programar el tiempo para un período recurrente o un mantenimiento único. El formulario es dinámico con campos disponibles. que pueden variar según el Tipo de período seleccionado.

Tipo de período Descripción
Solo una vez Configure un período de mantenimiento único:
Fecha - fecha y hora del período de mantenimiento;
Duración del período de mantenimiento - durante cuánto tiempo estará activo el mantenimiento.
Diario Configure un período de mantenimiento diario:
Cada día(s) - frecuencia de mantenimiento (1 - (predeterminado) todos los días, 2 - cada dos días, etc.);
A las (hora:minuto) - hora del día en que comienza el mantenimiento;
Duración del período de mantenimiento - durante cuánto tiempo estará activo el mantenimiento.

Cuándo el parámetro Cada día(s) es mayor que "1", el día de inicio es el día en el que cae la hora Activo desde. Ejemplos:
- si Activo desde está configurado en "2021-01-01 12:00", Todos los días está configurado en "2" y A las (hora:minuto) está configurado a "23:00", el primer período de mantenimiento comenzará el 1 de enero a las 23:00, mientras que el segundo período de mantenimiento comenzará el 3 de enero a las 23:00;
- si Activo desde está configurado en " 2021-01-01 12:00", Todos los días está configurado en "2" y A las (hora:minuto) está configurado en "01:00", luego el primer período de mantenimiento comenzará el 3 de enero a las 01:00 horas, mientras que el segundo periodo de mantenimiento comenzará el 5 de enero a las 01:00 horas.
Semanal Configure un período de mantenimiento semanal:
Cada semana - frecuencia de mantenimiento (1 - (predeterminado) cada semana, 2 - cada dos semanas, etc.);
Día de la semana - en qué día debe realizarse el mantenimiento;
A las (hora:minuto) - hora del día en que comienza el mantenimiento;
Duración del período de mantenimiento - durante cuánto tiempo estará activo el mantenimiento .

Cuando el parámetro Cada semana(s) es mayor que "1", la semana de inicio es la semana en la que cae el tiempo Activo desde. Para ver ejemplos, consulte la descripción del parámetro Diario arriba.
Mensual Configure un período de mantenimiento mensual:
Mes: seleccione todos los meses durante los cuales se realiza el mantenimiento regular;
Fecha: Día del mes: seleccione esta opción si el mantenimiento debe realizarse en la misma fecha cada mes (por ejemplo, cada primer día del mes) y luego seleccione el día requerido en el campo Día del mes que aparece;
Fecha: Día de la semana - seleccione esta opción si el mantenimiento debe realizarse solo en ciertos días (por ejemplo, cada primer lunes del mes), luego seleccione (en el menú desplegable) la semana requerida del mes (primera, segunda, tercera , cuarto o último), y luego marque las casillas de verificación para los días de mantenimiento;
A las (hora:minuto) - hora del día en que comienza el mantenimiento;
Duración del período de mantenimiento - para cómo cuánto tiempo estará activo el mantenimiento.

Al crear un período de mantenimiento se utiliza la zona horaria del usuario que lo crea. Sin embargo, cuando se programan períodos de mantenimiento recurrentes (Diario, Semanal, Mensual), se utiliza la zona horaria del servidor Zabbix. Para garantizar un comportamiento predecible de los períodos de mantenimiento recurrentes, es necesario utilizar una zona horaria común para todas las partes de Zabbix.

Cuando termine, pulse Agregar para agregar el período de mantenimiento al bloque Períodos.

Tenga en cuenta que los cambios en el horario de verano (DST) no afectan a la duración del mantenimiento. Por ejemplo, digamos que tenemos configurado un mantenimiento de dos horas que suele empezar a las 01:00 y terminar a las 03:00:

  • si después de una hora de mantenimiento (a las 02:00) ocurre un cambio de horario de verano y la hora actual cambia de 02:00 a 03:00, el mantenimiento continuará durante una hora más (hasta las 04:00);
  • si después de dos horas de mantenimiento (a las 03:00) ocurre un cambio de horario de verano y la hora actual cambia de 03:00 a 02:00, el mantenimiento se detendrá porque han pasado dos horas;
  • si un período de mantenimiento comienza durante la hora omitida por un cambio de horario de verano, entonces el mantenimiento no comenzará.

Si un período de mantenimiento se establece en "1 día" (el período real del mantenimiento es de 24 horas, ya que Zabbix calcula los días en horas), comienza a las 00:00 y finaliza a las 00:00 del día siguiente:

  • el mantenimiento se detendrá a la 01:00 del día siguiente si la hora actual se adelanta una hora;
  • El mantenimiento se detendrá a las 23:00 de ese día si la hora actual se retrasa una hora.

Mostrar

Mostrando equipos en mantenimiento

Un icono de llave naranja junto al nombre del equipo indica que este equipo está en mantenimiento en:

  • Tableros
  • Monitoreo → Problemas
  • Inventario → Equipos → Detalles del inventario de equipos
  • Recopilación de datos → Equipos (Ver columna 'Estado')

Los detalles de mantenimiento se muestran cuando se coloca el puntero del ratón sobre el icono.

Además, los equipos en mantenimiento obtienen un fondo naranja en Monitoreo → Mapas.

Mostrando problemas suprimidos

Normalmente se suprimen los problemas de los equipos en mantenimiento, es decir, no mostrandolos en la interfaz. Sin embargo, también es posible configurar que se muestren los problemas suprimidos, seleccionando la opción Mostrar problemas suprimidos en estas ubicaciones:

  • Tableros (en Problemas de equipos, Problemas, Problemas por gravedad, Resumebnde iniciadores configuración del widget)
  • MonitoreoProblemas (en el filtro)
  • MonitoreoMapas (en configuración de mapas)
  • Notificaciones globales (en la configuración del perfil de usuario)

Cuando se muestran problemas suprimidos, se muestra el siguiente icono: . Desplazando el cursor del ratón sobre el icono se muestran más detalles.

Cálculo de las colas durante el mantenimiento

Las colas mostradas en la interfaz de Zabbix (Administración > Cola) son calculadas por el servidor Zabbix. No incluyen las métricas en mantenimiento sin recolección de datos: la longitud de la cola siempre es cero para estas métricas, incluso cuando sus valores están retrasados. Las métricas retrasadas en mantenimiento con recolección de datos aún se cuentan en la cola.

El proxy de Zabbix no es consciente de los periodos de mantenimiento porque no hay sincronización de la configuración de mantenimiento entre el servidor Zabbix y el proxy. Las comprobaciones internas calculadas en los proxies de Zabbix (por ejemplo, zabbix[queue,,] y zabbix[stats,,,queue,,]) informan de métricas retrasadas independientemente del estado de mantenimiento en el servidor Zabbix.

Como resultado, pueden reportarse diferentes longitudes de cola para las mismas métricas en mantenimiento sin recolección de datos por la interfaz de Zabbix y por las comprobaciones internas en los proxies de Zabbix.