Esta es una traducción de la página de documentación original en español. Ayúdanos a mejorarla.

2 Detalles de preprocesamiento

Descripción general

Esta sección proporciona detalles del preprocesamiento del valor de la métrica. El preprocesamiento del valor de la métrica permite definir y ejecutar reglas de transformación para los valores de las métricas recibidos.

El preprocesamiento lo gestiona el proceso del administrador de preprocesamiento, incorporado en Zabbix 3.4, junto con los trabajadores de preprocesamiento que realizan los pasos de preprocesamiento. Todos los valores (con o sin preprocesamiento) de diferentes recolectores de datos pasan por el administrador de preprocesamiento antes de ser agregados a la caché del historial. Se utiliza comunicación IPC basada en sockets entre los recolectores de datos (sondeadores, capturadores, etc.) y el proceso de preprocesamiento. Tanto el servidor Zabbix como el proxy Zabbix (para elementos monitoreados por el proxy) realizan los pasos de preprocesamiento.

Procesamiento del valor de la métrica

Para visualizar el flujo de datos desde la fuente de datos a la base de datos Zabbix, Podemos utilizar el siguiente diagrama simplificado:

El diagrama anterior muestra solo procesos, objetos y acciones relacionados con el procesamiento del valor de la métrica en forma simplificada. El diagrama no muestra cambios de dirección condicionales, manejo de errores o bucles. La caché de los datos locales del administrador de preprocesamiento tampoco se muestra porque no afectan directamente al flujo de datos. El objetivo de este diagrama es mostrar los procesos involucrados en el procesamiento del valor de la métrica y la forma en que interactúan.

  • La recopilación de datos comienza con datos sin procesar de una fuente de datos. En este punto, los datos contienen solo ID, marca de tiempo y valor (pueden ser múltiples valores también)
  • No importa qué tipo de recolector de datos se utilice, la idea es la misma para controles activos o pasivos, para elementos de trampero, etc., ya que solo cambia el formato de datos y el iniciador de comunicación (ya sea datos El recolector está esperando una conexión y datos, o recolector de datos. inicia la comunicación y solicita los datos). Los datos brutos son validado, la configuración de la métrica se recupera del caché de configuración (los datos se enriquecen con los datos de configuración).
  • El mecanismo IPC basado en sockets se utiliza para pasar datos desde los recolectores de datos. al administrador de preprocesamiento. En este punto, el recolector de datos continúa recopilar datos sin esperar la respuesta del preprocesamiento gerente.
  • Se realiza el preprocesamiento de datos. Esto incluye la ejecución de pasos de preprocesamiento y procesamiento de artículos dependientes.

La métrica puede cambiar su estado a NO SOPORTADO mientras el preprocesamiento se realiza si alguno de los pasos de preprocesamiento falla.

  • Se están actualizando los datos históricos del caché de datos local del administrador de preprocesamiento. descargado en el caché del historial.
  • En este punto el flujo de datos se detiene hasta la próxima sincronización de caché de historial (cuando el proceso de sincronización de historial realiza datos sincronización).
  • El proceso de sincronización comienza con la normalización de datos y el almacenamiento de datos. en la base de datos Zabbix. La normalización de datos realiza conversiones al tipo de métrica deseado (tipo definido en la configuración de la métrica), incluido el truncamiento de datos textuales basado en tamaños predefinidos permitidos para esos tipos (HISTORY_STR_VALUE_LEN para cadena, HISTORY_TEXT_VALUE_LEN para texto e HISTORY_LOG_VALUE_LEN para valores logarítmicos). Los datos se envían a la base de datos de Zabbix después de realizar la normalización.

La métrica puede cambiar su estado a NO COMPATIBLE si la normalización de los datos falla (por ejemplo, cuando el valor textual no se puede convertir a número).

  • Se están procesando los datos recopilados - Se verifican los iniciadores, la configuración de la métrica se actualiza si la métrica pasa a ser NO SOPORTADA, etc.
  • Esto se considera el final del flujo de datos desde el punto de vista de procesamiento del valor de la métrica.

Preprocesamiento del valor de la métrica

Para visualizar el proceso de preprocesamiento de datos, podemos utilizar el siguiente diagrama simplificado:

El diagrama anterior muestra solo procesos, objetos y acciones principales relacionadas al preprocesamiento del valor de la métrica en una forma simplificada. El diagrama no muestra los cambios de dirección condicionales, manejo de errores o bucles. En este diagrama solo se muestra un trabajador de preprocesamiento ( los trabajadores de preprocesamiento múltiples se pueden utilizar en escenarios de la vida real), solo un valor de métrica se está procesando y asumimos que esta métrica requiere ejecutar al menos un paso de preprocesamiento. El objetivo de este diagrama es mostrar la idea detrás del proceso de preprocesamiento del valor de la métrica.

  • Los datos y el valor de la métrica se pasan al administrador de preprocesamiento mediante el mecanismo IPC basado en sockets.
  • La métrica se coloca en la cola de preprocesamiento.

La métrica se puede colocar al final o al principio de la cola de preprocesamiento. Las métricas internas de Zabbix siempre se colocan en el comienzo de la cola de preprocesamiento, mientras que otros tipos de métricas se ponen en la cola al final.

  • En este punto el flujo de datos se detiene hasta que haya al menos un trabajador de preprocesamiento desocupado (que no está ejecutando ninguna tarea).
  • Cuando el trabajador de preprocesamiento está disponible, la tarea de preprocesamiento se envía al trabajador.
  • Después de realizar el preprocesamiento (ejecución fallida y exitosa de los pasos de preprocesamiento), el valor preprocesado se devuelve al administrador de preprocesamiento.
  • El administrador de preprocesamiento convierte el resultado al formato deseado (definido por el tipo de valor de la métrica) y pone el resultado en la cola de preprocesamiento. Sí hay métricas dependientes para la métrica actual, luego se agregan las métricas dependientes a la cola de preprocesamiento también. Las métricas dependientes se ponen en la cola de preprocesamiento justo después de la métrica principal, pero solo para las métricas principales con valor establecido y no en estado NO SOPORTADO.
Value processing pipeline

Item value processing is executed in multiple steps (or phases) by multiple processes. This can cause:

  • Dependent item can receive values, while THE master value cannot. This can be achieved by using the following use case:
    • Master item has value type UINT, (trapper item can be used), dependent item has value type TEXT.
    • No preprocessing steps are required for both master and dependent items.
    • Textual value (like, "abc") should be passed to master item.
    • As there are no preprocessing steps to execute, preprocessing manager checks if master item is not in NOT SUPPORTED state and if value is set (both are true) and enqueues dependent item with the same value as master item (as there are no preprocessing steps).
    • When both master and dependent items reach history synchronization phase, master item becomes NOT SUPPORTED, because of the value conversion error (textual data cannot be converted to unsigned integer).

As a result, dependent item receives a value, while master item changes its state to NOT SUPPORTED.

  • Dependent item receives value that is not present in master item history. The use case is very similar to the previous one, except for the master item type. For example, if CHAR type is used for master item, then master item value will be truncated at the history synchronization phase, while dependent items will receive their value from the initial (not truncated) value of master item.

Preprocessing queue

Preprocessing queue is a FIFO data structure that stores values preserving the order in which values are revieved by preprocessing manager. There are multiple exceptions to FIFO logic:

  • Internal items are enqueued at the beginning of the queue
  • Dependent items are always enqueued after the master item

To visualize the logic of preprocessing queue, we can use the following diagram:

Values from the preprocessing queue are flushed from the beginning of the queue to the first unprocessed value. So, for example, preprocessing manager will flush values 1, 2 and 3, but will not flush value 5 as value 4 is not processed yet:

Only two values will be left in queue (4 and 5) after flushing, values are added into local data cache of preprocessing manager and then values are transferred from local cache into history cache. Preprocessing manager can flush values from local data cache in single item mode or in bulk mode (used for dependent items and values received in bulk).

Preprocessing workers

Zabbix server configuration file allows users to set count of preprocessing worker processes. StartPreprocessors configuration parameter should be used to set number of pre-forked instances of preprocessing workers. Optimal number of preprocessing workers can be determined by many factors, including the count of "preprocessable" items (items that require to execute any preprocessing steps), count of data gathering processes, average step count for item preprocessing, etc.

But assuming that there is no heavy preprocessing operations like parsing of large XML / JSON chunks, number of preprocessing workers can match total number of data gatherers. This way, there will mostly (except for the cases when data from gatherer comes in bulk) be at least one unoccupied preprocessing worker for collected data.

Too many data gathering processes (pollers, unreachable pollers, HTTP pollers, Java pollers, pingers, trappers, proxypollers) together with IPMI manager, SNMP trapper and preprocessing workers can exhaust the per-process file descriptor limit for the preprocessing manager. This will cause Zabbix server to stop (usually shortly after the start, but sometimes it can take more time). The configuration file should be revised or the limit should be raised to avoid this situation.