2 全局事件关联

概述

全局事件关联功能允许跨越Zabbix监控的所有指标和create关联进行综合分析。

通过该功能,可以对完全不同的触发器生成的事件进行关联,并对它们统一执行操作。通过创建智能的关联规则,实际上可以避免成千上万条重复通知,从而聚焦问题的根本原因!

全局事件关联是一种强大的机制,它能帮助您摆脱基于单一触发器的问题处理逻辑。以往,单个问题事件仅由一个触发器创建,且必须依赖同一个触发器来解决问题。而现在借助基于事件标签的关联机制,我们可以实现跨触发器的关联处理。

例如:日志触发器可能报告应用故障,而轮询触发器可能显示应用运行正常。利用事件标签功能,您可以将日志触发器标记为status:down,同时将轮询触发器标记为status:up。随后在全局关联规则中关联这些触发器,并为此关联配置适当操作(如关闭旧事件)。

另一个应用场景是:全局关联可以识别相似的触发器并对其执行统一操作。假设我们希望get每个网络端口问题仅生成一条问题报告?无需全部上报——通过全局事件关联同样可以实现。

全局事件关联通过关联规则进行配置。每条规则定义新问题事件如何与现有问题事件匹配,以及匹配后的处理方式(关闭新事件/通过生成对应恢复事件来关闭匹配的旧事件)。若问题被全局关联关闭,该操作会显示在监控 > 问题页面的信息列中。

注意:仅超级管理员用户可配置全局关联规则。

必须谨慎配置事件关联功能,否则可能对事件处理性能产生负面影响。若配置不当,可能导致关闭的事件超出预期(最坏情况下甚至可能关闭所有问题事件)。

为确保安全配置全局关联,请遵循以下要点:

  • 缩小关联范围:始终为新事件设置唯一标签用于匹配旧事件,并使用新事件标签名作为关联条件
  • 执行关闭旧事件操作时务必添加基于旧事件的条件(否则可能关闭所有现存问题)
  • 避免使用可能被不同关联配置重复使用的通用标签名
  • 仅保留实际需要的关联规则,控制规则数量

另请参阅:全局事件关联

配置

要全局配置事件关联规则:

  • 进入 数据采集 > 事件关联
  • 点击右侧的 创建事件关联(或点击关联名称以编辑现有规则)
  • 在表单中输入关联规则的参数

correlation_rule.png

所有必填输入字段均以红色星号标记。

参数 描述
Name 唯一的关联规则名称。
Type of calculation 提供以下条件计算选项:
And - 所有条件必须满足
Or - 满足其中一个条件即可
And/Or - 不同条件类型使用 AND,相同条件类型使用 OR
自定义表达式 - 用户定义的条件评估计算公式。公式必须包含所有条件(以大写字母 A、B、C 等表示),并可包含空格、制表符、括号 ( )、and(区分大小写)、or(区分大小写)、not(区分大小写)。
Conditions 条件列表。有关配置条件的详细信息,请参见下方。
Description 关联规则描述。
Operations 选中要执行的操作的复选框以在事件关联时执行。可用操作如下:
关闭旧事件 - 当新事件发生时关闭旧事件。使用 关闭旧事件 操作时,始终添加基于旧事件的条件,否则可能会关闭所有现有问题。
关闭新事件 - 当新事件发生时关闭该事件
Enabled 如果选中此复选框,关联规则将被启用。

要配置新条件的详细信息,请点击条件块中的 。将打开一个弹出窗口,您可以在其中编辑条件详细信息。

参数 描述
New condition 选择用于事件关联的条件。
注意:如果没有指定旧事件条件,可能会匹配并关闭所有旧事件。同样,如果没有指定新事件条件,可能会匹配并关闭所有新事件。
可用条件如下:
旧事件标签名称 - 指定用于匹配的旧事件标签名称。
新事件标签名称 - 指定用于匹配的新事件标签名称。
新事件 主机组 - 指定用于匹配的新事件 主机组。
事件标签对 - 指定新事件标签名称和旧事件标签名称用于匹配。在这种情况下,如果两个事件中的标签匹配,则视为匹配。标签名称无需匹配。
此选项适用于匹配运行时值,这些值在配置时可能未知(另请参见 示例)。
旧事件标签值 - 使用以下运算符指定旧事件标签名称和值用于匹配:
等于 - 具有指定的旧事件标签值
不等于 - 不具有指定的旧事件标签值
包含 - 在旧事件标签值中包含 string
不包含 - 在旧事件标签值中不包含 string
新事件标签值 - 使用以下运算符指定新事件标签名称和值用于匹配:
等于 - 具有指定的新事件标签值
不等于 - 不具有指定的新事件标签值
包含 - 在新事件标签值中包含 string
不包含 - 在新事件标签值中不包含 string

由于可能存在错误配置,当不相关问题可能创建类似事件标签时,请仔细查看以下列出的情况!

  • 实际标签和标签值仅在触发器触发时才可见。 如果使用的正则表达式无效,它将被静默替换为 *UNKNOWN* string。如果初始问题事件带有 *UNKNOWN* 标签值被遗漏,可能会出现后续的 OK 事件也带有相同的 *UNKNOWN* 标签值,从而错误地关闭不应关闭的问题事件。
  • 如果用户将 {ITEM.VALUE} 宏用作标签值而不使用宏函数,则适用 255 字符限制。当日志消息较长且前 255 个字符不具特异性时,也可能导致不相关问题生成类似的事件标签。

示例

阻止来自同一网络端口的重复问题事件。

如果触发器上存在主机port 标签值,并且它们在原始事件和新事件中相同,则此全局关联规则将对这些问题进行关联。

该操作将关闭同一网络端口上的新问题事件,仅保持原始问题处于打开状态。