14 服务监控升级

Overview

在 Zabbix 6.0 中,service monitoring 功能得到了显著改进(有关更改列表,请参见 服务)。

本页面描述了在升级到 Zabbix 6.0 或更新版本时,早期 Zabbix 版本中定义的服务和 SLA 将如何发生变化。

服务

在较旧的 Zabbix 版本中,服务有两种类型的依赖关系:软依赖和硬依赖。升级后,所有依赖关系将变得平等。

如果一个服务“子服务”之前通过硬依赖关系链接到“父服务 1”,并且还通过软依赖关系链接到“父服务 2”,那么升级后,“子服务”将有两个父服务:“父服务 1”和“父服务 2”。

基于触发器的故障与服务之间的映射已被基于标签的映射取代。在 Zabbix 6.0 及更高版本中,服务配置表单新增了一个参数 Problem tags,允许指定一个或多个标签名称和值对以匹配故障。已经链接到服务的触发器将 get 一个新标签 ServiceLink : <trigger ID>:<trigger name>(标签值将被截断为 32 个字符)。链接的服务将 get ServiceLink 问题标签 并具有相同的值。

状态计算规则

“状态计算算法”将根据以下规则进行升级:

  • 不计算 → 将状态设置为OK
  • 如果至少有一个子项存在问题,则问题 → 最严重的子服务
  • 如果所有子项都存在问题,则问题 → 所有子项都存在问题时最严重的情况

SLA(服务等级协议)

之前,SLA目标必须为每个服务单独定义。自Zabbix 6.0起,SLA已成为一个独立的实体,其中包含有关服务计划、预期服务等级目标(SLO)以及需要从计算中排除的停机时间段的信息。配置完成后,可以通过标签将一个SLA分配给多个服务。

在升级过程中:

  • 为每个服务定义的相同SLA将被分组,并为每个组创建一个SLA。
  • 每个受影响的服务将get一个特殊标签SLA:<ID>,并且相同的标签将被指定在相应SLA的“服务标签”参数中。
  • 服务创建时间,作为SLA报告中的一个新指标,将被设置为现有服务的2000年1月1日 00:00。