4 设置示例

概述

本节描述如何对Zabbix高可用集群服务进行简单监控设置。

先决条件

在配置服务监控之前,您需要先配置好主机:

  • HA节点1 至少包含一个触发器及标签(建议设置在触发器级别)component:HA node 1
  • HA节点2 至少包含一个触发器及标签(建议设置在触发器级别)component:HA node 2

服务树

下一步是构建服务树。在本示例中,基础设施非常简单,包含三个服务:Zabbix集群(父服务)和两个子服务Zabbix server节点1Zabbix server节点2

Zabbix cluster
       |
       |- Zabbix server node 1
       |- Zabbix server node 2

在服务页面,启用编辑模式并点击创建服务:

在服务配置窗口中,输入名称Zabbix集群并勾选高级配置复选框。

配置附加规则:

Zabbix集群将包含两个子服务——每个HA节点对应一个。如果两个HA节点都出现至少警告级别的问题,父服务状态应设置为灾难。为此需配置如下附加规则:

  • 设置状态为:灾难
  • 条件:当至少N个子服务达到Status或更高状态
  • N值:2
  • 状态阈值:警告

切换到标签选项卡并添加标签Zabbix:server。该标签将用于后续的服务操作和SLA报告。

保存新服务。

要添加子服务,请点击Zabbix集群服务旁边的加号图标(该图标仅在编辑模式下可见)。

在服务配置窗口中,输入名称Zabbix server节点1。请注意,父服务参数已预填为Zabbix集群

该服务的可用性会受到主机HA节点1上问题的影响,这些问题标记有component:HA node 1问题标签。在问题标签参数中输入:

  • 名称: component
  • 操作: Equals
  • 值: HA node 1

切换到标签选项卡并添加服务标签:Zabbix server:node 1。该标签将用于后续的服务操作和SLA报告。

保存新服务。

创建一个名为"Zabbix server node 2"的Zabbix集群子服务。

设置问题标签如下:

  • Name: component
  • Operation: Equals
  • Value: HA node 2

切换到Tags标签页并添加服务标签:Zabbix server:node 2

保存新服务。

SLA

在此示例中,Zabbix集群的预期性能为100%,不包括每半年一小时的维护周期。

首先,您需要添加一个新的服务级别协议。

进入服务->SLA菜单部分,点击创建SLA。输入名称Zabbix集群性能并将SLO设置为100%。

服务Zabbix集群有一个服务标签Zabbix:server。要使用此SLA测量Zabbix集群的性能,请在服务标签参数中指定:

  • 名称: Zabbix
  • 操作: 等于
  • 值: server

在实际设置中,您还可以update所需的报告周期、时区和开始日期,或将计划从24/7更改为自定义。对于此示例,默认设置已足够。

切换到排除停机时间选项卡,为计划维护周期添加停机时间,以将这些周期从SLA计算中排除。在排除停机时间部分点击添加链接,输入停机名称、计划开始时间和持续时间。

点击添加以保存新的SLA。

切换到SLA报告部分以查看Zabbix集群的SLA报告。

SLA信息也可以在服务部分查看。