3 配置示例
概述
该章节向用户展示了如何简单地配置一个服务用来监控Zabbix的高可用集群。
先决条件
在配置服务监控之前,您需要先配置好以下主机:
- HA 节点 1,至少包含一个触发器和一个标签(最好在触发器级别设置)
component:ha-node-1 - HA 节点 2,至少包含一个触发器和一个标签(最好在触发器级别设置)
component:ha-node-2
服务树
下一步是构建服务树。在本示例中,基础架构非常简单,由三个服务组成:Zabbix cluster(父服务)以及两个子服务 Zabbix server node 1 和 Zabbix server node 2。
Zabbix cluster
|
|- Zabbix server node 1
|- Zabbix server node 2
在“服务”页面,开启 编辑 模式并点击“创建服务”:

在服务配置窗口中,输入名称 Zabbix cluster,然后点击 高级配置 标签以显示高级配置选项。

配置附加规则:

Zabbix cluster 将有两个子服务——每个 HA 节点对应一个。如果两个 HA 节点都出现至少为 警告 状态的问题,则父服务状态应设置为 灾难。为此,应按如下方式配置附加规则:
- 设置状态为:灾难
- 条件:如果至少有
N个子服务处于状态或更高级别的状态 - N:2
- 状态:警告
切换到 标签 选项卡并添加标签 application:zabbix-server。此标签稍后将用于服务动作和 SLA 报表。

保存新服务。
要添加子服务,请点击 Zabbix 集群服务旁边的加号图标(该图标仅在 编辑 模式下可见)。

在服务配置窗口中,输入名称 Zabbix server node 1。请注意,父服务参数已预先填入 Zabbix cluster。
此服务的可用性会受到主机 HA node 1 上问题的影响,该问题带有 component:ha-node-1 问题标签。在“问题标签”参数中,输入:
- 名称:component
- 操作:等于
- 值:ha-node-1

切换到 标签 选项卡并添加一个服务标签:zabbix-server:node-1。此标签稍后将用于服务动作和 SLA 报告。

保存新服务。
创建 Zabbix 集群的另一个子服务,名称为“Zabbix 服务器节点 2”。
将问题标签设置为:
- 名称:component
- 操作:等于
- 值:ha-node-2
切换到 标签 选项卡并添加一个服务标签:zabbix-server:node-2。
保存新服务。
SLA
在此示例中,预期的 Zabbix 集群性能为 100%,不包括每半年一次、每次一小时的维护时段。
首先,您需要添加一个新的服务级别协议。
前往 Services->SLA 菜单部分并点击 Create SLA。输入名称 Zabbix cluster performance,并将 SLO 设置为 100%。
服务 Zabbix cluster 具有服务标签 application:zabbix-server。要使用此 SLA 来衡量 Zabbix 集群的性能,请在 Service tags 参数中指定:
- 名称:application
- 操作:Equals
- 值:zabbix-server

在实际环境中,您还可以更新所需的报告周期、时区和开始日期,或将计划从 24/7 更改为自定义。对于此示例,默认设置已足够。
切换到 Excluded downtimes 选项卡,并为计划维护时段添加停机时间,以便在 SLA 计算中排除这些时段。在 Excluded downtimes 部分中点击 Add 链接,输入停机时间名称、计划开始时间和持续时间。

点击 Add 以保存新的 SLA。
切换到 SLA reports 部分以查看 Zabbix cluster 的 SLA 报告。

也可以在 Services 部分中查看 SLA 信息。
