本节描述了将Zabbix高可用性集群作为服务进行监控的一个简单配置。
配置服务监控之前,你需要已经配置好主机:
component:ha-node-1
component:ha-node-2
下一步是构建服务树。在此示例中,基础架构非常基础,包含三个服务:Zabbix 集群(父级)和两个子服务 Zabbix server 节点 1 和 Zabbix server 节点 2。
在服务页面上,打开 编辑 模式并点击 创建服务:
在服务配置窗口中,输入名称 Zabbix 集群,然后点击 高级配置 标签以显示高级配置选项。
配置附加规则:
Zabbix 集群将有两个子服务 - 每个 HA 节点一个。如果两个 HA 节点都出现至少 警告 状态的问题,则父级服务状态应设置为 灾难。为实现这一点,应将附加规则配置为:
N
个子服务具有 Status
或更高级别的状态切换到 标签 选项卡并添加标签 application:zabbix-server
。此标签稍后将用于服务操作和 SLA 报告。
保存新服务。
要添加子服务,请点击 Zabbix 集群服务旁边的加号图标(该图标仅在 编辑 模式下可见)。
在服务配置窗口中,输入名称 Zabbix server 节点 1。请注意,父服务参数已预先填写为 Zabbix 集群。
此服务的可用性受标记为 component:ha-node-1
问题标签的 主机 HA 节点 1 上的问题影响。在问题标签参数中,输入以下内容:
切换到 标签 选项卡,并添加一个服务标签:zabbix-server:node-1
。此标签将在后续用于服务操作和 SLA 报告。
保存新服务。
创建 Zabbix 集群的另一个子服务,名称为 "Zabbix server 节点 2"。
设置问题标签如下:
切换到 标签 标签页,并添加一个服务标签:zabbix-server:node-2
。
保存新服务。
在此示例中,Zabbix 集群的预期性能为 100%,不包括每半年一次的一小时维护时段。
首先,您需要添加一个新的服务级别协议(SLA)。
进入 Services->SLA 菜单部分,点击 创建 SLA(Create SLA)。输入名称 Zabbix 集群性能(Zabbix cluster performance),并将 SLO 设置为 100%。
服务 Zabbix 集群有一个服务标签 application:zabbix-server
。要将此 SLA 用于衡量 Zabbix 集群的性能,在 服务标签(Service tags) 参数中指定以下内容:
在实际环境中,您还可以使用 update 设置所需的报告周期、时区和开始日期,或将计划从 24/7 更改为自定义计划。对于此示例,默认设置已足够。
切换到 排除的停机时间(Excluded downtimes) 标签页,并添加计划维护时段的停机时间,以将这些时段从 SLA 计算中排除。在 排除的停机时间(Excluded downtimes)部分点击 添加(Add)链接,输入停机名称、计划开始时间和持续时间。
点击 添加(Add)保存新的 SLA。
切换到 SLA 报告(SLA reports)部分,查看 Zabbix 集群的 SLA 报告。
SLA 信息也可以在 Services 部分中查看。