该章节向用户展示了如何简单地配置一个服务用来监控Zabbix的高可用集群。
在配置服务监控之前,您需要配置以下主机:
component:ha-node-1
component:ha-node-2
下一步是构建服务树。在这个例子中,基础设施非常基础,由三项服务组成:Zabbix 集群(父级)和两个子服务Zabbix 服务器节点 1和Zabbix 服务器节点 2。
在“服务”页面,开启“编辑”模式并点击创建服务:
在服务配置窗口中,输入名称Zabbix 集群并点击“高级配置”标签以显示高级配置选项。
配置额外规则:
Zabbix 集群将有两个子服务,每个高可用性(HA)节点一个。如果两个 HA 节点至少有一个“警告”状态的问题,父级服务状态应设置为“灾难”。为了实现这一点,额外规则应配置为:
N
个子服务有状态
状态或以上切换到“标签”选项卡并添加一个标签application:zabbix-server
。此标签将用于后续的服务操作和SLA报告。
保存新服务。
要添加子服务,请在Zabbix集群服务旁边点击加号图标(此图标仅在编辑模式下可见)。
在服务配置窗口中,输入名称 Zabbix server node 1。请注意,父服务参数已预先填充为 Zabbix cluster。
此服务的可用性受主机 HA node 1 上问题的影响,该问题标记有component:HA node 1
问题标签。在问题标签参数中,输入:
切换到标签标签页,并添加一个服务标签:zabbix-server:node-1
。此标签将用于后续的服务操作和SLA报告。
保存新服务。
创建Zabbix集群的另一个子服务,名称为"Zabbix server node 2"。
设置问题标签如下:
切换到Tags标签页并添加一个服务标签: zabbix-server:node-2
。
保存新服务。
在本例中,预期的Zabbix集群性能为100%,排除每半年一次的一小时维护期。
首先,您需要添加一个新的服务等级协议。
请导航至 服务->SLA 菜单部分,然后点击创建SLA。输入名称 Zabbix集群性能 并将SLO设置为100%。
Zabbix集群服务有一个服务标签 application:zabbix-server
。为了使用此SLA来衡量Zabbix集群的性能,在 服务标签 参数中,指定:
在实际配置中,您还可以更新期望的报告周期、时区和开始日期,或者将时间表从24/7更改为自定义。对于本例,默认设置已足够。
切换至 排除的停机时间 选项卡,并为计划的维护期添加停机时间,以排除这些时间不计入SLA计算。在排除的停机时间部分,点击添加链接,输入停机名称、计划开始时间和持续时间。
点击添加以保存新的SLA。
切换至SLA报告部分,以查看Zabbix集群的SLA报告。
服务等级协议信息也可以在 服务 部分中查看。