本节描述如何对Zabbix高可用集群服务进行简单监控设置。
在配置服务监控之前,您需要先配置好主机:
component:HA node 1
component:HA node 2
下一步是构建服务树。在本示例中,基础设施非常简单,包含三个服务:Zabbix集群(父服务)和两个子服务Zabbix server节点1及Zabbix server节点2。
在服务页面,启用编辑模式并点击创建服务:
在服务配置窗口中,输入名称Zabbix集群并勾选高级配置复选框。
配置附加规则:
Zabbix集群将包含两个子服务——每个HA节点对应一个。如果两个HA节点都出现至少警告级别的问题,父服务状态应设置为灾难。为此需配置如下附加规则:
N
个子服务达到Status
或更高状态切换到标签选项卡并添加标签Zabbix:server
。该标签将用于后续的服务操作和SLA报告。
保存新服务。
要添加子服务,请点击Zabbix集群服务旁边的加号图标(该图标仅在编辑模式下可见)。
在服务配置窗口中,输入名称Zabbix server节点1。请注意,父服务参数已预填为Zabbix集群。
该服务的可用性会受到主机HA节点1上问题的影响,这些问题标记有component:HA node 1
问题标签。在问题标签参数中输入:
切换到标签选项卡并添加服务标签:Zabbix server:node 1
。该标签将用于后续的服务操作和SLA报告。
保存新服务。
创建一个名为"Zabbix server node 2"的Zabbix集群子服务。
设置问题标签如下:
切换到Tags标签页并添加服务标签:Zabbix server:node 2
。
保存新服务。
在此示例中,Zabbix集群的预期性能为100%,不包括每半年一小时的维护周期。
首先,您需要添加一个新的服务级别协议。
进入服务->SLA菜单部分,点击创建SLA。输入名称Zabbix集群性能并将SLO设置为100%。
服务Zabbix集群有一个服务标签Zabbix:server
。要使用此SLA测量Zabbix集群的性能,请在服务标签参数中指定:
在实际设置中,您还可以update所需的报告周期、时区和开始日期,或将计划从24/7更改为自定义。对于此示例,默认设置已足够。
切换到排除停机时间选项卡,为计划维护周期添加停机时间,以将这些周期从SLA计算中排除。在排除停机时间部分点击添加链接,输入停机名称、计划开始时间和持续时间。
点击添加以保存新的SLA。
切换到SLA报告部分以查看Zabbix集群的SLA报告。
SLA信息也可以在服务部分查看。