3 配置示例

概述

本节描述了将Zabbix高可用性集群作为服务进行监控的一个简单配置。

先决条件

配置服务监控之前,你需要已经配置好主机:

  • HA节点 1 至少有一个触发器和一个标签(建议在触发器级别设置)component:ha-node-1
  • HA节点 2 至少有一个触发器和一个标签(建议在触发器级别设置)component:ha-node-2

服务树

下一步是构建服务树。在此示例中,基础架构非常基础,包含三个服务:Zabbix 集群(父级)和两个子服务 Zabbix server 节点 1Zabbix server 节点 2

Zabbix 集群
       |
       |- Zabbix server 节点 1
       |- Zabbix server 节点 2

在服务页面上,打开 编辑 模式并点击 创建服务:

在服务配置窗口中,输入名称 Zabbix 集群,然后点击 高级配置 标签以显示高级配置选项。

配置附加规则:

Zabbix 集群将有两个子服务 - 每个 HA 节点一个。如果两个 HA 节点都出现至少 警告 状态的问题,则父级服务状态应设置为 灾难。为实现这一点,应将附加规则配置为:

  • 设置状态为:灾难
  • 条件:如果至少 N 个子服务具有 Status 或更高级别的状态
  • N: 2
  • 状态:警告

切换到 标签 选项卡并添加标签 application:zabbix-server。此标签稍后将用于服务操作和 SLA 报告。

保存新服务。

要添加子服务,请点击 Zabbix 集群服务旁边的加号图标(该图标仅在 编辑 模式下可见)。

在服务配置窗口中,输入名称 Zabbix server 节点 1。请注意,父服务参数已预先填写为 Zabbix 集群

此服务的可用性受标记为 component:ha-node-1 问题标签的 主机 HA 节点 1 上的问题影响。在问题标签参数中,输入以下内容:

  • 名称:component
  • 操作:Equals
  • 值:ha-node-1

切换到 标签 选项卡,并添加一个服务标签:zabbix-server:node-1。此标签将在后续用于服务操作和 SLA 报告。

保存新服务。

创建 Zabbix 集群的另一个子服务,名称为 "Zabbix server 节点 2"。

设置问题标签如下:

  • 名称:component
  • 操作:等于
  • 值:ha-node-2

切换到 标签 标签页,并添加一个服务标签:zabbix-server:node-2

保存新服务。

SLA

在此示例中,Zabbix 集群的预期性能为 100%,不包括每半年一次的一小时维护时段。

首先,您需要添加一个新的服务级别协议(SLA)。

进入 Services->SLA 菜单部分,点击 创建 SLA(Create SLA)。输入名称 Zabbix 集群性能(Zabbix cluster performance),并将 SLO 设置为 100%。

服务 Zabbix 集群有一个服务标签 application:zabbix-server。要将此 SLA 用于衡量 Zabbix 集群的性能,在 服务标签(Service tags) 参数中指定以下内容:

  • 名称(Name):application
  • 操作(Operation):等于(Equals)
  • 值(Value):zabbix-server

在实际环境中,您还可以使用 update 设置所需的报告周期、时区和开始日期,或将计划从 24/7 更改为自定义计划。对于此示例,默认设置已足够。

切换到 排除的停机时间(Excluded downtimes) 标签页,并添加计划维护时段的停机时间,以将这些时段从 SLA 计算中排除。在 排除的停机时间(Excluded downtimes)部分点击 添加(Add)链接,输入停机名称、计划开始时间和持续时间。

点击 添加(Add)保存新的 SLA。

切换到 SLA 报告(SLA reports)部分,查看 Zabbix 集群的 SLA 报告。

SLA 信息也可以在 Services 部分中查看。