2022 Zabbix中国峰会
2022 Zabbix中国峰会

8. 服务监控

总览

服务监控(services monitoring)旨在帮助那些想要高级(业务)基础设施的监控的人。在许多情况下,我们关注的不是底层细节,比如磁盘空间不足、CPU 负载高等。我们关注的是IT部门提供的可用性的服务。我们还对确定IT基础设施薄弱的地方,IT各种服务级协定(SLA),现有的IT基础设施的结构,以及其他的信息感兴趣

Zabbix 服务监控(services)对提到的问题提出了解决方案。

服务(services)是分层表示监控数据。

下面来看一个简单服务的例子:

IT Service
       |
       |-Workstations
       | |
       | |-Workstation1
       | |
       | |-Workstation2
       |
       |-Servers

该结构的每个节点都具有属性状态。根据选择算法进行状态计算并传播到上层节点。服务(services)最底层的服务是触发器。该节点的状态依赖于触发器的状态。

注意,触发器不分类信息的严重程度不影响SLA计算。

配置

配置服务(services),请访问:配置(Configuration)→服务(services)

在该界面,您可以创建一个分层次的监控结构。最高的父节点服务是 'root'。您可以通过添加低级服务节点和各个节点服务创建下层层次结构。

点击 Add child 添加服务(services)。可以单击其名称编辑一个现有的服务。您可以通过弹出的表单编辑服务属性。

配置一个服务(services)

服务选项卡包含通用服务属性:

参数 说
名称(Name) 的名字。
上层服务(Parent service) 父节点
状态计算算法(Status calculation algorithm) 服务状态计 方法:
不计算 - 不计算节点状态
问题,如果至少一个子节点有一个问题 - 只要一个子节点有异常,该节点就异常。
问题,如果所有的子节点都有问题 - 当且仅当所有子节点都有异常,该节点才异常。
计算SLA(Calculate SLA) 计算SLA的百分比。
可接受的SAL(% 计)(Acceptable SLA) 这个服务 LA百分比是可以接受的,用于报表。
触发器(Trigger) 选择 联的触发器:
None - 没有关联的触发器
触发器名称 - 连接到触发器,节点的状态取决于触发器状态
在最底层的服务必须依赖触发器。(否则节点状态会显示不对。)\\当触发被链接,其链接以前的状态是不计数的。
排序(Sort order) 的顺序,数字小的优先

依赖关系(Dependencies)选项卡可以看到该服务的所有子节点。单击Add单添加一个之前配置过的服务。

硬依赖和软依赖

服务可用性可以取决于若干其它服务,而不是仅仅一个。第一选项是直接添加为子节点。

然而,如果一些服务已经加入到其他的服务树,它不能被移动到这里作为子节点。如何创建?答案是 “软” 连接。添加服务并勾选 Soft 复选框。这样的服务可以留在原来的位置在树上,还依赖于其他服务。“软链接”的服务在服务树种显示是灰色的。另外,如果一个服务只有一个“软链接”的子节点,就可以删除此服务,而不用删除软链接的子节点。

时间(Time)选项卡用于设置服务的工作时间。

参数 说
服务时间(Service times) 默认地 所有的服务都将24x7x365操作。如果例外需要,添加新的服务。
新服务时间(New service time) 服务时间
工作时间(Uptime) - 服务正常运行时间
维护时间(Downtime) - 维护时间状态的时段内不会计算SLA百分比。
一个时间-停机(One-time downtime) - 一次性的维护时间。维护时间状态的时段内不会计算SLA百分比。
添加相应的时间。
注意: 服务时间仅影响其配置的服务。 因此,父节点服务不会考虑在子节点服务上配置的服务时间(除非在父节点服务上配置相应的服务时间)。
在前端计算服务状态和SLA时,会考虑服务时间。 然而,不管服务时间如何,关于服务可用性的信息会被连续地插入到数据库中。

前端显示

服务(services)监控, 去 监控中(Monitoring) → 服务(services).