6 服务监控
概述
服务监控是一种业务级监控,可用于 概览整个 IT 基础架构服务树、识别基础架构中的薄弱环节、计算各类 IT 服务的 SLA,并在更高层级查看其他信息。服务监控关注的是服务的整体可用性, 而不是底层细节,例如磁盘空间不足、 处理器负载过高等。服务监控还提供了在服务未按预期运行时查找问题根因的功能。
服务监控允许创建监控数据的层级表示。
一个非常简单的服务结构可能如下所示:
服务
|
|-工作站
| |
| |-工作站1
| |
| |-工作站2
|
|-服务器
结构中的每个节点都有状态属性。该状态会根据所选 算法进行计算并向上层传播。各个节点的状态会受到 已映射问题状态的影响。问题映射通过标签实现。
如果检测到服务状态发生变化,Zabbix 可以发送通知,或在 Zabbix 服务器上自动执行脚本。可以灵活定义规则,以确定父服务是否应根据子服务的状态进入“问题状态”。 随后,服务问题数据可用于计算 SLA,并基于灵活的条件集发送 SLA 报告。
服务监控在“服务”菜单中进行配置,该菜单包含以下部分:
“服务”部分允许通过添加父服务来构建受监控 基础架构的层级结构,然后再向父服务添加子 服务。
除了配置服务树之外,本部分还提供整个基础架构的概览,并允许快速识别导致服务状态变化的问题。
在本部分中,您可以定义服务级别协议,并为特定服务设置服务级别目标。
在本部分中,您可以查看 SLA 报告。
服务操作
您还可以配置服务动作。
服务动作是可选的,可用于:
- 在服务不可用时发送通知
- 在服务状态发生变化时在 Zabbix 服务器上执行远程命令
- 在服务恢复可用时发送恢复通知。
另请参见: