8 服务监控
概述
服务监控是一种业务级监控,可用于 全面了解整个 IT 基础设施服务树,识别基础设施中的薄弱环节,计算各种 IT 服务的 SLA,并从更高层面查看其他信息。服务监控关注的是服务的整体可用性, 而不是诸如磁盘空间不足、处理器负载过高等低层细节。服务监控还提供了在服务未按预期运行时查找问题根本原因的功能。
服务监控允许创建受监控数据的层级表示。
一个非常简单的服务结构可能如下所示:
Service
|
|-Workstations
| |
| |-Workstation1
| |
| |-Workstation2
|
|-Servers
结构中的每个节点都有状态属性。状态会根据所选算法进行计算并向上层传播。单个节点的状态会受到已映射问题状态的影响。问题映射通过 tagging 完成。
如果检测到服务状态发生变化,Zabbix 可以发送通知,或者在 Zabbix 服务器上自动执行脚本。可以定义灵活的规则,决定父服务是否应根据子服务的状态进入“Problem state”。随后,服务问题数据可用于计算 SLA,并基于这组灵活条件发送 SLA 报告。
服务监控在 Services 菜单中进行配置,该菜单包含以下部分:
Services 部分允许通过添加父服务,然后再向父服务添加子服务,来构建受监控基础设施的层级结构。
除了配置服务树之外,此部分还提供整个基础设施的概览,并允许快速识别导致服务状态变化的问题。
在此部分中,您可以定义服务级别协议,并为特定服务设置服务级别目标。
在此部分中,您可以查看 SLA 报告。
Service actions
您还可以配置服务 actions。
Service actions 是可选功能,允许:
- 发送服务不可用的通知
- 在服务状态变化时在 Zabbix 服务器上执行远程命令
- 在服务恢复后发送恢复通知。
另请参见: