服务监控是一种业务级监控,可用于 get 整个IT基础设施服务树的概览,识别基础设施的薄弱环节,计算各类IT 服务的SLA,并在更高层次上查看其他信息。服务监控关注的是服务的整体可用性, 而非底层细节,如磁盘空间不足、 处理器负载过高等。自Zabbix 6.0起,服务监控还提供了在服务未按预期运行时查找问题根本原因的功能。
服务监控允许 create 监控数据的层次化表示。
一个非常简单的服务结构可能如下所示:
该结构的每个节点都具有状态属性。状态根据所选算法 进行计算并传播到上层。单个节点的状态受映射问题状态的影响。 问题映射通过 问题标签 实现。
当检测到服务状态变化时,Zabbix可以发送通知或在 Zabbix server 上自动 execute 脚本。可以定义灵活的规则,确定父服务是否应基于子服务的状态进入"问题状态"。 然后,服务问题数据可用于计算SLA,并根据灵活的条件集发送SLA报告。
服务监控在"服务"菜单中配置,该菜单包含以下部分:
"服务"部分允许通过添加父服务,然后向父服务添加子服务, 来构建监控基础设施的层次结构。
除了配置服务树外,此部分还提供了整个基础设施的概览, 并允许快速识别导致服务状态变化的问题。
在此部分中,您可以配置服务操作。服务操作是可选的,允许:
发送服务宕机的通知;
在服务状态变化时在 Zabbix server 上 execute 远程命令;
当服务恢复时发送恢复通知。
在此部分中,您可以定义服务级别协议并为特定服务设置服务级别目标。
在此部分中,您可以查看SLA报告。
另请参阅: