8 サービス監視
概要
サービス監視は、ビジネスレベルの監視であり、ITインフラストラクチャ全体のサービスツリーの概要を把握したり、インフラストラクチャの弱点を特定したり、さまざまなITサービスのSLAを計算したり、その他の情報をより高いレベルで確認したりするために使用できます。サービス監視は、ディスク容量不足や高いCPU負荷などの低レベルな詳細ではなく、サービス全体の可用性に重点を置きます。また、サービスが期待どおりに動作していない場合に、問題の根本原因を見つける機能も提供します。
サービス監視では、監視データの階層構造を作成できます。
非常に単純なサービス構造は、次のようになります。
Service
|
|-Workstations
| |
| |-Workstation1
| |
| |-Workstation2
|
|-Servers
構造内の各ノードには status 属性があります。status は、選択したアルゴリズムに従って計算され、上位レベルへ伝播されます。個々のノードの status は、関連付けられた障害の status の影響を受けます。障害のマッピングは tagging によって行われます。
Zabbix は、サービス status の変更が検出された場合に、通知を送信したり、Zabbix サーバー上でスクリプトを自動実行したりできます。子サービスの status に基づいて、親サービスを「Problem state」にするかどうかを柔軟なルールで定義できます。サービスの障害データは、その後、柔軟な条件セットに基づいて SLA を計算し、SLA レポートを送信するために使用できます。
サービス監視は Services メニューで設定します。このメニューは次のセクションで構成されています。
Services セクションでは、親サービスを追加し、その後に子サービスを親サービスへ追加することで、監視対象インフラストラクチャの階層を構築できます。
サービスツリーの設定に加えて、このセクションではインフラストラクチャ全体の概要を表示し、サービス status の変更につながった障害をすばやく特定できます。
このセクションでは、サービスレベル契約を定義し、特定のサービスに対するサービスレベル目標を設定できます。
このセクションでは、SLA レポートを表示できます。
Service actions
サービス actions も設定できます。
Service actions は任意であり、次のことが可能です。
- サービスが停止したことを通知する
- サービス status の変更時に Zabbix サーバー上でリモートコマンドを実行する
- サービスが再び稼働したときに復旧通知を送信する
関連情報:
- SLA 監視設定の 例
- Zabbix 6.0 より前のバージョンからの services のアップグレード に関する注意事項