Sidebar

Zabbix Summit 2022
Register for Zabbix Summit 2022

2 障害

概要

監視データ → 障害で現在発生している障害を確認できます。 障害とはステータスが"障害"となったトリガーです。

詳細
時間 障害の発生時刻が表示されます。
深刻度 障害の深刻度が表示されます。
障害の深刻度は障害トリガーの深刻度に基づいていますが、イベントが発生した後、障害の更新画面を使用して更新できます。 障害の深刻度の色は障害時のセルの背景色として使用されます。
復旧時刻 障害解決時間が表示されます。
ステータス 障害のステータスが表示されます:
障害 - 未解決の障害
解決済み - 最近解決された障害。 フィルタを使用して最近解決された障害を非表示にできます。
新しい障害と最近解決された障害は2分間点滅します。 解決した障害は合計5分間表示されます。 これらの表示は両方とも、管理一般設定→*イベントのステータスで設定できます。
情報 グローバル相関によって障害が解決された場合、または障害を更新するときに手動で解決された場合は、緑色の情報アイコンが表示されます。 アイコンの上にマウスを置くと詳細が表示されます:
info.png<br >抑制された障害が表示されている場合は、次のアイコンが表示されます(フィルターの抑制された問題を表示オプションを参照)。 アイコンの上にマウスを置くと詳細が表示されます:
ホスト 障害が発生したホストが表示されます。
障害 障害名が表示されます。
障害名は障害トリガーの名前に基づいています。
トリガー名のマクロは、障害が発生したときに解決され、解決された値は更新されなくなります。<br > 注意:障害名に運用データを追加して最新の項目値を表示することができます。
障害名をクリックするとイベントメニューが表示されます。<br >障害名の後にあるアイコンにカーソルを合わせると、トリガーの説明が表示されます(障害がある場合)
(トリガーの説明の{ITEM.VALUE}および{ITEM.LASTVALUE}マクロの解決された値は20文字に切り捨てられることに注意してください。値全体を表示するには、回避策としてこれらのマクロで[マクロ関数]を使用します(例:{{ITEM.VALUE}.regsub("(.*)", \1)}, {{ITEM.LASTVALUE}.regsub("(.*)", \1)}))
運用データ 運用データが表示され、最新のアイテム値が含まれます。
運用データは、トリガーレベルで構成されている場合、テキストマクロとアイテム値マクロの組み合わせにすることができます。 トリガーレベルで運用データが構成されていない場合は、式のすべての項目の最新値が表示されます。
この列は、フィルターの[運用データの表示]で別々にが選択されている場合にのみ表示されます。
継続期間 障害の期間が表示されます。
関連項目:障害の期間
確認済み 障害の確認ステータスが表示されます。
はい - 障害が確認されたことを示す緑色のテキスト。 障害のすべてのイベントが確認された場合、障害は確認されたと見なされます。
いいえ - 未確認のイベントを示す赤いリンク。
リンクをクリックすると障害へのコメントや確認など、問題に対してさまざまなアクションを実行できる障害の更新に移動します。
アクション 障害に関するアクティビティの履歴は、記号アイコンを使用して表示されます:
icon_comment.png - コメントが作成されました。コメントの数も表示されます。
icon_sev_up1.png - 障害の深刻度が増加しました(例:情報→警告)
icon_sev_down1.png - 障害の深刻度が低下しました(例:警告→情報)
icon_severity_back.png - 障害の深刻度は変更されましたが、元のレベルに戻りました(例:警告→情報→警告)
icon_actions.png - アクションが実行されました。アクションの数も表示されます。
icon_actions_progress1.png - アクションが実行されました。少なくとも1つは進行中です。アクションの数も表示されます。
icon_actions_failed.png - アクションが実行されました。少なくとも1つは失敗しました。アクションの数も表示されます。
アイコンの上にマウスを置くと、アクティビティの詳細を示すポップアップが表示されます。実行されたアクションのポップアップで使用されるアイコンの詳細については詳細の表示を参照してください。
タグ (存在する場合)タグが表示されます。
さらに、外部チケットシステムからのタグも表示される場合があります(webhooksを設定する際のプロセスタグオプションを参照)

障害の運用データ

現在の障害の運用データ、つまり障害発生時のアイテム値ではなく最新のアイテム値を表示することができます。

運用データの表示は監視データ障害のフィルターまたはそれぞれのダッシュボードウィジェットの設定で構成できます。 オプションは3つあります。

  • なし - 運用データは表示されません
  • 別々に - 運用データは別の列に表示されます

  • 障害名と一緒に - 運用データは障害名の括弧内に追加されます。トリガー構成で障害データフィールドが空でない場合にのみ運用データが障害名に追加されます。

運用データの内容は[運用データ]フィールドの各トリガーで設定できます。 このフィールドは{ITEM.LASTVALUE<1-9>}マクロを含む任意の文字列を受け入れます。

このフィールドの{ITEM.LASTVALUE<1-9>}は、トリガー式のアイテムの最新の値に常に解決されます。 このフィールドの{ITEM.VALUE<1-9>}は、トリガーステータスの変更(つまり、障害への変更、OKへの変更、ユーザーによる手動でのクローズ、または相関によるクローズ)の時点でアイテム値に解決されます。

負の障害期間

いくつかの状況では障害の解決時間が障害の作成時間よりも早いなど、障害の期間がマイナスになる可能性があります。

例: - If some host is monitored by proxy and a network error happens, leading to no data received from the proxy for a while, the nodata(/host/key) trigger will be fired by the server. When the connection is restored, the server will receive item data from the proxy having a time from the past. Then, the nodata(/host/key) problem will be resolved and it will have a negative problem duration; 一部のホストがプロキシによって監視されていて、ネットワークエラーが発生し、しばらくの間プロキシからデータが受信されない場合、サーバーによってnodata(/host/key)トリガーが起動されます。 接続が回復すると、サーバーは過去の時間を持つプロキシからアイテムデータを受信します。 次にnodata(/host/key)障害が解決され、障害の期間がマイナスになります。 - 障害イベントを解決するアイテムデータがZabbix送信者によって送信され、障害作成時刻より前のタイムスタンプが含まれている場合、負の障害期間が表示されます。

負の障害期間は、特定のトリガーのSLA計算または稼働レポートに影響を与えません。 障害期間を短縮も拡大もしません。

一括編集オプション

リストの下のボタンは、いくつかの一括編集オプションを提供します。

  • 一括更新 - 障害の更新画面に移動して、選択した障害を更新します

このオプションを使用するには、それぞれの障害の前あるにチェックボックスをオンにしてから一括更新ボタンをクリックします。

ボタン

右側のボタンには、次のオプションがあります。

すべてのページコンテンツをCSVファイルにエクスポートします。

すべてのセクション共通の表示モードボタンについては監視データページで説明されています。

フィルタの使用

フィルタを使用して任意の障害のみを表示できます。検索パフォーマンスを向上させるために、データは未解決のマクロで検索されます。

フィルタはテーブルの上にあります。 お気に入りのフィルター設定をタブとして保存しフィルターの上のタブをクリックしてすばやくアクセスできます.

パラメータ 詳細
表示 障害のステータスでフィルタリングします:
最近の障害 - 未解決の障害と最近解決された障害が表示されます(デフォルト)
障害 - 未解決の障害が表示されます
ヒストリ - すべてのヒストリイベントが表示されます
ホストグループ 1つ以上のホストグループでフィルタリングします。
親ホストグループを指定すると、ネストされたすべてのホストグループが暗黙的に選択されます。
ホスト 一つ以上のホスト名でフィルタリングします
トリガー 一つ以上のトリガー名でフィルタリングします
障害 障害名でフィルタリングします。
深刻度 トリガー(障害)の深刻度でフィルターします。
表示期間 指定された表示期間でフィルタリングします。
ホストインベントリ ホストインベントリの種類と値でフィルタリングします。
タグ イベントタグの名前と値でフィルタリングします。特定のタグとタグ値を含めたり除外したりすることができます。いくつかの条件を設定できます。タグ名の照合では常に大文字と小文字が区別されます。
条件ごとに使用できる演算子がいくつかあります。
Exists - 指定されたタグ名を含める
Equals - 指定されたタグ名と値を含める(大文字と小文字を区別)
Contains - タグ値に入力された文字列が含まれる場合に指定されたタグ名を含める(文字列の部分一致、大文字と小文字を区別しない)
Does not exist - 指定されたタグ名を除外する
Does not equal-指定されたタグ名と値を除外する(大文字と小文字を区別)
Does not contain - タグ値に入力された文字列が含まれる指定されたタグ名を除外する(文字列の部分一致、大文字と小文字を区別しない)
条件には2つの計算タイプがあります:
And/Or - すべての条件が満たされる必要があり、同じタグ名を持つ条件はOr条件によってグループ化されます<br >Or - 1つの条件が満たされる
フィルタリングするとタグ表示優先度(以下を参照)リストで上書きされない限り、ここで指定されたタグが障害とともに最初に表示されます。
タグを表示 表示するタグの数を選択します。
なし - 監視データ→障害タグ列を表示しません。
1 - タグ列に1つのタグが表示されます
2 - タグ列には2つのタグが表示されます
3 - タグ列には3つのタグが表示されます
障害のすべてのタグを表示するには、3ドットアイコンの上にマウスを置きます。
タグ名 タグ名の表示モードを選択します。
すべて - タグの名前と値はすべて表示されます
短縮 - タグ名は3つの記号に短縮されます。 タグ値は完全に表示されます
なし - タグ値のみが表示されます。タグ名は表示しません
タグ表示優先度 問題のタグ表示優先度を、タグのコンマ区切りリストとして入力します(例: Services、Applications、Application)。 タグ名のみを使用し、値は使用しないでください。 このリストのタグは常に最初に表示され、アルファベットによる自然順序を上書きします。
運用データの表示 [運用データ]を表示するモードを選択します(#operational_data_of_problems):
なし - 運用データは表示されません
別々に - 運用データは別の列に表示されます
障害名と一緒に - 括弧を使用して問題名に運用データを追加します
メンテナンス中の障害を表示 チェックボックスをオンにすると、ホストのメンテナンスに抑制される(表示されない)障害が表示されます。
コンパクト表示 チェックボックスをオンにすると、コンパクト表示が有効になります。
詳細を表示 チェックボックスをオンにすると障害の根本的なトリガー式が表示されます。 コンパクト表示チェックボックスがマークされている場合は無効になります。
未確認のみ表示 未確認の障害のみを表示するには、チェックボックスをオンにします。
タイムラインを表示 チェックボックスをオンにすると、視覚的なタイムラインとグループ化が表示されます。 コンパクト表示チェックボックスがマークされている場合は無効になります。
行を強調表示 チェックボックスをオンにすると未解決の障害の全行が強調表示されます。障害の深刻度の色は強調表示に使用されます。
標準の青と暗いテーマで[コンパクト表示]チェックボックスがオンになっている場合にのみ有効になります。 行全体を強調表示は高コントラストのテーマでは使用できません。
お気に入りのフィルターのタブ

頻繁に使用するフィルターパラメーターのセットをタブに保存できます。

新しいフィルターパラメーターのセットを保存するには、メインタブを開きフィルター設定を構成してから保存するボタンを押し、ポップアップウィンドウでフィルタープロパティを定義します。

problem_filter0.png

パラメータ 詳細
名前 タブリストに表示するフィルターの名前
レコード数の表示 タブ名の横に障害数を表示するか
時間範囲のカスタマイズ このフィルターセットに特定のデフォルト期間を設定する場合にチェックします。 設定されている場合、フィルター設定を更新することによってのみ、このタブの期間を変更できます。 カスタム期間のないタブの場合、右上隅にある時間選択ボタンを押すことで時間範囲を変更できます(ボタン名は選択した時間間隔によって異なります:今週、過去30分、昨日など)。
このオプションは、[監視データ] → [障害]のフィルターでのみ使用できます。
開始/終了 期間セレクター 絶対(Y-m-d H:i:s)または相対時間構文(now-1d)で開始および終了を設定します。 時間範囲のカスタマイズがチェックされている場合に使用できます。

既存フィルターのフィルタープロパティを編集するには、アクティブなタブ名の横にある歯車の記号を押します。

problem_filter2.png

注:

  • フィルタを非表示にするには現在のタブの名前を押します。フィルターを開くにはアクティブなタブ名をもう一度押します。
  • フィルタタブは、ドラッグアンドドロップで移動できます。
  • キーボードナビゲーションがサポートされています。矢印を使用してタブを切り替え、Enterを押して開きます。
  • 右上隅にある下向き矢印アイコンを押すと、保存されているフィルタータブの完全なリストがドロップダウンメニューとして開きます。

フィルタを共有するには、アクティブなフィルタのURLをコピーして他の人に送信します。 このURLを開くと他のユーザーはこのパラメーターのセットを永続フィルターとしてZabbixアカウントに保存できるようになります。関連項目:ページパラメーター

フィルターのボタン
filter_apply.png 指定されたフィルタリングを(保存せずに)適用します
filter_reset.png 現在のフィルターをリセットし、現在のタブに保存されたパラメーターに戻ります。 メインタブの場合はフィルターがクリアされます。
filter_save_as.png 現在のフィルタリングパラメーターを新しいタブに保存します。 メインタブでのみ使用できます。
filter_update.png タブに保存されているパラメータを現在指定されているパラメータに置き換えます。 メインタブでは使用できません。

イベントメニュー

障害名をクリックするとイベントメニューが表示されます。

イベントメニューでは次のことができます。

  • トリガーの障害をフィルタリングします
  • トリガー設定にアクセスします
  • 基となるアイテムの簡単なグラフ/アイテム履歴にアクセスします
  • 問題の外部チケットにアクセスします(webhooksを設定するときにイベントメニューエントリを含めるオプションを参照してください)
  • グローバルスクリプトを実行します(これらのスクリプトのスコープは手動イベントアクションとして定義されている必要があります)。 この機能は外部システムで障害のあるチケットを管理するために使用されるスクリプトを実行する場合に便利です。

詳細表示

監視データ → 障害の障害開始時刻と復旧時刻のリンクをクリックするとイベントの詳細が開きます。

トリガーと障害イベントで障害の深刻度がどのように異なるかに注意してください。障害イベントは障害の更新 画面を使用して更新されています。

アクションリストでは、アクティビティタイプを示すために次のアイコンが使用されています。

  • icon_generated.png - 障害イベントが生成されました
  • icon_message.png - メッセージが送信されました
  • icon_acknowledged.png - 障害のイベントが確認されました
  • icon_unacknowledged.png - 未確認の問題イベント
  • icon_comment2.png - コメントが追加されました
  • icon_sev_up1.png - 障害の深刻度が高くなりました(例:情報→警告)
  • icon_sev_down1.png - 障害の深刻度が低下しました(例:警告→情報)
  • icon_severity_back.png - 障害の深刻度は変更されましたが、元のレベルに戻りました(例:警告→情報→警告)
  • icon_remote.png - リモートコマンドが実行されました
  • icon_recovery.png - 障害イベントが回復しました
  • icon_closed.png - 障害は手動でクローズされました