1 障害

概要

Monitoring > Problems では、現在発生している問題を確認できます。 問題とは、"Problem" 状態になっているトリガーのことです。

デフォルトでは、新しい問題はすべて原因問題として分類されます。 特定の問題を、原因問題の症状問題として手動で再分類することもできます。 詳細は、原因イベントと症状イベント を参照してください。

Column Description
Checkbox 問題を選択するためのチェックボックスが表示されます。
チェックボックスの横にあるアイコンの意味は次のとおりです:
icon\_number.png - 原因問題に対する症状イベントの数;
icon\_expand.png - 展開して症状イベントを表示;
icon\_collapse.png - 折りたたんで症状イベントを非表示;
icon\_symptom.png - これは症状イベントです。
Time 問題の開始時刻が表示されます。
Severity 問題の深刻度が表示されます。
問題の深刻度は元々、基となる問題トリガーの深刻度に基づいていますが、イベント発生後は Update problem 画面 で更新できます。問題発生中は、問題の深刻度の色がセルの背景として使用されます。
Recovery time 問題の復旧時刻が表示されます。
Status 問題の状態が表示されます:
Problem - 未解決の問題
Resolved - 最近解決された問題。フィルターを使用して最近解決された問題を非表示にできます。
新しい問題と最近解決された問題は 2 分間点滅します。解決済みの問題は合計 5 分間表示されます。これら 2 つの値は、Administration > General > Trigger displaying options で設定できます。
Info 問題がグローバル相関によって閉じられた場合、または問題の更新時に手動で閉じられた場合は、緑色の情報アイコンが表示されます。アイコンにマウスを重ねると、詳細が表示されます:
info.png
抑制された問題が表示されている場合は、次のアイコンが表示されます(フィルターの Show suppressed problems オプションを参照)。アイコンにマウスを重ねると、詳細が表示されます:
Host 問題のホストが表示されます。
ホスト名をクリックすると、ホストメニュー が表示されます。
Problem 問題名が表示されます。
問題名は、基となる問題トリガーの名前に基づいています。
トリガー名内のマクロは問題発生時に展開され、展開後の値は以後更新されません。
Note 問題名には、最新のアイテム値を表示する 運用データ を追加できます。
問題名をクリックすると、イベントメニュー が表示されます。
問題名の後にある アイコンにマウスを重ねると、トリガーの説明が表示されます(説明が設定されている問題の場合)。
Operational data 最新のアイテム値を含む 運用データ が表示されます。
運用データは、トリガーレベルで設定されている場合、テキストとアイテム値マクロの組み合わせにできます。トリガーレベルで運用データが設定されていない場合は、式に含まれるすべてのアイテムの最新値が表示されます。
この列は、フィルターの Show operational dataSeparately が選択されている場合にのみ表示されます。
Duration 問題の継続時間が表示されます。
参照: 負の問題継続時間
Update Update リンクをクリックすると、問題の更新 画面に移動し、コメントの追加や問題の承認など、問題に対してさまざまな操作を行えます。
Actions 問題に関するアクティビティの履歴が、記号アイコンで表示されます:
icon\_acknowledged\_green.png - 問題は承認済みです。このアイコンは常に最初に表示されます。
icon\_comment.png - コメントが追加されています。コメント数も表示されます。
icon\_sev\_up1.png - 問題の深刻度が上がりました(例: Information > Warning)。
icon\_sev\_down1.png - 問題の深刻度が下がりました(例: Warning > Information)。
icon\_severity\_back.png - 問題の深刻度が変更されましたが、元のレベルに戻りました(例: Warning > Information > Warning)。
icon\_suppression.png - 問題は抑制されています。
icon\_unsuppressed.png - 問題の抑制が解除されています。
icon\_actions.png - アクションが実行されています。アクション数も表示されます。
icon\_actions\_progress1.png - アクションが実行されており、少なくとも 1 つは進行中です。アクション数も表示されます。
icon\_actions\_failed.png - アクションが実行されており、少なくとも 1 つは失敗しています。アクション数も表示されます。
アイコンにマウスを重ねると、アクティビティの詳細を示すポップアップが表示されます。実行されたアクションのポップアップで使用されるアイコンの詳細については、詳細の表示 を参照してください。
Tags タグ が表示されます(存在する場合)。
さらに、外部チケットシステムのタグも表示されることがあります(webhook を設定する際の Process tags オプションを参照)。

障害の運用データ

現在の障害の運用データ、つまり障害発生時のアイテム値ではなく、最新のアイテム値を表示することができます。

運用データの表示は、監視データ > 障害 のフィルタ、または該当するダッシュボードウィジェットの設定で、以下の3つのオプションから選択して設定できます。

  • なし - 運用データは表示されません
  • 別表示 - 運用データが別の列に表示されます

  • 障害名に追加 - 運用データが障害名の後ろに括弧付きで追加されます。 運用データは、トリガー設定の運用データフィールドが空でない場合のみ、障害名に追加されます。

運用データの内容は、各トリガー運用データフィールドで設定できます。 このフィールドには、任意の文字列とマクロを指定できますが、特に重要なのは {ITEM.LASTVALUE<1-9>} マクロです。

このフィールド内の {ITEM.LASTVALUE<1-9>} は、常にトリガー式内のアイテムの最新値に展開されます。 このフィールド内の {ITEM.VALUE<1-9>} は、トリガーの状態が変化した瞬間(**障害**に変化、**正常**に変化、ユーザーによる手動クローズ、または相関によるクローズ)でのアイテム値に展開されます。

障害を手動でクローズしても新しい値は生成されないため、{ITEM.LASTVALUE<1-9>}{ITEM.VALUE<1-9>} の展開値は障害発生時の値のまま表示されることに注意してください。

最大履歴表示期間管理 > 一般設定を参照)よりも前に最新の履歴値が収集されている場合、{ITEM.LASTVALUE<1-9>}{ITEM.VALUE<1-9>} は *UNKNOWN* に展開されます。

負の障害継続時間

実際には、障害の解決時刻が障害の発生時刻よりも早い場合、つまり負の障害継続時間になることが、いくつかの一般的な状況で発生する可能性があります。例えば:

  • あるホストがプロキシによって監視されていて、ネットワークエラーが発生し、しばらくの間プロキシからデータが受信されなくなった場合、nodata(/host/key)トリガーがサーバーによって発火されます。 接続が回復すると、サーバーは過去の時刻を持つアイテムデータをプロキシから受信します。 その後、nodata(/host/key)の障害が解決され、負の障害継続時間となります。
  • 障害イベントを解決するアイテムデータがZabbix senderによって送信され、そのタイムスタンプが障害発生時刻よりも早い場合も、負の障害継続時間が表示されます。

負の障害継続時間は、特定のトリガーのSLA計算可用性レポートには一切影響しません。障害時間を短縮も延長もしません。

一括編集オプション

一覧の下にあるボタンでは、いくつかの一括編集オプションを利用できます。

  • 一括更新 - 問題の更新画面に移動して、選択した問題を更新します

このオプションを使用するには、該当する問題の前にあるチェックボックスをオンにしてから、一括更新ボタンをクリックします。

ボタン

右側のボタンでは、以下のオプションを利用できます。

すべてのページの内容をCSVファイルにエクスポートします。

表示モードのボタンはすべてのセクションで共通のため、監視ページで説明しています。

フィルターの使用

フィルターを使用すると、関心のある問題だけを表示できます。 検索性能を向上させるため、データはマクロが未展開の状態で検索されます。

フィルターは表の上にあります。 お気に入りのフィルター設定はタブとして保存でき、フィルター上部のタブ をクリックしてすばやくアクセスできます。

Parameter Description
Show 問題のステータスでフィルターします:
Recent problems - 未解決の問題と最近解決した問題を表示します(デフォルト)
Problems - 未解決の問題を表示します
History - すべてのイベントの履歴を表示します
Host groups 1つ以上のホストグループでフィルターします。
親ホストグループを指定すると、ネストされたすべてのホストグループが暗黙的に選択されます。
Hosts 1つ以上のホストでフィルターします。
Triggers 1つ以上のトリガーでフィルターします。
Problem 問題名でフィルターします。
Severity トリガー(問題)の深刻度でフィルターします。
Age less than 問題の経過時間でフィルターします。
Show symptoms チェックボックスをオンにすると、症状として分類された問題を個別の行で表示します。
Show suppressed problems チェックボックスをオンにすると、ホストメンテナンスまたは単一の problem suppression により本来は抑制される(表示されない)問題を表示します。
Acknowledgement status すべての問題、未確認の問題のみ、または確認済みの問題のみを表示するようにフィルターします。追加のチェックボックスをオンにすると、あなたが過去に確認した問題を除外します。
Host inventory インベントリの種類と値でフィルターします。
Tags イベントタグ の名前と値でフィルターします。特定のタグおよびタグ値を含めることも除外することもできます。複数の条件を設定できます。タグ名の一致は常に大文字と小文字を区別します。
各条件で使用できる演算子は次のとおりです:
Exists - 指定したタグ名を含める
Equals - 指定したタグ名と値を含める(大文字と小文字を区別)
Contains - タグ値に入力した文字列を含む指定タグ名を含める(部分一致、大文字と小文字を区別しない)
Does not exist - 指定したタグ名を除外する
Does not equal - 指定したタグ名と値を除外する(大文字と小文字を区別)
Does not contain - タグ値に入力した文字列を含む指定タグ名を除外する(部分一致、大文字と小文字を区別しない)
条件の計算タイプは2種類あります:
And/Or - すべての条件を満たす必要があります。同じタグ名を持つ条件は Or 条件でグループ化されます
Or - いずれか1つの条件を満たせば十分です
フィルター適用時、ここで指定したタグは、Tag display priority(以下参照)リストで上書きされない限り、問題とともに最初に表示されます。
Show tags 表示するタグの数を選択します:
None - Monitoring > ProblemsTags 列を表示しません
1 - Tags 列に1つのタグを表示します
2 - Tags 列に2つのタグを表示します
3 - Tags 列に3つのタグを表示します
問題のすべてのタグを表示するには、三点アイコンにマウスを重ねます。
Tag name タグ名の表示モードを選択します:
Full - タグ名と値をすべて表示します
Shortened - タグ名を3文字に短縮し、タグ値はすべて表示します
None - タグ値のみを表示し、名前は表示しません
Tag display priority 問題に対するタグの表示優先順位を、カンマ区切りのタグ一覧として入力します(例: customer,scope,component)。タグ名のみを使用し、値は使用しません。この一覧のタグは、アルファベット順の自然な並び順を上書きして、常に最初に表示されます。
Show operational data 運用データ の表示モードを選択します:
None - 運用データを表示しません
Separately - 運用データを別の列に表示します
With problem name - 運用データを括弧付きで問題名に追加します
Compact view チェックボックスをオンにすると、コンパクト表示を有効にします。
Show details チェックボックスをオンにすると、問題の基になるトリガー式を表示します。Compact view チェックボックスがオンの場合は無効です。
Show timeline チェックボックスをオンにすると、視覚的なタイムラインとグループ化を表示します。Compact view チェックボックスがオンの場合は無効です。
Highlight whole row チェックボックスをオンにすると、未解決の問題の行全体を強調表示します。強調表示には問題の深刻度の色が使用されます。
Highlight whole row は高コントラストテーマでは使用できません。
お気に入りフィルターのタブ

よく使用するフィルター条件のセットは、タブとして保存できます。

新しいフィルター条件のセットを保存するには、メインタブを開いてフィルター設定を行い、Save as ボタンをクリックします。
新しいポップアップウィンドウで、Filter properties を定義します。

problem\_filter0.png

Parameter Description
Name タブ一覧に表示するフィルターの名前。
Show number of records タブ名の横に問題数を表示したい場合にチェックします。
Override time period selector このフィルターセットに特定のデフォルト期間を設定する場合にチェックします。設定すると、このタブの期間はフィルター設定を更新することでのみ変更できます。カスタム期間のないタブでは、右上の時間選択ボタンをクリックして期間を変更できます(ボタン名は選択した時間間隔によって異なります: This week、Last 30 minutes、Yesterday など)。
このオプションは Monitoring > Problems のフィルターでのみ使用できます。
From/To Time period の開始と終了を、絶対時刻構文 (Y-m-d H:i:s) または相対時刻構文 (now-1d) で指定します。Set custom time period がチェックされている場合に使用できます。

保存すると、フィルターは名前付きのフィルタータブとして作成され、すぐに有効になります。

既存のフィルターのフィルター属性を編集するには、アクティブなタブ名の横にある歯車アイコンをクリックします。

problem\_filter2.png

注意:

  • フィルター領域を非表示にするには、現在のタブ名をクリックします。
    フィルター領域を再度開くには、アクティブなタブ名をもう一度クリックします。
  • キーボード操作に対応しています。矢印キーでタブを切り替え、Enter で開きます。
  • フィルターの上にある左右ボタンで、保存済みフィルターを切り替えられます。あるいは、下向きボタンをクリックすると、保存済みフィルターの一覧を含むドロップダウンメニューが開き、必要なものを選択できます。
  • フィルタータブはドラッグ&ドロップで並べ替えできます。
  • 保存済みフィルターの設定が変更されている場合(ただし未保存の場合)、フィルター名の後ろに緑の点が表示されます。
    新しい設定に従ってフィルターを更新するには、Save as ボタンの代わりに表示される Update ボタンをクリックします。
  • 現在のフィルター設定はユーザープロファイルに保存されます。
    ユーザーがページを再度開くと、フィルター設定は同じまま保持されます。

フィルターを共有するには、アクティブなフィルターの URL をコピーして他のユーザーに送信します。
この URL を開くと、他のユーザーはこの条件セットを自分の Zabbix アカウントに永続的なフィルターとして保存できます。
あわせて参照: Page parameters

フィルターのボタン
filter\_apply.png 指定されたフィルタリングを(保存せずに)適用します
filter\_reset.png 現在のフィルターをリセットし、現在のタブに保存されたパラメーターに戻ります。 メインタブの場合はフィルターがクリアされます。
filter\_save\_as.png 現在のフィルタリングパラメーターを新しいタブに保存します。 メインタブでのみ使用できます。
filter\_update.png タブに保存されているパラメータを現在指定されているパラメータに置き換えます。 メインタブでは使用できません。

詳細の表示

Monitoring > Problems における問題発生時刻と復旧時刻はリンクです。
それらをクリックすると、イベントの詳細が表示されます。

問題の深刻度は、トリガーと問題イベントで異なる場合があることに注意してください。これは、Update problem 画面 を使用して問題イベント側で更新されている場合があります。

アクション一覧では、アクティビティの種類を示すために次のアイコンが使用されます。

  • icon\_generated.png - 問題イベントが生成されました。
  • icon\_message.png - メッセージが送信されました。
  • icon\_acknowledged.png - 問題イベントが確認されました。
  • icon\_unacknowledged.png - 問題イベントが未確認です。
  • icon\_comment2.png - コメントが追加されました。
  • icon\_sev\_up1.png - 問題の深刻度が上がりました(例: Information > Warning)。
  • icon\_sev\_down1.png - 問題の深刻度が下がりました(例: Warning > Information)。
  • icon\_severity\_back.png - 問題の深刻度が変更されましたが、元のレベルに戻りました(例: Warning > Information > Warning)。
  • icon\_remote.png - リモートコマンドが実行されました。
  • icon\_recovery.png - 問題イベントが復旧しました。
  • icon\_closed.png - 問題が手動でクローズされました。
  • icon\_suppression.png - 問題が抑制されました。
  • icon\_unsuppressed.png - 問題の抑制が解除されました。
  • icon\_symptom.png - 問題が症状問題に変換されました。
  • icon\_cause.png - 問題が原因問題に変換されました。