トリガーを設定する前に、問題状態が何であるか、そしてアクションを実行するのにどれだけの時間が必要かを定義する必要があります。その後、潜在的な望ましくない状況を通知するトリガーを設定する方法は2つあります。1つ目は、「アクションを実行するまでの時間」後にシステムが問題状態になると予想される場合にトリガーを発火させる方法です。2つ目は、システムが「アクションを実行するまでの時間」未満で問題状態に到達しそうな場合にトリガーを発火させる方法です。対応するトリガー関数はforecastとtimeleftです。両関数で使用される統計分析は基本的に同じであることに注意してください。どちらの方法でも、ほぼ同じ結果でトリガーを設定できます。

パラメータ

両方の関数はほぼ同じパラメータセットを使用します。参照用にサポートされている関数のリストを使用してください。

時間間隔

まず、Zabbixが予測を行うために分析する履歴期間を指定する必要があります。これは、avg、count、delta、max、min、sum関数と同様に、時間間隔パラメータとオプションの時間シフトを使用して指定します。

予測期間

（forecast のみ）
パラメータ time は、履歴データ内で見つかった依存関係を、Zabbix が将来のどこまで外挿するかを指定します。time_shift を使用するかどうかにかかわらず、time は常に現在時刻を起点としてカウントされます。

到達すべきしきい値

（timeleft のみ）
パラメータ threshold は、解析対象のアイテムが到達しなければならない値を指定します。上側から到達するか下側から到達するかの違いはありません。f(t) が決定されたら（以下を参照）、方程式 f(t) = threshold を解き、現在に最も近く、かつ現在より右側にある根を返す必要があります。そのような根が存在しない場合は 1.7976931348623158E+308 を返します。

アイテムの値がしきい値に近づいた後にそれを横切る場合、 timeleft はその交点はすでに過去にあるとみなし、そのため、存在する場合は threshold レベルとの次の交点に切り替えます。ベストプラクティスとして、予測は通常の障害診断の代替ではなく、補完として使用する必要があります。¹

フィット関数

デフォルトのfitはlinear関数です。しかし、監視対象のシステムがより複雑な場合は、他のオプションを選択することもできます。

`fit`	x = f(t)
linear	x = a + b*t
polynomialN²	x = a~0~ + a~1~t + a~2~t² + ... + a~n~*tⁿ
exponential	x = aexp(bt)
logarithmic	x = a + b*log(t)
power	x = a*t^b

モード

(forecast のみ)
トリガー関数が評価されるたびに、指定された履歴期間のデータを取得し、そのデータに指定された関数を当てはめます。したがって、データがわずかに異なれば、当てはめられる関数もわずかに異なります。単純に将来の指定時刻における当てはめ関数の値を計算するだけでは、現在からその将来時点までの間に、分析対象のアイテムがどのように振る舞うと予想されるかは分かりません。fit の一部のオプション（polynomial など）では、将来の単純な値は誤解を招く可能性があります。

`mode`	forecast の結果
value	f(now + `time`)
max	max~now\ <=\ t\ <=\ now\ +\ `time`~ f(t)
min	min~now\ <=\ t\ <=\ now\ +\ `time`~ f(t)
delta	max - min
avg	定義に従った f(t) の平均値（now <= t <= now + `time`）

詳細

巨大な数値での計算を避けるために、指定された期間の最初の値のタイムスタンプに1nsを加えたものを新しいゼロタイム（現在のエポックタイムは10⁹オーダー、エポックの2乗は10¹⁸、倍精度は約10^-16）とみなします。対数やべき乗近似ではlog(t)の計算が含まれるため、すべての時間値を正にするために1nsを加えます。時間のシフトは線形、多項式、指数（より簡単で正確な計算を除く）には影響しませんが、対数やべき乗関数の形状を変化させます。

起こりうるエラー

関数は以下のような場合に-1を返します:

指定した評価期間にデータが存在しない場合
数学的な演算の結果が定義されていない場合³
数値的な問題（残念ながら、入力データの組み合わせによっては、倍精度浮動小数点形式の範囲や精度が不十分になる場合があります）⁴

選択したフィットが提供されたデータをうまく表現できない場合や、正確な予測に十分なデータがない場合でも、警告やエラーは表示されません。

例とエラーへの対処

ホストのディスク空き容量が不足しそうな場合に警告を受け取るには、次のようなトリガー式を使用できます。

timeleft(/host/vfs.fs.size[/,free],1h,0)<1h

ただし、エラーコード-1が発生し、トリガーが障害状態になる場合があります。一般的には、予測が正しく機能していないことを警告してくれるので良いことですが、なぜそうなったのかを詳しく調べる必要があります。しかし、-1は単に過去1時間以内にホストのディスク空き容量のデータが取得できなかったことを意味する場合もあります。誤検知のアラートが多すぎる場合は、より複雑なトリガー式の使用を検討してください ⁵:

timeleft(/host/vfs.fs.size[/,free],1h,0)<1h and timeleft(/host/vfs.fs.size[/,free],1h,0)<>-1

forecastの場合は少し状況が複雑です。まず、-1がトリガーを障害状態にするかどうかは、forecast(/host/item,(...))<...のような式か、forecast(/host/item,(...))>...のような式かによって異なります。

さらに、アイテム値が負になることが通常であれば、-1は有効な予測値となる場合もあります。しかし、現実の運用ではこのような状況はほとんどありません（演算子=の動作についてはこちらを参照）。したがって、-1を障害とみなしたい場合は... or forecast(/host/item,(...))=-1を、みなしたくない場合は... and forecast(/host/item,(...))<>-1を追加してください。

脚注

¹ 例えば、timeleft(/host/item,1h,X) < 1hのような単純なトリガーは、アイテム値がXに近づくと障害状態になり、値がXに達すると突然復旧する場合があります。問題がアイテム値がX未満である場合は、last(/host/item) < X or timeleft(/host/item,1h,X) < 1hを、アイテム値がXより大きい場合はlast(/host/item) > X or timeleft(/host/item,1h,X) < 1hを使用してください。

² 多項式の次数は1から6まで指定でき、polynomial1はlinearと同じです。ただし、高次の多項式は注意して使用してください。評価期間内のポイント数が多項式係数の決定に必要な数より少ない場合は、多項式の次数が下げられます（例：polynomial5が指定されているがポイントが4つしかない場合、polynomial3が適用されます）。

³ 例えば、exponentialやpower関数のフィッティングでは、アイテム値のlog()計算が必要です。データにゼロや負の値が含まれている場合、log()は正の値にしか定義されていないためエラーになります。

⁴ linear、exponential、logarithmic、powerの各フィットでは、必要な計算をすべて明示的に記述できます。polynomialではvalueのみ追加の手順なしで計算できます。avgの計算には多項式の不定積分（解析的）が必要です。max、min、deltaの計算には多項式の導関数（解析的）とその根の探索（数値的）が必要です。f(t) = 0の解法には多項式の根の探索（数値的）が必要です。

⁵ ただし、この場合-1によってトリガーが障害状態から復旧することがあります。完全に保護したい場合は、timeleft(/host/vfs.fs.size[/,free],1h,0)<1h and ({TRIGGER.VALUE}=0 and timeleft(/host/vfs.fs.size[/,free],1h,0)<>-1 or {TRIGGER.VALUE}=1)を使用してください。

What’s next?

9 文字列関数

Docs

予測トリガー関数

概要

関数