5 Ескалације

Преглед

Ескалацијом можете креирати прилагођене сценарије за слање обавештења или извршавање удаљених команди.

У практичном смислу, то значи да:

  • Корисници могу бити одмах обавештени о новим проблемима.
  • Обавештења се могу понављати док се проблем не реши.
  • Слање обавештења може бити одложено.
  • Обавештења се могу ескалирати другој "вишој" корисничкој групи.
  • Даљинске команде могу бити извршене одмах или када проблем није решен дужи период.

Акције се ескалирају на основу корака ескалације. Сваки корак има временско трајање.

Можете дефинисати и подразумевано трајање и прилагођено трајање појединачног корака. Минимално трајање једног корака ескалације је 60 секунди.

Акције, као што су слање обавештења или извршавање команди, можете покренути из било ког корака. Први корак је за тренутне акције. Ако желите да одложите акцију, можете је доделити каснијем кораку. За сваки корак, може се дефинисати неколико акција.

Број корака ескалације није ограничен.

Ескалације се дефинишу приликом конфигурисања операције. Ескалације су подржане само за проблематичне операције, не и за опоравак.

Разни аспекти понашања ескалације

Размотримо шта се дешава у различитим околностима ако акција садржи неколико корака ескалације.

Situation Behavior
Дотични домаћин прелази на одржавање након што је послато почетно обавештење о проблему У зависности од подешавања Паузирај операције за потиснуте проблеме у акцији конфигурација, сви преостали кораци ескалације се извршавају или са кашњењем узрокованим периодом одржавања или без одлагања. Период одржавања не отказује операције.
Временски период дефинисан у услову акције Временски период завршава се након слања почетног обавештења Сви преостали кораци ескалације се извршавају. Услов Временски период не може зауставити операције; има утицај на то када су акције покренуте/не покренуте, а не на операције.
Проблем почиње током одржавања и наставља се (не решава се) након завршетка одржавања У зависности од подешавања Паузирај операције за потиснуте проблеме у акцији configuration, сви кораци ескалације се извршавају или од тренутка завршетка одржавања или одмах.
Проблем почиње током одржавања без података и наставља се (не решава се) након завршетка одржавања Мора да сачека да се окидач активира, пре него што се изврше сви кораци ескалације.
Различите ескалације следе у блиском низу и преклапају се Извршавање сваке нове ескалације замењује претходну ескалацију, али за најмање један корак ескалације који се увек извршава на претходној ескалацији. Ово понашање је релевантно у акцијама на догађаје који се креирају са СВАКОМ проценом проблема окидача.
Током ескалације у току (као што је слање поруке), на основу било које врсте догађаја:
- радња је онемогућена
На основу догађаја окидача:
- окидач је онемогућен
- домаћин или ставка су онемогућени
На основу интерног догађаја о окидачима:
- окидач је онемогућен
На основу интерног догађаја о ставкама/правилима откривања ниског нивоа:
- ставка је онемогућена
- домаћин је онемогућен
Порука у току се шаље, а затим се шаље још једна порука о ескалацији. Порука за праћење ће имати текст отказивања на почетку тела поруке (НАПОМЕНА: Ескалација отказана) са навођењем разлога (на пример, НАПОМЕНА: Ескалација отказана: радња '<Action name>' онемогућена). На овај начин прималац је обавештен да је ескалација отказана и да се више неће извршавати кораци. Ова порука се шаље свима који су претходно примили обавештења. Разлог отказивања се такође бележи у датотеку дневника сервера (почевши од Debug Level 3=Warning).

Имајте на уму да се порука Ескалација отказана такође шаље ако су операције завршене, али су операције опоравка конфигурисане и још нису извршене.
Током ескалације у току (као што је слање поруке), радња се брише Више се не шаљу поруке. Информације се бележе у датотеку дневника сервера (почевши од Debug Level 3=Warning), на пример: escalation canceled: action id:334 deleted

Примери ескалације

Пример 1

Слање поновљеног обавештења сваких 30 минута (укупно 5 пута) у групу "MySQL администратори". Да бисте конфигурисали:

  • На картици Операције подесите Подразумевано трајање корака операције на "30m" (30 минута).
  • Подесите ескалацију Кораци да буде од "1" до "5".
  • Изаберите групу "MySQL администратори" као примаоце поруке.

Обавештења ће бити послата у 0:00, 0:30, 1:00, 1:30, 2:00 сата након проблем почиње (осим ако се, наравно, проблем не реши раније).

Ако је проблем решен и конфигурисана порука за опоравак, биће бити послате онима који су примили барем једну поруку о проблему у оквиру овога сценарио ескалације.

Ако је окидач који је генерисао активну ескалацију онемогућен, Zabbix шаље информативну поруку о томе свима онима који већ су примили обавештења.

Пример 2

Слање одложеног обавештења о дуготрајном проблему. То конфигурисати:

  • На картици Операције подесите Подразумевано трајање корака операције на "10h" (10 сати).
  • Подесите ескалацију Кораци да буде од "2" до "2".

Обавештење ће бити послато само у кораку 2 сценарија ескалације, или 10 сати након што проблем почне.

Можете прилагодити текст поруке на нешто попут "Проблем је стар више од 10 сати".

Пример 3

Ескалација проблема на шефа.

У првом примеру изнад смо конфигурисали периодично слање порука за MySQL администраторе. У овом случају, администратори ће добити четири поруке пре проблема ће бити прослеђене менаџеру базе података. Имајте на уму да ће менаџер добити поруку само у случају да проблем није још увек признато, наводно нико на томе не ради.

Детаљи операције 2:

Обратите пажњу на употребу макроа {ESC.HISTORY} у прилагођеној поруци. Макро ће садржати информације о свим претходно извршеним корацима на овоме ескалације, као што су послата обавештења и извршене команде.

Пример 4

Сложенији сценарио. Након више порука MySQL администраторима и ескалације менаџеру, Zabbix ће покушати да поново покрене MySQL база података. То ће се десити ако проблем постоји 2:30 сата и то није признато.

Ако проблем и даље постоји, након још 30 минута Zabbix ће послати а порука свим гостујућим корисницима.

Ако ово не помогне, након још сат времена Zabbix ће поново покренути сервер са MySQL базу података (друга удаљена команда) користећи IPMI команде.

Пример 5

Ескалација са неколико операција додељених једном кораку и прилагођено коришћени интервали. Подразумевано трајање корака операције је 30 минута.

Обавештења ће бити послата на следећи начин:

  • MySQL администраторима у 0:00, 0:30, 1:00, 1:30 након што проблем почне.
  • Менаџеру базе података у 2:00 и 2:10. (а не у 3:00; видећи да се кораци 5 и 6 преклапају са следећом операцијом, краће трајање прилагођеног корака од 10 минута у следећој операцији замењује дуже трајање корака од 1 сата које сте покушали да подесите овде).
  • Zabbix администраторима у 2:00, 2:10, 2:20 након што проблем почне (прилагођено трајање корака од 10 минута). – Гостујућим корисницима у 4:00 сата након почетка проблема (подразумевано трајање корака од 30 минута враћа се између корака 8 и 11).