Ad Widget

Collapse

Глобальная корреляция событий - объяснит

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • a.tihonov
    Junior Member
    • Oct 2012
    • 24

    #1

    Глобальная корреляция событий - объяснит

    Всем доброго времени суток.
    Не совсем понятно в wiki описана корреляция событий. По правьте меня если я не прав, просто по пробовал, не работает, хочу понять что сделал не так.
    С учетом текущих известных проблем

    Начнем с начала - есть два типа событий
    а) Новое
    б) Старое
    Не нашел что это значит. То есть нет понимания когда событие становится старым.

    Я установил теги на триггер, в моем случае это ICMP пинг. В триггере подключенном к Core Router указан тег ping_core_router, состояние тега {ITEM.LASTVALUE}, которое равно 0 = проблема, 1 = ОК.

    Далее я создал множество триггеров ICMP пинг с разным количеством опросов и временем между опросами. При условии что при падении рутера заббикс всегда в два-три раза быстрее узнает о недоступности оного, чем других объектов (смотри выше про известные проблемы). У этих триггеров свои теги, просто схема зависимостей у меня достаточно сложная, но пока хочу разобраться с глубиной в 1.

    И так собственно правило кореляции

    Если ping_core_router = 0 и (группы хостов), действие - закрыть новое событие.

    Идея данной корреляции в том, что бы при падении рутера, не получать тучу сработавших триггеров. При этом не заморачиваясь с зависимостями на уровне триггеров, что просто кошмарно не удобно при большом количестве хостов.
    И последнее - если действие уже работает, то есть корреляция срабатывает по тегу триггера: это новое событие или старое? Я предполагал что с текущей корреляцией ко мне придет 1 действие о не доступности рутера, а пришло от всех.
  • Delik
    Junior Member
    • Sep 2017
    • 10

    #2
    Проверьте меняется ли значение тега, при переходе в разные состояния.
    У меня не меняется...

    Comment

    • a.tihonov
      Junior Member
      • Oct 2012
      • 24

      #3
      у меня меняется.

      {item.lastvalue} стоит.

      Comment

      • Randomiser86
        Junior Member
        • Nov 2018
        • 4

        #4
        Все привет. Подскажите правильно ли я понял.
        Дано: Распределенная гегорафически сеть (город А к нему звездой подключены остальные локации Б В Г Д).
        Получается в городах Б-Д на роутерах на триггере по недоступности по ICMP в тегах я пишу что то типа {HOST.NAME} ICMP:{ITEM.LASTVALUE}
        потом в глобальной корреляции пишем условия:
        1. Группа узлов "Локация Б"
        2. Значение тега старого события пишем имя тега недоступности роутера = 0
        3. Значение тега нового события пишем имя тега недоступности роутера = 0
        В операциях:
        1.Закрыть новые события
        2. Закрыть старые события (если опрос роутера прошел позже чем оборудование стоящее за ним)

        Мне кажется что будет не корректно работать. При такой корреляции нужно чтобы роутер локации Б не входил в группу "Локация Б" так как тогда его триггер тоже закроет корреляция.

        И не совсем понятно с Значение тега старого/нового события при таком использовании. Когда внутри одного хоста используется корреляция более менее понятно.

        Если можно подскажите как это реализовать грамотно )

        Comment

        Working...