Ad Widget

Collapse

мониторинг за собственными короткими алертами

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • teddy
    Senior Member
    • Dec 2017
    • 234

    #1

    мониторинг за собственными короткими алертами

    Колеги!
    Есть следующая задача.
    1. есть мониторинг логов. если в логе появляется определенное сообщение ( connect success ) - алерт. в тегах - берется из лога IP с которого произошел коннект.
    2. алерты из п.1 автоматически закрываються если длительность "проблемы" больше 24ч.
    3. когда в логе появляется disconnect - создается новый алерт с IP по которому произошло завершение соединения. Через кореляцию закрывается и новый алерт и старый по тегам с одинаковым IP.
    таким образом у нас висят только алерты по которым сейчас есть установленое соединение за последних 24 часа. все они на отдельном дашборде и удобно и хорошо видно.

    Но бывает такая ситуция когда клиент соединяется и через 10 секунд связь обрывается.и так много раз подряд. такое поведений характерно для определенной ошибки - мы знаем как ее лечить. если заметили.
    Беда в том что при такой ошибке на клиентской стороне ничего не происходит - он видит простую сетевую недоступность. так сделан клиентский софт и поменять мы его пока не можем.
    вопрос как на забиксе сделать - если произошло N алертов с определенными тегами за например последний час, каждый из которых был закрыт, но длительность проблемы была не более 1 минуты, то на такое условие сделать отдельный алерт высокого приоритета.
    такое вообще возможно реализовать на забиксе?
    Last edited by teddy; 03-09-2025, 15:10.
  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3404

    #2
    Честно говоря, красивого решения в голову не приходит.
    Именно алерты (т.е. события за определённый период), наверное, можно извлекать при помощи Zabbix API - можно сделать отдельный элемент данных с типом "Script", который будет получать данные (возможно, с зависимыми элементами - сгруппированными по отдельным тегам), а на них уже навешивать свои триггеры с высокой важностью.
    Другой вариант - можно сделать вычисляемый элемент данных (или несколько таких для разных тегов, если набор исходных IP конечен и известен заранее либо может быть сгенерирован через механизм LLD), в формуле которого использовать агрегированные вычисления (ссылка 1, ссылка 2).

    Comment

    Working...