Ad Widget

Collapse

Перезагрузка, Unknown и ложные срабатывания

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Arsen Azgaldov
    Junior Member
    • Feb 2016
    • 13

    #1

    Перезагрузка, Unknown и ложные срабатывания

    Уважаемые, подскажите чайнику...

    Очень упрощенно: Zabbix 3.0. Есть 3 триггера:

    Потеря ping: {Host:agent.ping.last()}=0
    Своб. место на C: {Hosterf_counter[\236(C\410].avg(300)}<5
    Утилизация CPU: {Hosterf_counter[\238(*)\6].avg(300)}>95

    При перезагрузке сервера от всех 3-х прилетают оповещения со статусом Unknown. А хотелось бы, чтобы прилетало только на упавший пинг или, допустим, обнуленный uptime, а остальные два - видели, что пинга нет и не дергались понапрасну (или хотя бы не слали оповещений).

    Сначала думал настроить через зависимости (от пинга), но сходу не вышло. Да и в мануале написано, что узлы должны быть разные. Та же хрень, когда сервак сильно нагружен. Например, ночью, когда идут бэкапы, ставятся обновы, сканирует антивирь - статус постоянно меняется с Unknown на OK и обратно, прилетает куча ложных сообщений, что отнюдь не доставляет. Как от них избавиться? Думал настроить часы работы/интервалы, но тогда можно пропустить момент, когда сервак действительно упадет.

    В реальности триггеров и серверов куда больше. Поэтому проблема приобретает угрожающий характер. Наставьте на путь истинный - куда копать? Уверен, что есть какое-то решение...
  • sadman
    Senior Member
    • Dec 2010
    • 1611

    #2
    Может быть стоит использовать важность триггера (trigger.severity) и в Action отсеивать но ней?

    И когда возникает статус "Unknown"? Смотрю вот почту от своего Zabbix-а - только PROBLEM и OK в письмах.

    Comment

    • Arsen Azgaldov
      Junior Member
      • Feb 2016
      • 13

      #3
      Вот только что заребутил тестовую машинку и тут же получил на почту три алерта:

      Trigger name: Ping lost!
      Expression: {VDI-032:agent.ping.last()}=0
      State: Unknown

      Trigger name: VDI-032: На диске C: осталось меньше 1 GB свободного места
      Expression: {VDI-032erf_counter[\236(C\410].avg(300)}<5
      State: Unknown

      Trigger name: VDI-032: Утилизация CPU >95% за последние 5 мин.
      Expression: {VDI-032erf_counter[\238(*)\6].avg(300)}>95
      State: Unknown

      Сам удивляюсь, откуда берутся эти анноуны. Где-то читал, что от них избавились еще в ранних версиях Zabbix-а... Дескать, остались только Problem и OK. С другой стороны, как не верить своим глазам? Вот же он - тут как тут.

      Насчет важности триггера - мысль интересная, надо попробовать...

      Comment

      • Arsen Azgaldov
        Junior Member
        • Feb 2016
        • 13

        #4
        Кстати, вот еще что заметил. При перезагрузке статус меняется не OK/Problem, а Normal/Unknown.
        Также происходит во время повышенной загруженности хоста.
        Last edited by Arsen Azgaldov; 19-02-2016, 16:00.

        Comment

        • Arsen Azgaldov
          Junior Member
          • Feb 2016
          • 13

          #5
          Cо статусами Unknown/Normal разобрался. Оказывается, помимо триггеров, существуют внутренние источники событий. По умолчанию их 3. Тут все подробно описано: https://www.zabbix.com/documentation...supported_item
          Как грится, RTFM )
          Last edited by Arsen Azgaldov; 20-02-2016, 10:20.

          Comment

          Working...