Ad Widget

Collapse

Некорректная работа Uptime.

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Steal
    Member
    • May 2020
    • 44

    #1

    Некорректная работа Uptime.

    Добрый день, форумчане. Подскажите, может кто сталкивался с чем-то подобным. Есть элемент данных system.uptime[sysUpTime.0] с OID 1.3.6.1.2.1.1.3.0. и триггер к этому элементу, отслеживающий перезагрузку сервера. Всё было бы хорошо, вот только время uptime какое-то рандомное. Бывает сервер работает и всё ок, а uptime показывает 8 минут. А бывает после перезагрузки остаётся 250 дней. В чём может быть причина?
  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3404

    #2
    Может быть несколько причин.

    1) надо посмотреть интервал опроса. Если окажется, что Zabbix опрашивает устройство, скажем, раз в 10 минут, то логично, что первые минуты после рестарта будут "светиться" ещё старые данные (от предыдущего опроса).

    2) на многих устройствах по этому OID-у находится 32-битный счётчик. Со временем он просто переполняется, и триггер, срабатывающий на условие "значение < 10 минут", выстреливает.
    Мы у себя из-за этого модифицировали условие триггера следующим образом:
    Code:
    {Template Module Generic SNMP:system.uptime[sysUpTime.0].last()}<10m and {Template Module Generic SNMP:system.uptime[sysUpTime.0].max(11m)}<42949072
    Если одно из предыдущих значений (за последние 11 минут) было больше чем 42949072 - это признак того, что обнуление произошло не из-за перезагрузки устройства, а из-за переполнения счётчика.

    3) наконец, не все устройства поддерживают данный счётчик корректно. Некоторые сбрасывают его, например, при обновлении конфигурации или рестарте SNMP-демона (хотя не должны). Но это уже зависит от конкретной прошивки.

    Comment


    • Steal
      Steal commented
      Editing a comment
      Спасибо за ответ. 1 вариант не подходит ( опрос каждую минуту). Третий проверю. А пока попробую второй вариант. Отпишу, если поможет
  • Steal
    Member
    • May 2020
    • 44

    #3
    Сервер перезагрузили, а Uptime не обнулился.... Может OID не тот... Сервер HPE 350 Gen9

    Comment

    • Kos
      Senior Member
      Zabbix Certified SpecialistZabbix Certified Professional
      • Aug 2015
      • 3404

      #4
      А что за операционка там опрашивается? Или это менеджмент-интерфейс, независимый от операционки (какой-нибудь iLO, например)?

      Comment


      • Steal
        Steal commented
        Editing a comment
        Операционка Windows Server 2012-2016.Опрос по SNMP, iLO так же опрашивается, но оно не даёт информацию о перезагрузке сервера
    • Kos
      Senior Member
      Zabbix Certified SpecialistZabbix Certified Professional
      • Aug 2015
      • 3404

      #5
      Пожалуйста, не надо комментировать чужие реплики, отвечайте отдельным сообщением!

      Операционка Windows Server 2012-2016.Опрос по SNMP, iLO так же опрашивается, но оно не даёт информацию о перезагрузке сервера
      А команда snmpwalk или snmpget, выданная с той же машины, где крутится сервер Zabbix, возвращает такой же некорректный результат?
      Если да - то Zabbix тут вообще ни при чём, все вопросы к реализации демона SMNP под Windows Server.
      Но мне кажется, что мониторить Windows-сервер по SNMP - это не самый удачный вариант. Через агента Zabbix получается гораздо надёжней и гибче.

      Comment

      • Steal
        Member
        • May 2020
        • 44

        #6
        Originally posted by Kos
        Пожалуйста, не надо комментировать чужие реплики, отвечайте отдельным сообщением!


        А команда snmpwalk или snmpget, выданная с той же машины, где крутится сервер Zabbix, возвращает такой же некорректный результат?
        Если да - то Zabbix тут вообще ни при чём, все вопросы к реализации демона SMNP под Windows Server.
        Но мне кажется, что мониторить Windows-сервер по SNMP - это не самый удачный вариант. Через агента Zabbix получается гораздо надёжней и гибче.
        А поподробнее? Zabibx агент разве сможет получить корректную информацию?
        Last edited by Steal; 27-01-2021, 14:42.

        Comment

        • Kos
          Senior Member
          Zabbix Certified SpecialistZabbix Certified Professional
          • Aug 2015
          • 3404

          #7
          Originally posted by Steal
          А поподробнее? Zabibx агент разве сможет получить корректную информацию?
          Подробнее о чём - об агенте Zabbix? Это достаточно нормально описано в документации - общие положения тут, а параметры, которые он умеет собирать, - тут (а для Windows - ещё и тут).
          В частности, параметр system.uptime (см. вторую ссылку) собирается достаточно надёжно - за годы работы проблем с ним не было.

          Comment

          Working...