Ad Widget

Collapse

Обнуление system.uptime на 249 день

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • viconstg
    Junior Member
    • May 2011
    • 8

    #1

    Обнуление system.uptime на 249 день

    Здравствуйте.

    После 248 дней 13 ч. 12 мин. 13 сек. работы значение system.uptime, возвращаемое агентом версии 1.8.2 серверу версии 1.8.3 с хоста на AIX обнулилось (см. график). Несложный подсчет показывает, что время соответствует 2^31 сотых долей секунды. Это действительно обусловлено ограниченным размером данных? Или у меня какие-то неполадки с агентом?

    Буду благодарен за совет, как это исправить.
    Attached Files
    Last edited by viconstg; 31-05-2011, 15:12.
  • oalex
    Member
    • Jul 2009
    • 86

    #2
    аналогичная картина наблюдалась с аптаймом роутеров, предположил, что ограничение значений

    Comment

    • viconstg
      Junior Member
      • May 2011
      • 8

      #3
      Если так, то лучше бы уж аптайм в секундах выражался, а не в сотых -- все таки в 100 раз интервал увеличивался бы. Может, в более поздних версиях агента это реализовано?

      Comment

      • dima_dm
        Senior Member
        • Dec 2009
        • 2697

        #4
        Originally posted by viconstg
        Если так, то лучше бы уж аптайм в секундах выражался, а не в сотых -- все таки в 100 раз интервал увеличивался бы. Может, в более поздних версиях агента это реализовано?
        Если вы говорите про system.uptime, то он возвращает значение в секундах http://www.zabbix.com/documentation/...l/config/items
        Zabbix Agent берёт значение счётчика с системы. Так например на Red Hat Enterprise Linux таких проблем нет, у меня есть системы которые по 5 лет не перезагружались, и всё отображается корректно.
        А у вас, скорее всего, происходит переполнение системного счётчика типа signed long 4 байта (32 бита) допустимый диапазон значений от -2147483648 до 2147483647
        Last edited by dima_dm; 31-05-2011, 14:35.

        Comment

        • viconstg
          Junior Member
          • May 2011
          • 8

          #5
          Originally posted by dima_dm
          Если вы говорите про system.uptime, то он возвращает значение в секундах http://www.zabbix.com/documentation/...l/config/items
          Я знаю, что возвращает он в секундах, но где-то читал, что внутреннее его представление -- в сотых (правда, сейчас не могу этот пост снова найти).

          Originally posted by dima_dm
          А у вас, скорее всего, происходит переполнение системного счётчика типа signed long 4 байта (32 бита) допустимый диапазон значений от -2147483648 до 2147483647
          Если бы значение uptime выражалось в секундах, то до этого порога было бы еще далеко...

          Попытался получить значение uptime через zabbix_get -- возвращает пустую строку. Что бы это могло значить?

          Comment

          • dima_dm
            Senior Member
            • Dec 2009
            • 2697

            #6
            Originally posted by viconstg
            Если бы значение uptime выражалось в секундах, то до этого порога было бы еще далеко...
            А если в сотых долях, то в самый раз. Например в Cisco IOS так и есть, и счётчик (sysUpTimeInstance 1.3.6.1.2.1.1.3.0) каждые 249 дней переполняется. Хотя по команде show ver, время uptime корректно отображается. Поэтому я и написал, про внутренний системный счётчик.
            Originally posted by viconstg
            Попытался получить значение uptime через zabbix_get -- возвращает пустую строку. Что бы это могло значить?
            Скорее всего IP с которого делается запрос не прописан в списке разрешённых
            /etc/zabbix/zabbix_agentd.conf
            Server=IP_Zabbix_Server,127.0.0.1
            Last edited by dima_dm; 31-05-2011, 19:29.

            Comment

            • viconstg
              Junior Member
              • May 2011
              • 8

              #7
              Originally posted by dima_dm
              А если в сотых долях, то в самый раз. Например в Cisco IOS так и есть, и счётчик (sysUpTimeInstance 1.3.6.1.2.1.1.3.0) каждые 249 дней переполняется. Хотя по команде show ver, время uptime корректно отображается. Поэтому я и написал, про внутренний системный счётчик.
              dima_dm, а не могли бы Вы поподробнее о том, как это исправить (и возможно ли)? Вы имеете в виду, что это внутренний системный счетчик AIX'a?

              Originally posted by dima_dm
              Скорее всего IP с которого делается запрос не прописан в списке разрешённых
              /etc/zabbix/zabbix_agentd.conf
              Server=IP_Zabbix_Server,127.0.0.1
              Послал тот же запрос с Zabbix-сервера -- в ответ получил не пустую строку, а 0...

              Comment

              • NikLok
                Junior Member
                • Feb 2011
                • 10

                #8
                Originally posted by dima_dm
                Так например на Red Hat Enterprise Linux таких проблем нет, у меня есть системы которые по 5 лет не перезагружались, и всё отображается корректно.
                Я извиняюсь, не совсем по теме, но поражен до глубины души! Скажите а как Вы проверяете корректность файловой системы в течении этих 5 лет. Принудительно размонтируете их и выполняете проверку. Я наверное по своему малому опыту предпочитаю раз в полгода перезагрузить сервер для выполнения автоматической полной проверки файловых систем (заодно и память всякая чистится). И опять же смежный вопрос. На сервере есть программные raid-ы. Какие средства есть в Zabbix для контроля их состояния (число ошибок, восстановление ) да и просто контроль smart дисков?!

                Comment

                • dima_dm
                  Senior Member
                  • Dec 2009
                  • 2697

                  #9
                  Originally posted by NikLok
                  Я извиняюсь, не совсем по теме, но поражен до глубины души! Скажите а как Вы проверяете корректность файловой системы в течении этих 5 лет. Принудительно размонтируете их и выполняете проверку. Я наверное по своему малому опыту предпочитаю раз в полгода перезагрузить сервер для выполнения автоматической полной проверки файловых систем (заодно и память всякая чистится). И опять же смежный вопрос. На сервере есть программные raid-ы. Какие средства есть в Zabbix для контроля их состояния (число ошибок, восстановление ) да и просто контроль smart дисков?!
                  На серверах аппаратные RAID контроллеры, диски горячей замены т.е. перезагрузка не нужна. А если система не падает, приложение не сбоит, то и целостность файловой системы не нарушается.
                  А программные raid-ы и статистика по дискам собирается так.

                  Статус Smart дисков можно получить через
                  Утилиту
                  /usr/sbin/smartctl -a /dev/sda
                  Last edited by dima_dm; 02-06-2011, 13:23.

                  Comment

                  • zalex_ua
                    Senior Member
                    Zabbix Certified Trainer
                    Zabbix Certified SpecialistZabbix Certified Professional
                    • Oct 2009
                    • 1286

                    #10
                    Originally posted by NikLok
                    Какие средства есть в Zabbix для контроля их состояния (число ошибок, восстановление ) да и просто контроль smart дисков?!
                    Originally posted by dima_dm
                    Статус Smart дисков можно получить через
                    Утилиту
                    /usr/sbin/smartctl -a /dev/sda
                    Заканчиваю допиливать шаблон (застрял на вылизывании интеллекта триггеров). Но он у меня под версию 2.0 ориентирован, так как я живу на транке и там в сейчас не работает экспорт.
                    Когда я его доделаю, то сообщу на форуме отдельной темой.
                    Решение есть универсальным и для мониторинга винтов по Виндовсом.

                    Предусмотрено и выполнение проверок поерхности по расписаниям и контроль их результатов, проверка журналов ошибок СМАРТ.

                    От использования демона smartd входящего в комплект к smartmontools после чтения горы информации и долгих мучений я отказался и решил реализовывать весь интеллект на стороне заббикс сервера.
                    Это пока фрагмент.
                    Click image for larger version

Name:	smart.jpg
Views:	1
Size:	75.5 KB
ID:	309563

                    Comment

                    • viconstg
                      Junior Member
                      • May 2011
                      • 8

                      #11
                      История имела логичное продолжение: на 498-й день Заббикс вновь стал отсчитывать uptime сервера, правда, начав с нуля (то есть значение uptime снова вернулось в пределы допустимых значений того 4-байтного внутреннего счетчика, о котором писал Dima_dm). Думаю, что это все же внутреннее представление значения uptime в Заббикс-агенте под AIX
                      Last edited by viconstg; 16-11-2011, 08:45.

                      Comment

                      • dima_dm
                        Senior Member
                        • Dec 2009
                        • 2697

                        #12
                        Originally posted by viconstg
                        Думаю, что это все же внутреннее представление значения uptime в Заббикс-агенте под AIX
                        Мне кажеться, что это маловероятно. Чтобы не гадать, вы можете посмотреть в коде агента как получается uptime в системе и посмотреть как определены переменные в агенте.

                        Comment

                        Working...