Ad Widget

Collapse

Зависло состояние problem

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • docent
    Junior Member
    • Oct 2010
    • 26

    #1

    Зависло состояние problem

    У меня уже на двух компьютерах Zabbix давно показывает состояние "has just been restarted". Пробовал перезапускать компьютеры - не помогает.
    На сервере установлен Zabbix 1.8.10, на клиентах установлены 1.8.3 и 1.8.11.
    Всего у меня мониторится около двух десятков разнообразных серверов и только на двух из них такая беда. Единстенное, на что я пока грешу, так это то, что оба эти сервера - виртуалки под OpenVZ.
    На одном сервере # uptime
    14:30:51 up 15 days, 22:07, 1 user, load average: 0.01, 0.00, 0.00
    На втором # uptime
    14:31:09 up 10 days, 3:27, 2 users, load average: 0.00, 0.00, 0.00
    Last edited by docent; 31-03-2014, 11:30.
  • dima_dm
    Senior Member
    • Dec 2009
    • 2697

    #2
    Смотрите system.uptime, который приходит через zabbix_agent.

    Comment

    • docent
      Junior Member
      • Oct 2010
      • 26

      #3
      Originally posted by dima_dm
      Смотрите system.uptime, который приходит через zabbix_agent.
      Code:
      root@zabbix:~# zabbix_get -V
      Zabbix Get v1.8.10 (revision 24303) (28 December 2011)
      Compilation time: Feb 16 2012 16:10:28
      root@zabbix:~# zabbix_get -s 10.1.7.18 -k system.uptime
      0
      root@zabbix:~# ssh 10.1.7.18 zabbix_agent -V
      [email protected]'s password:
      Zabbix Agent v1.8.11 (revision 26205) (20 March 2012)
      Compilation time: Apr  1 2012 11:37:49
      root@zabbix:~# ssh 10.1.7.18 zabbix_agentd -V
      [email protected]'s password:
      Zabbix Agent (daemon) v1.8.11 (revision 26205) (20 March 2012)
      Compilation time: Apr  1 2012 11:37:49
      root@zabbix:~# ssh 10.1.7.18 uptime
      [email protected]'s password:
       14:49:50 up 11 days,  3:45,  1 user,  load average: 0.00, 0.00, 0.00
      В этом то и вся проблема, что агент заббикса почему-то возвращает нулевое значение system.uptime

      Comment

      • dima_dm
        Senior Member
        • Dec 2009
        • 2697

        #4
        Originally posted by docent
        В этом то и вся проблема, что агент заббикса почему-то возвращает нулевое значение system.uptime
        А zabbix_agent Вы сами собирали или готовый взяли?

        Comment

        • docent
          Junior Member
          • Oct 2010
          • 26

          #5
          Originally posted by dima_dm
          А zabbix_agent Вы сами собирали или готовый взяли?
          На обоих компьютерах стояла версия 1.8.3 из дистрибутива Ubuntu 11.04. Потом я на одном из компьютеров собрал сам из tar'а версию 1.8.11. Но все равно на обоих показывает по нулям.

          Comment

          • zarbazan
            Junior Member
            • Mar 2012
            • 9

            #6
            У меня та же проблема. Использую взятый на сайте AIX 5.3 Agent 1.8.7, версия сервера 1.8.10. Причем вначале uptime триггер работал нормально. Потом, после 248 дней и скольких-то часов, начал выдавать 0. При этом для сервера с uptime 110 дней он по-прежнему работает. 248 дней == 21427200 секунд, цифра сильно напоминает максимальное целое 2,147,483,647

            Comment

            • docent
              Junior Member
              • Oct 2010
              • 26

              #7
              Но у меня даже на хосте на котором крутятся эти виртуалки аптайм всего 39 дней.

              Comment

              • zarbazan
                Junior Member
                • Mar 2012
                • 9

                #8
                Originally posted by docent
                Но у меня даже на хосте на котором крутятся эти виртуалки аптайм всего 39 дней.
                И для линукса, и для AIX uptime.c (zabbix) использует системный вызов sysinfo. Тот же вызов используется командой uptime.

                Для проверки в линуксе можно скомпилировать

                #include <sys/sysinfo.h>
                struct sysinfo info;
                sysinfo(&info);
                printf("Uptime = %d\n",info.uptime);

                и посмотреть что он дает, этот же метод использует zabbix

                У меня на AIX серверах нет компилятора, так что проверить не могу

                Comment

                • zarbazan
                  Junior Member
                  • Mar 2012
                  • 9

                  #9
                  Похоже, у AIX вообще проблемы с аптаймом более 248. Нашел несколько статей, похоже это баг в AIX, не в Zabbix:

                  ...On dumps where the system has been up for over 248 days, the stat command will report a negative value for age of system...

                  Вот это интересно. Мой триггер перестал работать после 248 дней с хвостиком - скорее всего, половины от 497

                  497 - The number of the IT beast

                  Comment

                  • docent
                    Junior Member
                    • Oct 2010
                    • 26

                    #10
                    Originally posted by zarbazan
                    И для линукса, и для AIX uptime.c (zabbix) использует системный вызов sysinfo. Тот же вызов используется командой uptime.

                    Для проверки в линуксе можно скомпилировать

                    #include <sys/sysinfo.h>
                    struct sysinfo info;
                    sysinfo(&info);
                    printf("Uptime = %d\n",info.uptime);

                    и посмотреть что он дает, этот же метод использует zabbix

                    У меня на AIX серверах нет компилятора, так что проверить не могу
                    похоже, что у OpenVZ действительно проблемы с библиотекой:
                    Code:
                    root@prepo:~/work/uptime# cat ut.c
                    #include <stdio.h>
                    #include <sys/sysinfo.h>
                    
                    main()
                    {
                    struct sysinfo info;
                        sysinfo(&info);
                        printf("Uptime = %ld\n",info.uptime);
                    }
                    root@prepo:~/work/uptime# ./ut
                    Uptime = 0
                    root@prepo:~/work/uptime# uptime
                     07:57:43 up 11 days, 20:53,  2 users,  load average: 0.00, 0.00, 0.00
                    Может кто-нибудь проверить на своих виртуалках под OpenVZ?

                    Comment

                    • zarbazan
                      Junior Member
                      • Mar 2012
                      • 9

                      #11
                      Originally posted by docent
                      похоже, что у OpenVZ действительно проблемы с библиотекой...
                      Может кто-нибудь проверить на своих виртуалках под OpenVZ?
                      Погуглил из любопытства:

                      The bugged sysinfo() call in OpenVZ hosts running Kernel 2.6.32+

                      Comment

                      Working...