Ad Widget

Collapse

падает zabbix_server 1.6.7 с zabbix[queue]

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Hamer13
    Junior Member
    • Oct 2009
    • 28

    #1

    падает zabbix_server 1.6.7 с zabbix[queue]

    при добавлении элемента zabbix[queue] падает один из дочерних процессов zabbix_server по сигналу segfault.

    эксперименты проводим на небольшой домашней системе:
    версия заббикса:
    ZABBIX 1.6.7 (revision 8252)
    Code:
    hamer@zabbix:/var/log/zabbix-server$ uname -a
    Linux zabbix 2.6.26-2-xen-amd64 #1 SMP Thu Nov 5 04:27:12 UTC 2009 x86_64 GNU/Linux
    
    hamer@zabbix:/var/log/zabbix-server$ cat /etc/debian_version
    5.0.3
    
    hamer@zabbix:/var/log/zabbix-server$ psql --version
    psql (PostgreSQL) 8.4.1
    contains support for command-line editing
    
    hamer@zabbix:/var/log/zabbix-server$ free
                 total       used       free     shared    buffers     cached
    Mem:       2097368    1638612     458756          0      92604    1266852
    -/+ buffers/cache:     279156    1818212
    Swap:            0          0          0
    
    hamer@zabbix:/var/log/zabbix-server$ ps -ef f
    UID        PID  PPID  C STIME TTY      STAT   TIME CMD
    root         2     0  0 Nov16 ?        S<     0:00 [kthreadd]
    root         3     2  0 Nov16 ?        S<     0:00  \_ [migration/0]
    root         4     2  0 Nov16 ?        S<     0:00  \_ [ksoftirqd/0]
    root         5     2  0 Nov16 ?        S<     0:00  \_ [watchdog/0]
    root         6     2  0 Nov16 ?        S<     0:01  \_ [events/0]
    root         7     2  0 Nov16 ?        S<     0:00  \_ [khelper]
    root        19     2  0 Nov16 ?        S<     0:00  \_ [xenwatch]
    root        20     2  0 Nov16 ?        S<     0:00  \_ [xenbus]
    root        50     2  0 Nov16 ?        S<     0:00  \_ [kblockd/0]
    root        59     2  0 Nov16 ?        S<     0:00  \_ [ksuspend_usbd]
    root        65     2  0 Nov16 ?        S<     0:00  \_ [khubd]
    root        68     2  0 Nov16 ?        S<     0:00  \_ [kseriod]
    root       100     2  0 Nov16 ?        S      0:00  \_ [pdflush]
    root       101     2  0 Nov16 ?        S      0:00  \_ [pdflush]
    root       102     2  0 Nov16 ?        S<     0:00  \_ [kswapd0]
    root       103     2  0 Nov16 ?        S<     0:00  \_ [aio/0]
    root       228     2  0 Nov16 ?        S<     0:00  \_ [net_accel/0]
    root       520     2  0 Nov16 ?        S<     0:01  \_ [kjournald]
    root      3072     2  0 Nov16 ?        S<     0:00  \_ [cifsoplockd]
    root      3073     2  0 Nov16 ?        S<     0:00  \_ [cifsdnotifyd]
    root      3078     2  0 Nov16 ?        S<     0:00  \_ [cifsd]
    root         1     0  0 Nov16 ?        Ss     0:00 init [2]
    root       596     1  0 Nov16 ?        S<s    0:00 udevd --daemon
    root      1121     1  0 Nov16 ?        Sl     0:00 /usr/sbin/rsyslogd -c3
    root      1135     1  0 Nov16 ?        Ss     0:00 /usr/sbin/sshd
    root      2519  1135  0 Nov16 ?        Ss     0:00  \_ sshd: hamer [priv]
    hamer     2521  2519  0 Nov16 ?        S      0:02  |   \_ sshd: hamer@pts/0
    hamer     2522  2521  0 Nov16 pts/0    Ss     0:00  |       \_ -bash
    hamer    27712  2522  0 19:49 pts/0    S+     0:00  |           \_ tail -f /var/log/syslog
    root     19524  1135  0 18:19 ?        Ss     0:00  \_ sshd: hamer [priv]
    hamer    19527 19524  0 18:19 ?        S      0:00  |   \_ sshd: hamer@pts/1
    hamer    19528 19527  0 18:19 pts/1    Rs     0:00  |       \_ -bash
    hamer    28886 19528  0 20:01 pts/1    R+     0:00  |           \_ ps -ef f
    root     27523  1135  0 19:47 ?        Ss     0:00  \_ sshd: hamer [priv]
    hamer    27526 27523  0 19:47 ?        S      0:00      \_ sshd: hamer@notty
    hamer    27527 27526  0 19:47 ?        Ss     0:00          \_ /usr/lib/openssh/sftp-serve
    postgres  1153     1  0 Nov16 ?        S      0:07 /usr/lib/postgresql/8.4/bin/postgres -D
    postgres  1155  1153  0 Nov16 ?        Ss     0:08  \_ postgres: writer process
    postgres  1156  1153  0 Nov16 ?        Ss     0:03  \_ postgres: wal writer process
    postgres  1157  1153  0 Nov16 ?        Ss     0:00  \_ postgres: autovacuum launcher proce
    postgres  1158  1153  0 Nov16 ?        Ss     0:05  \_ postgres: stats collector process
    postgres 27960  1153  0 19:55 ?        Ss     0:01  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27963  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27965  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27966  1153  0 19:55 ?        Ss     0:01  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27969  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27973  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27976  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27979  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27984  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27988  1153  0 19:55 ?        Ss     0:01  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 27998  1153  0 19:55 ?        Ss     0:01  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 28004  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 28010  1153  0 19:55 ?        Ss     0:01  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 28017  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 28034  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    postgres 28040  1153  0 19:55 ?        Ss     0:00  \_ postgres: zabbix zabbix 127.0.0.1(3
    102       1538     1  0 Nov16 ?        Ss     0:00 /usr/sbin/exim4 -bd -q30m
    root      1576     1  0 Nov16 ?        Ss     0:00 /usr/sbin/cron
    root      1607     1  0 Nov16 hvc0     Ss+    0:00 /sbin/getty -L hvc0 115200 vt100
    zabbix    8011     1  0 00:11 ?        SN     0:00 /usr/sbin/zabbix_agentd
    zabbix    8012  8011  0 00:11 ?        SN     0:25  \_ /usr/sbin/zabbix_agentd
    zabbix    8013  8011  0 00:11 ?        SN     0:16  \_ /usr/sbin/zabbix_agentd
    zabbix    8014  8011  0 00:11 ?        SN     0:16  \_ /usr/sbin/zabbix_agentd
    zabbix    8015  8011  0 00:11 ?        SN     0:16  \_ /usr/sbin/zabbix_agentd
    zabbix    8016  8011  0 00:11 ?        SN     0:16  \_ /usr/sbin/zabbix_agentd
    zabbix    8017  8011  0 00:11 ?        SN     0:16  \_ /usr/sbin/zabbix_agentd
    root     19221     1  0 17:12 ?        Ss     0:00 /usr/sbin/apache2 -k start
    www-data 22933 19221  0 19:00 ?        S      0:03  \_ /usr/sbin/apache2 -k start
    www-data 24076 19221  0 19:07 ?        S      0:02  \_ /usr/sbin/apache2 -k start
    www-data 24560 19221  0 19:10 ?        S      0:02  \_ /usr/sbin/apache2 -k start
    www-data 24561 19221  0 19:10 ?        S      0:01  \_ /usr/sbin/apache2 -k start
    www-data 24869 19221  0 19:12 ?        S      0:01  \_ /usr/sbin/apache2 -k start
    www-data 25436 19221  0 19:16 ?        S      0:03  \_ /usr/sbin/apache2 -k start
    www-data 26664 19221  0 19:42 ?        S      0:00  \_ /usr/sbin/apache2 -k start
    www-data 26734 19221  0 19:42 ?        S      0:00  \_ /usr/sbin/apache2 -k start
    www-data 26735 19221  0 19:42 ?        S      0:00  \_ /usr/sbin/apache2 -k start
    www-data 26900 19221  0 19:43 ?        S      0:00  \_ /usr/sbin/apache2 -k start
    www-data 28868 19221  0 20:00 ?        S      0:00  \_ /usr/sbin/apache2 -k start
    www-data 28869 19221  0 20:00 ?        S      0:00  \_ /usr/sbin/apache2 -k start
    www-data 28870 19221  0 20:00 ?        S      0:00  \_ /usr/sbin/apache2 -k start
    zabbix   27948     1  0 19:55 ?        SN     0:00 /usr/sbin/zabbix_server
    zabbix   27956 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27957 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27958 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27959 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27961 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27962 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27964 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27967 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27972 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27975 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27978 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27983 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27989 27948  0 19:55 ?        SN     0:01  \_ /usr/sbin/zabbix_server
    zabbix   27995 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27999 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   28001 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   28003 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   28011 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   28016 27948  0 19:55 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    Code:
    Параметр 	Значение 	Детали
    ZABBIX сервер запущен 	Да
    Количество узлов сети (контролируется/не контролируется/шаблоны/удалено) 	4 / 2 / 47
    Количество элементов данных (активных/неактивных/не поддерживается)[trapper]	212 / 193 / 0
    Количество триггеров (активированных/деактивированных)[истина/неизвестно/ложь]	80 / 5  [2 / 9 / 69]
    Количество пользователей 	2 	1
    Требуемое быстродействие сервера, новые значения в секунду 	4 	-
    в общем, нагрузка практически никакая.
    zabbix_server.conf родной.

    при падении процесса в сислоге есть сообщение:
    Code:
    Nov 17 19:50:00 zabbix kernel: [72922.268771] zabbix_server[27839]: segfault at 4 ip 42d1db sp 7fff4da2b1d0 error 4 in zabbix_server[400000+66000]
    вот сам процесс запуска-остановки сервера:
    Code:
    hamer@zabbix:/var/log/zabbix-server$ sudo invoke-rc.d zabbix-server start
    Starting Zabbix server: zabbix_server
    
    hamer@zabbix:/var/log/zabbix-server$ ps -ef f | grep zabbix_server
    zabbix   27829     1  0 19:49 ?        SN     0:00 /usr/sbin/zabbix_server
    zabbix   27837 27829  0 19:49 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27838 27829  0 19:49 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27839 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27840 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27842 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27844 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27846 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27848 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27850 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27852 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27854 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27856 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27858 27829 43 19:50 ?        RN     0:01  \_ /usr/sbin/zabbix_server
    zabbix   27860 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27862 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27864 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27866 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27868 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    zabbix   27870 27829  0 19:50 ?        SN     0:00  \_ /usr/sbin/zabbix_server
    
    hamer@zabbix:/var/log/zabbix-server$ sudo invoke-rc.d zabbix-server stop
    Stopping Zabbix server: zabbix_server
    
    hamer@zabbix:/var/log/zabbix-server$ ps -ef f | grep zabbix_server  
    zabbix   27829     1  0 19:49 ?        SN     0:00 /usr/sbin/zabbix_server
    zabbix   27837 27829  0 19:49 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27838 27829  0 19:49 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27839 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27840 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27842 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27844 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27846 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27848 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27850 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27852 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27854 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27856 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27858 27829 31 19:50 ?        ZN     0:03  \_ [zabbix_server] <defunct>
    zabbix   27860 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27862 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27864 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27866 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27868 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    zabbix   27870 27829  0 19:50 ?        ZN     0:00  \_ [zabbix_server] <defunct>
    как видим, почти сразу после запуска один процесс мёртв.

    вот сообщения из лога для процесса zabbix_server[27839]:
    Code:
    hamer@zabbix:/var/log/zabbix-server$ cat zabbix_server_crash2.log | grep 27839
     27839:20091117:194959 server #3 started [Poller. SNMP:YES]
     27839:20091117:194959 In main_poller_loop(type:0,num:3)
     27839:20091117:195000 Query [select oid from pg_type where typname = 'bytea']
     27839:20091117:195000 PostgreSQL Server version: 80401
     27839:20091117:195000 Query [set escape_string_warning to off]
     27839:20091117:195000 In get_values()
     27839:20091117:195000 Query [select i.itemid,i.key_,h.host,h.port,i.delay,i.description,i.nextcheck,i.type,i.snmp_community,i.snmp_oid,h.useip,h.ip,i.history,i.lastvalue,i.prevvalue,i.hostid,h.status,i.value_type,h.errors_from,i.snmp_port,i.delta,i.prevorgvalue,i.lastclock,i.units,i.multiplier,i.snmpv3_securityname,i.snmpv3_securitylevel,i.snmpv3_authpassphrase,i.snmpv3_privpassphrase,i.formula,h.available,i.status,i.trapper_hosts,i.logtimefmt,i.valuemapid,i.delay_flex,h.dns,i.params,i.trends,h.useipmi,h.ipmi_port,h.ipmi_authtype,h.ipmi_privilege,h.ipmi_username,h.ipmi_password,i.ipmi_sensor,i.lastlogsize from hosts h, items i where i.nextcheck<=1258480205 and h.hostid=i.hostid and h.status=0 and i.status in (0,3) and ((h.disable_until<=1258480200 and h.errors_from=0 and i.type in (0,1,4,6)) or i.type in (3,5,8,10,11)) and (h.proxy_hostid=0 or i.type in (5,8)) and mod(i.itemid,5)=2 and i.key_ not in ('status','icmpping','icmppingsec','zabbix[log]') and h.hostid between 000000000000000 and 099999999999999 order by i.nextcheck]
     27839:20091117:195000 In int_in_list(list:,value:10057)
     27839:20091117:195000 End int_in_list(ret:FAIL)
     27839:20091117:195000 In get_value(key:zabbix[queue])
     27839:20091117:195000 In DBget_queue_count()
     27839:20091117:195000 Query [select i.itemid,i.type,i.delay,i.delay_flex,i.lastclock,h.proxy_hostid  from items i,hosts h where i.hostid=h.hostid and h.proxy_hostid=0 and i.status=0 and i.type in (0,7,1,4,6,12,3,5,8,10) and ((h.status=0 and h.available!=2) or (h.status=0 and h.available=2 and h.disable_until<=1258480200)) and not i.key_ like 'status' and not i.key_ like 'icmpping%' and not i.key_ like 'zabbix[log]' and i.value_type not in (2) and i.itemid between 000000000000000 and 099999999999999]
     27839:20091117:195000 In DCvacuum_text()
    Last edited by Hamer13; 17-11-2009, 20:40.
  • costas
    Senior Member
    • Aug 2009
    • 201

    #2
    Подтвержадю, есть такое дело, пришлось отключить данный item.
    CentOS-5.5 i386, Zabbix 1.8.4 (stable), MySQL 5.0.92, PHP 5.2.17 (cli)

    ...эта проверка бесполезная, вредная, и она зло.

    Comment

    • costas
      Senior Member
      • Aug 2009
      • 201

      #3
      pre 1.6.8 build 8326
      [ZBX-1284] fixed server crash if using zabbix[queue] check without dbcache (Sasha)

      спасибо Sasha!
      CentOS-5.5 i386, Zabbix 1.8.4 (stable), MySQL 5.0.92, PHP 5.2.17 (cli)

      ...эта проверка бесполезная, вредная, и она зло.

      Comment

      • Hamer13
        Junior Member
        • Oct 2009
        • 28

        #4
        собрал версию pre-zabbix-1.6.7-8326.tar.gz - работает нормально.
        ещё раз спасибо разработчикам!

        PS. интересно что в логе пишет о чуть более ранней сборке:
        Code:
          3092:20091118:135032 Starting zabbix_server. ZABBIX 1.6.7 (revision 8324).
          3092:20091118:135032 **** Enabled features ****
          3092:20091118:135032 SNMP monitoring:       YES
          3092:20091118:135032 WEB monitoring:        YES
          3092:20091118:135032 Jabber notifications:  YES
          3092:20091118:135032 ODBC:                   NO
          3092:20091118:135032 IPv6 support:          YES
          3092:20091118:135032 **************************

        Comment

        Working...