при добавлении элемента zabbix[queue] падает один из дочерних процессов zabbix_server по сигналу segfault.
эксперименты проводим на небольшой домашней системе:
версия заббикса:
ZABBIX 1.6.7 (revision 8252)
в общем, нагрузка практически никакая.
zabbix_server.conf родной.
при падении процесса в сислоге есть сообщение:
вот сам процесс запуска-остановки сервера:
как видим, почти сразу после запуска один процесс мёртв.
вот сообщения из лога для процесса zabbix_server[27839]:
эксперименты проводим на небольшой домашней системе:
версия заббикса:
ZABBIX 1.6.7 (revision 8252)
Code:
hamer@zabbix:/var/log/zabbix-server$ uname -a
Linux zabbix 2.6.26-2-xen-amd64 #1 SMP Thu Nov 5 04:27:12 UTC 2009 x86_64 GNU/Linux
hamer@zabbix:/var/log/zabbix-server$ cat /etc/debian_version
5.0.3
hamer@zabbix:/var/log/zabbix-server$ psql --version
psql (PostgreSQL) 8.4.1
contains support for command-line editing
hamer@zabbix:/var/log/zabbix-server$ free
total used free shared buffers cached
Mem: 2097368 1638612 458756 0 92604 1266852
-/+ buffers/cache: 279156 1818212
Swap: 0 0 0
hamer@zabbix:/var/log/zabbix-server$ ps -ef f
UID PID PPID C STIME TTY STAT TIME CMD
root 2 0 0 Nov16 ? S< 0:00 [kthreadd]
root 3 2 0 Nov16 ? S< 0:00 \_ [migration/0]
root 4 2 0 Nov16 ? S< 0:00 \_ [ksoftirqd/0]
root 5 2 0 Nov16 ? S< 0:00 \_ [watchdog/0]
root 6 2 0 Nov16 ? S< 0:01 \_ [events/0]
root 7 2 0 Nov16 ? S< 0:00 \_ [khelper]
root 19 2 0 Nov16 ? S< 0:00 \_ [xenwatch]
root 20 2 0 Nov16 ? S< 0:00 \_ [xenbus]
root 50 2 0 Nov16 ? S< 0:00 \_ [kblockd/0]
root 59 2 0 Nov16 ? S< 0:00 \_ [ksuspend_usbd]
root 65 2 0 Nov16 ? S< 0:00 \_ [khubd]
root 68 2 0 Nov16 ? S< 0:00 \_ [kseriod]
root 100 2 0 Nov16 ? S 0:00 \_ [pdflush]
root 101 2 0 Nov16 ? S 0:00 \_ [pdflush]
root 102 2 0 Nov16 ? S< 0:00 \_ [kswapd0]
root 103 2 0 Nov16 ? S< 0:00 \_ [aio/0]
root 228 2 0 Nov16 ? S< 0:00 \_ [net_accel/0]
root 520 2 0 Nov16 ? S< 0:01 \_ [kjournald]
root 3072 2 0 Nov16 ? S< 0:00 \_ [cifsoplockd]
root 3073 2 0 Nov16 ? S< 0:00 \_ [cifsdnotifyd]
root 3078 2 0 Nov16 ? S< 0:00 \_ [cifsd]
root 1 0 0 Nov16 ? Ss 0:00 init [2]
root 596 1 0 Nov16 ? S<s 0:00 udevd --daemon
root 1121 1 0 Nov16 ? Sl 0:00 /usr/sbin/rsyslogd -c3
root 1135 1 0 Nov16 ? Ss 0:00 /usr/sbin/sshd
root 2519 1135 0 Nov16 ? Ss 0:00 \_ sshd: hamer [priv]
hamer 2521 2519 0 Nov16 ? S 0:02 | \_ sshd: hamer@pts/0
hamer 2522 2521 0 Nov16 pts/0 Ss 0:00 | \_ -bash
hamer 27712 2522 0 19:49 pts/0 S+ 0:00 | \_ tail -f /var/log/syslog
root 19524 1135 0 18:19 ? Ss 0:00 \_ sshd: hamer [priv]
hamer 19527 19524 0 18:19 ? S 0:00 | \_ sshd: hamer@pts/1
hamer 19528 19527 0 18:19 pts/1 Rs 0:00 | \_ -bash
hamer 28886 19528 0 20:01 pts/1 R+ 0:00 | \_ ps -ef f
root 27523 1135 0 19:47 ? Ss 0:00 \_ sshd: hamer [priv]
hamer 27526 27523 0 19:47 ? S 0:00 \_ sshd: hamer@notty
hamer 27527 27526 0 19:47 ? Ss 0:00 \_ /usr/lib/openssh/sftp-serve
postgres 1153 1 0 Nov16 ? S 0:07 /usr/lib/postgresql/8.4/bin/postgres -D
postgres 1155 1153 0 Nov16 ? Ss 0:08 \_ postgres: writer process
postgres 1156 1153 0 Nov16 ? Ss 0:03 \_ postgres: wal writer process
postgres 1157 1153 0 Nov16 ? Ss 0:00 \_ postgres: autovacuum launcher proce
postgres 1158 1153 0 Nov16 ? Ss 0:05 \_ postgres: stats collector process
postgres 27960 1153 0 19:55 ? Ss 0:01 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27963 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27965 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27966 1153 0 19:55 ? Ss 0:01 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27969 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27973 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27976 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27979 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27984 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27988 1153 0 19:55 ? Ss 0:01 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 27998 1153 0 19:55 ? Ss 0:01 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 28004 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 28010 1153 0 19:55 ? Ss 0:01 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 28017 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 28034 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
postgres 28040 1153 0 19:55 ? Ss 0:00 \_ postgres: zabbix zabbix 127.0.0.1(3
102 1538 1 0 Nov16 ? Ss 0:00 /usr/sbin/exim4 -bd -q30m
root 1576 1 0 Nov16 ? Ss 0:00 /usr/sbin/cron
root 1607 1 0 Nov16 hvc0 Ss+ 0:00 /sbin/getty -L hvc0 115200 vt100
zabbix 8011 1 0 00:11 ? SN 0:00 /usr/sbin/zabbix_agentd
zabbix 8012 8011 0 00:11 ? SN 0:25 \_ /usr/sbin/zabbix_agentd
zabbix 8013 8011 0 00:11 ? SN 0:16 \_ /usr/sbin/zabbix_agentd
zabbix 8014 8011 0 00:11 ? SN 0:16 \_ /usr/sbin/zabbix_agentd
zabbix 8015 8011 0 00:11 ? SN 0:16 \_ /usr/sbin/zabbix_agentd
zabbix 8016 8011 0 00:11 ? SN 0:16 \_ /usr/sbin/zabbix_agentd
zabbix 8017 8011 0 00:11 ? SN 0:16 \_ /usr/sbin/zabbix_agentd
root 19221 1 0 17:12 ? Ss 0:00 /usr/sbin/apache2 -k start
www-data 22933 19221 0 19:00 ? S 0:03 \_ /usr/sbin/apache2 -k start
www-data 24076 19221 0 19:07 ? S 0:02 \_ /usr/sbin/apache2 -k start
www-data 24560 19221 0 19:10 ? S 0:02 \_ /usr/sbin/apache2 -k start
www-data 24561 19221 0 19:10 ? S 0:01 \_ /usr/sbin/apache2 -k start
www-data 24869 19221 0 19:12 ? S 0:01 \_ /usr/sbin/apache2 -k start
www-data 25436 19221 0 19:16 ? S 0:03 \_ /usr/sbin/apache2 -k start
www-data 26664 19221 0 19:42 ? S 0:00 \_ /usr/sbin/apache2 -k start
www-data 26734 19221 0 19:42 ? S 0:00 \_ /usr/sbin/apache2 -k start
www-data 26735 19221 0 19:42 ? S 0:00 \_ /usr/sbin/apache2 -k start
www-data 26900 19221 0 19:43 ? S 0:00 \_ /usr/sbin/apache2 -k start
www-data 28868 19221 0 20:00 ? S 0:00 \_ /usr/sbin/apache2 -k start
www-data 28869 19221 0 20:00 ? S 0:00 \_ /usr/sbin/apache2 -k start
www-data 28870 19221 0 20:00 ? S 0:00 \_ /usr/sbin/apache2 -k start
zabbix 27948 1 0 19:55 ? SN 0:00 /usr/sbin/zabbix_server
zabbix 27956 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27957 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27958 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27959 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27961 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27962 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27964 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27967 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27972 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27975 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27978 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27983 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27989 27948 0 19:55 ? SN 0:01 \_ /usr/sbin/zabbix_server
zabbix 27995 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 27999 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 28001 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 28003 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 28011 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
zabbix 28016 27948 0 19:55 ? SN 0:00 \_ /usr/sbin/zabbix_server
Code:
Параметр Значение Детали ZABBIX сервер запущен Да Количество узлов сети (контролируется/не контролируется/шаблоны/удалено) 4 / 2 / 47 Количество элементов данных (активных/неактивных/не поддерживается)[trapper] 212 / 193 / 0 Количество триггеров (активированных/деактивированных)[истина/неизвестно/ложь] 80 / 5 [2 / 9 / 69] Количество пользователей 2 1 Требуемое быстродействие сервера, новые значения в секунду 4 -
zabbix_server.conf родной.
при падении процесса в сислоге есть сообщение:
Code:
Nov 17 19:50:00 zabbix kernel: [72922.268771] zabbix_server[27839]: segfault at 4 ip 42d1db sp 7fff4da2b1d0 error 4 in zabbix_server[400000+66000]
Code:
hamer@zabbix:/var/log/zabbix-server$ sudo invoke-rc.d zabbix-server start Starting Zabbix server: zabbix_server hamer@zabbix:/var/log/zabbix-server$ ps -ef f | grep zabbix_server zabbix 27829 1 0 19:49 ? SN 0:00 /usr/sbin/zabbix_server zabbix 27837 27829 0 19:49 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27838 27829 0 19:49 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27839 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27840 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27842 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27844 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27846 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27848 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27850 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27852 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27854 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27856 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27858 27829 43 19:50 ? RN 0:01 \_ /usr/sbin/zabbix_server zabbix 27860 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27862 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27864 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27866 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27868 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server zabbix 27870 27829 0 19:50 ? SN 0:00 \_ /usr/sbin/zabbix_server hamer@zabbix:/var/log/zabbix-server$ sudo invoke-rc.d zabbix-server stop Stopping Zabbix server: zabbix_server hamer@zabbix:/var/log/zabbix-server$ ps -ef f | grep zabbix_server zabbix 27829 1 0 19:49 ? SN 0:00 /usr/sbin/zabbix_server zabbix 27837 27829 0 19:49 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27838 27829 0 19:49 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27839 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27840 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27842 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27844 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27846 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27848 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27850 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27852 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27854 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27856 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27858 27829 31 19:50 ? ZN 0:03 \_ [zabbix_server] <defunct> zabbix 27860 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27862 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27864 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27866 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27868 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct> zabbix 27870 27829 0 19:50 ? ZN 0:00 \_ [zabbix_server] <defunct>
вот сообщения из лога для процесса zabbix_server[27839]:
Code:
hamer@zabbix:/var/log/zabbix-server$ cat zabbix_server_crash2.log | grep 27839
27839:20091117:194959 server #3 started [Poller. SNMP:YES]
27839:20091117:194959 In main_poller_loop(type:0,num:3)
27839:20091117:195000 Query [select oid from pg_type where typname = 'bytea']
27839:20091117:195000 PostgreSQL Server version: 80401
27839:20091117:195000 Query [set escape_string_warning to off]
27839:20091117:195000 In get_values()
27839:20091117:195000 Query [select i.itemid,i.key_,h.host,h.port,i.delay,i.description,i.nextcheck,i.type,i.snmp_community,i.snmp_oid,h.useip,h.ip,i.history,i.lastvalue,i.prevvalue,i.hostid,h.status,i.value_type,h.errors_from,i.snmp_port,i.delta,i.prevorgvalue,i.lastclock,i.units,i.multiplier,i.snmpv3_securityname,i.snmpv3_securitylevel,i.snmpv3_authpassphrase,i.snmpv3_privpassphrase,i.formula,h.available,i.status,i.trapper_hosts,i.logtimefmt,i.valuemapid,i.delay_flex,h.dns,i.params,i.trends,h.useipmi,h.ipmi_port,h.ipmi_authtype,h.ipmi_privilege,h.ipmi_username,h.ipmi_password,i.ipmi_sensor,i.lastlogsize from hosts h, items i where i.nextcheck<=1258480205 and h.hostid=i.hostid and h.status=0 and i.status in (0,3) and ((h.disable_until<=1258480200 and h.errors_from=0 and i.type in (0,1,4,6)) or i.type in (3,5,8,10,11)) and (h.proxy_hostid=0 or i.type in (5,8)) and mod(i.itemid,5)=2 and i.key_ not in ('status','icmpping','icmppingsec','zabbix[log]') and h.hostid between 000000000000000 and 099999999999999 order by i.nextcheck]
27839:20091117:195000 In int_in_list(list:,value:10057)
27839:20091117:195000 End int_in_list(ret:FAIL)
27839:20091117:195000 In get_value(key:zabbix[queue])
27839:20091117:195000 In DBget_queue_count()
27839:20091117:195000 Query [select i.itemid,i.type,i.delay,i.delay_flex,i.lastclock,h.proxy_hostid from items i,hosts h where i.hostid=h.hostid and h.proxy_hostid=0 and i.status=0 and i.type in (0,7,1,4,6,12,3,5,8,10) and ((h.status=0 and h.available!=2) or (h.status=0 and h.available=2 and h.disable_until<=1258480200)) and not i.key_ like 'status' and not i.key_ like 'icmpping%' and not i.key_ like 'zabbix[log]' and i.value_type not in (2) and i.itemid between 000000000000000 and 099999999999999]
27839:20091117:195000 In DCvacuum_text()
Comment