Приветствую.
Недавно сталкнулся с такой проблемой. Не знаю как ее можно решить:
Есть сервер на gentoo c установленным zabbix 1.9.3.
Создан ряд проверок вида proc.num[ssh], proc.num[mysqld], proc.num[syslog-ng], proc.num[apache2] и т.п.
До определенного времени все это работало безотказно, пока не решил добавить еще несколько таких проверок:
proc.num[hddtemp]
proc.num[named]
proc.num[openvpn]
proc.num[rtorrent]
После добавления вышеуказанных проверок Zabbix начал вести себя очень нестабильно, перестал получать данные от агента по каким-то параметрам. По другим параметрам данные получал стабильно.
В логах обнаружидись вот такие ошибки:
8769:20110725:160208.308 In substitute_simple_macros() data:'proc.num[openvpn]'
8769:20110725:160208.308 In substitute_simple_macros() data:NULL
8769:20110725:160208.308 In substitute_simple_macros() data:NULL
8769:20110725:160208.308 Query [txnlev:1] [begin;]
8769:20110725:160208.308 Query [txnlev:1] [update hosts set disable_until=1311595343 where hostid=10066]
8769:20110725:160208.309 Query [txnlev:1] [commit;]
8769:20110725:160208.311 Zabbix host [zabbix]: another network error, wait for 15 seconds
Провел некоторые тесты, чтобы выявить зависимость от количества проверок вида proc.num или привязки к процессам. Но ничего выяснить пока не удалось. Zabbix периодически недополучает данные из-за этой ошибки, но причину появления установить не удалось.
Может кто сталкивался с подобной проблемой?
Недавно сталкнулся с такой проблемой. Не знаю как ее можно решить:
Есть сервер на gentoo c установленным zabbix 1.9.3.
Создан ряд проверок вида proc.num[ssh], proc.num[mysqld], proc.num[syslog-ng], proc.num[apache2] и т.п.
До определенного времени все это работало безотказно, пока не решил добавить еще несколько таких проверок:
proc.num[hddtemp]
proc.num[named]
proc.num[openvpn]
proc.num[rtorrent]
После добавления вышеуказанных проверок Zabbix начал вести себя очень нестабильно, перестал получать данные от агента по каким-то параметрам. По другим параметрам данные получал стабильно.
В логах обнаружидись вот такие ошибки:
8769:20110725:160208.308 In substitute_simple_macros() data:'proc.num[openvpn]'
8769:20110725:160208.308 In substitute_simple_macros() data:NULL
8769:20110725:160208.308 In substitute_simple_macros() data:NULL
8769:20110725:160208.308 Query [txnlev:1] [begin;]
8769:20110725:160208.308 Query [txnlev:1] [update hosts set disable_until=1311595343 where hostid=10066]
8769:20110725:160208.309 Query [txnlev:1] [commit;]
8769:20110725:160208.311 Zabbix host [zabbix]: another network error, wait for 15 seconds
Провел некоторые тесты, чтобы выявить зависимость от количества проверок вида proc.num или привязки к процессам. Но ничего выяснить пока не удалось. Zabbix периодически недополучает данные из-за этой ошибки, но причину появления установить не удалось.
Может кто сталкивался с подобной проблемой?

Comment