PDA

View Full Version : Очень прошу помочь-вопрос к програмисам zabbix


sergeyfromkomi
15-06-2010, 07:51
Добрый день ув. программисты zabbix, на вопрос ответить наверно сможите только вы...
понимаю что у вас и без дурацких вопросов времени нет... но всё же я надеюсь...
после примерно месяца стабильной работы zabbix, в событиях стали появляться состояния "НЕИЗВЕСТНО". Такие состояния связаны только с одним узлом проверяемым по ВНЕШНЕМУ СКРИПТУ...(bgp.check).Есть и другие хосты используемые этот скрипт. Скрипт печатает на стандартный вывод "0"-если bgp сессия в норме и печатает "1"-если bgp сессия "упала"...
В логах zabbix-a видно, что в то время как хост "словил" состояние "НЕИЗВЕСТНО":

36211:20100613:213838.374 Deleted 4148 records from history and trends
36201:20100613:215920.285 Item [BGP_RTKOM:bgp.check []] error: Script /usr/local/etc/zabbix/externalscripts/bgp.check returned nothing.
36201:20100613:215920.285 Parameter [BGP_RTKOM:bgp.check []] is not supported by agent Old status [0]
36201:20100613:215920.285 [Z3005] Query failed: [2006] MySQL server has gone away [begin;]
36201:20100613:215920.285 [Z3005] Query failed: [2006] MySQL server has gone away [select t.triggerid,i.itemid from triggers t,functions f,items i where t.t
36201:20100613:215920.285 Database is down. Retrying in 10 seconds
36217:20100613:220120.780 Parameter [24677][BGP_RTKOM:bgp.check []] became supported by agent
36211:20100613:223938.397 Executing housekeeper
36211:20100613:223942.704 Deleted 4154 records from history and trends
36211:20100613:234042.726 Executing housekeeper

zabbix(1.8.1) говорит, что скрипт ничего не вернул... хотя совершено точно, что скрипт по прежнему выполняется верно и на терминал выводился "0"(состояние Ок) т.к сам скрипт пишет в отдельный файл всё что он(скрип) выводит на терминал...и в этом файле видно, что всё это время значения "приходили" нормально...
Почему zabbix внезапно перестаёт видеть значения скрипта...?

costas
15-06-2010, 07:58
Если фрагмент лога приведён как раз по месту ошибки, то там ясно написанно, что у Вас проверка не может пройти, так как запрошенный итем не поддерживается, ибо у Вас сервер БД Zabbix падает.

З.Ы. программисты тут не причём.

sergeyfromkomi
15-06-2010, 08:20
Если фрагмент лога приведён как раз по месту ошибки, то там ясно написанно, что у Вас проверка не может пройти, так как запрошенный итем не поддерживается, ибо у Вас сервер БД zabbix падает.

З.Ы. программисты тут не причём.
Почему сообщения о БД идут в последнюю очередь...? Вопрос к программистам тогда другой - Почему падает БД..?

costas
15-06-2010, 09:04
Почему сообщения о БД идут в последнюю очередь...? Вопрос к программистам тогда другой - Почему падает БД..?
ммм, вопрос наверно к программистам БД MySQL, программисты Zabbix не занимаются разработкой БД MySQL...

А БД падать может в случае не правильной настройки или вообще отсутвии таковой.

sergeyfromkomi
15-06-2010, 09:37
ммм, вопрос наверно к программистам БД MySQL, программисты Zabbix не занимаются разработкой БД MySQL...

А БД падать может в случае не правильной настройки или вообще отсутвии таковой.
с чего вдруг Mysql падает....?) вот эта тема наводит на мысли что проблема может быть не единична...
http://www.zabbix.com/forum/showthread.php?t=17430
по каким критериям оценивать правильно ли настроена бд...? На этом же mysql работает БД cacti -с ней проблем не возникает

costas
15-06-2010, 11:24
с чего вдруг Mysql падает....?) вот эта тема наводит на мысли что проблема может быть не единична...
http://www.zabbix.com/forum/showthread.php?t=17430
по каким критериям оценивать правильно ли настроена бд...? На этом же mysql работает БД cacti -с ней проблем не возникает
я думаю Вы врят ли найдёте ответы на свои вопросы, для начала выложите логи MySQL, конфигурацию хардварного сервера, конфигурацию MySQL/Zabbix-server, для порядку ещё выкладывают статистику по кол-ву собираемой информации, ну и не забыть про ОСь + версии пакетов. Иначе разговор безпредметный, а телепатов тут нет.

dotneft
15-06-2010, 16:10
от пользователя zabbix эта же команда запускается нормально?

sergeyfromkomi
16-06-2010, 07:37
от пользователя zabbix эта же команда запускается нормально?
да нормально... для проверки я дописал скрипт так что когда его запускает zabbix скрипт по мимо того что он выдаёт на терминал "0" или "1" эти данные сохраняются в отдельный файл...т.е то что zabbix получил на терминал я могу посмотреть в файле..
сейчас я хочу подготовить более полную информацию и выложить на форум..

sergeyfromkomi
16-06-2010, 09:45
я думаю Вы врят ли найдёте ответы на свои вопросы, для начала выложите логи MySQL, конфигурацию хардварного сервера, конфигурацию MySQL/Zabbix-server, для порядку ещё выкладывают статистику по кол-ву собираемой информации, ну и не забыть про ОСь + версии пакетов. Иначе разговор безпредметный, а телепатов тут нет.
в "mybsd2.localhost.txt(.err)" есть пугающая информация...(100615 17:24:55 InnoDB: error clustered record for sec rec not found
)
хотя:
analyze table history_uint ;
+---------------------+---------+----------+----------+
| Table | Op | Msg_type | Msg_text |
+---------------------+---------+----------+----------+
| zabbix.history_uint | analyze | status | OK |
+---------------------+---------+----------+----------+
1 row in set (0.26 sec)
конфигурацию хардварного сервера:
CPU: Intel(R) Pentium(R) D CPU 2.80GHz (2800.12-MHz 686-class CPU)
Origin = "GenuineIntel" Id = 0xf47 Stepping = 7
Features=0xbfebfbff<FPU,VME,DE,PSE,TSC,MSR,PAE,MCE,CX8,APIC,SEP,MTRR,P GE,MCA,CMOV,PAT,PSE36,CLFLUSH,DTS,ACPI,MMX,FXSR,SS E,SSE2,SS,HTT,TM,PBE>
Features2=0x641d<SSE3,DTES64,MON,DS_CPL,CNXT-ID,CX16,xTPR>
AMD Features=0x20100000<NX,LM>
AMD Features2=0x1<LAHF>
TSC: P-state invariant
real memory = 4294967296 (4096 MB)
avail memory = 3673214976 (3503 MB)
ACPI APIC Table: <A M I OEMAPIC >
FreeBSD/SMP: Multiprocessor System Detected: 2 CPUs
FreeBSD/SMP: 1 package(s) x 2 core(s)
cpu0 (BSP): APIC ID: 0
cpu1 (AP): APIC ID: 1

# df -h
Filesystem Size Used Avail Capacity Mounted on
/dev/ad0s1a 496M 201M 255M 44% /
devfs 1.0K 1.0K 0B 100% /dev
/dev/ad0s1e 496M 352K 456M 0% /tmp
/dev/ad0s1f 442G 404G 2.2G 99% /usr
/dev/ad0s1d 4.3G 1.1G 2.9G 27% /var

статистика по кол-ву собираемой информации:
php5-5.3.2
php5-mysql-5.3.2
mysql-server-5.0.90
apache-2.0.63_3
zabbix-frontend-1.8.1,2
zabbix-server-1.8.1,2

весь мониторинг: примерно 70 хостов, только по icmp
мониторинг 2-ух bgp сессий с cisco
динамику изменений 365 дней2944

den_crane
16-06-2010, 10:36
mysql не падает наверно, просто перестает отвечать, и заббикс по таймауту считает что бд легла. Почему перестает, смотрите в мускуль, может у вас своппинг в этот момент, может сетевые проблемы (заббикс сервер и мускуль на одном хосте?), а может диск уходит в себя и мускуль замирает. В общем top покажет.

sergeyfromkomi
16-06-2010, 12:50
mysql не падает наверно, просто перестает отвечать, и заббикс по таймауту считает что бд легла. Почему перестает, смотрите в мускуль, может у вас своппинг в этот момент, может сетевые проблемы (заббикс сервер и мускуль на одном хосте?), а может диск уходит в себя и мускуль замирает. В общем top покажет.
Да - заббикс сервер и мускуль на одном хосте. Можно ли увеличить время таймаута в забиксе?

den_crane
16-06-2010, 14:35
Да - заббикс сервер и мускуль на одном хосте. Можно ли увеличить время таймаута в забиксе?
нафига его увеличивать?
смотрите dmesg /var/log/messages лог мускуля, разберитесь на чем там система спотыкается