Ad Widget

Collapse

Перестают опрашиваться хосты

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Belfigor
    Member
    • Jul 2016
    • 69

    #1

    Перестают опрашиваться хосты

    Есть хост, у которого следующее количество элементов:
    Applications 25 Items 275 Triggers 225 Graphs 25 Discovery 1
    Элементы опрашиваются примерно раз в 10 минут и реже.
    Опрос идет через userparameter в котором прописана утилита возвращающая значения.
    После добавления хоста и присвоения ему шаблона, по Discovery определяются опрашиваемые параметры и по хосту начинает собираться информация. Но спустя примерно 1-2 дня, опрос прекращается.
    Лог запуска агента выглядит следующим образом:
    Code:
       536:20170814:105834.537 Starting Zabbix Agent [SAS]. Zabbix 3.2.6 (revision 67846).
       536:20170814:105834.538 **** Enabled features ****
       536:20170814:105834.539 IPv6 support:          YES
       536:20170814:105834.540 TLS support:            NO
       536:20170814:105834.541 **************************
       536:20170814:105834.542 using configuration file: C:\Zabbix\zabbix_agentd.win.conf
       536:20170814:105834.545 In init_collector_data()
       536:20170814:105834.546 End of init_collector_data()
       536:20170814:105834.547 In init_perf_collector()
       536:20170814:105834.548 End of init_perf_collector():SUCCEED
       536:20170814:105834.549 agent #0 started [main process]
      9012:20170814:105834.550 agent #1 started [collector]
      9020:20170814:105834.551 agent #2 started[listener #1]
      6348:20170814:105834.551 agent #3 started[listener #2]
     16104:20170814:105834.552 agent #4 started[listener #3]
      8868:20170814:105834.553 agent #5 started [active checks #1]
      9012:20170814:105834.554 In init_cpu_collector()
      8868:20170814:105834.555 In init_active_metrics()
      9012:20170814:105834.556 In get_counter_name() pdhIndex:238
      8868:20170814:105834.557 buffer: first allocation for 100 elements
      8868:20170814:105834.558 End of init_active_metrics()
      8868:20170814:105834.560 In send_buffer() host:'192.168.95.220' port:10051 entries:0/100
      8868:20170814:105834.561 End of send_buffer():SUCCEED
      8868:20170814:105834.562 In refresh_active_checks() host:'192.168.95.220' port:10051
      8868:20170814:105834.565 sending [{"request":"active checks","host":"SAS","host_metadata":"SKS efe6398127928f1b2e9ef3207fb82663"}]
      8868:20170814:105834.566 before read
      8868:20170814:105834.570 got [{"response":"failed","info":"host [SAS] not found"}]
      8868:20170814:105834.571 In parse_list_of_checks()
      8868:20170814:105834.571 no active checks on server [192.168.95.220:10051]: host [SAS] not found
      8868:20170814:105834.572 End of parse_list_of_checks():FAIL
      8868:20170814:105834.573 End of refresh_active_checks():SUCCEED
      8868:20170814:105834.574 In process_active_checks() server:'192.168.95.220' port:10051
      8868:20170814:105834.574 End of process_active_checks()
      8868:20170814:105834.576 In get_min_nextcheck()
      8868:20170814:105834.577 End of get_min_nextcheck():-1
      9012:20170814:105834.927 End of get_counter_name():SUCCEED
      9012:20170814:105834.927 In get_counter_name() pdhIndex:6
      9012:20170814:105834.928 End of get_counter_name():SUCCEED
      9012:20170814:105834.929 In add_perf_counter() counter:'\Процессор(_Total)\% загруженности процессора' interval:900
      9012:20170814:105834.930 add_perf_counter(): PerfCounter '\Процессор(_Total)\% загруженности процессора' successfully added
      9012:20170814:105834.931 End of add_perf_counter(): SUCCEED
      9012:20170814:105834.932 In add_perf_counter() counter:'\Процессор(0)\% загруженности процессора' interval:900
      9012:20170814:105834.933 add_perf_counter(): PerfCounter '\Процессор(0)\% загруженности процессора' successfully added
      9012:20170814:105834.933 End of add_perf_counter(): SUCCEED
      9012:20170814:105834.934 In add_perf_counter() counter:'\Процессор(1)\% загруженности процессора' interval:900
      9012:20170814:105834.935 add_perf_counter(): PerfCounter '\Процессор(1)\% загруженности процессора' successfully added
      9012:20170814:105834.936 End of add_perf_counter(): SUCCEED
      9012:20170814:105834.936 In get_counter_name() pdhIndex:2
      9012:20170814:105834.937 End of get_counter_name():SUCCEED
      9012:20170814:105834.938 In get_counter_name() pdhIndex:44
      9012:20170814:105834.939 End of get_counter_name():SUCCEED
      9012:20170814:105834.939 In add_perf_counter() counter:'\Система\Длина очереди процессора' interval:900
      9012:20170814:105834.943 add_perf_counter(): PerfCounter '\Система\Длина очереди процессора' successfully added
      9012:20170814:105834.944 End of add_perf_counter(): SUCCEED
      9012:20170814:105834.944 End of init_cpu_collector():SUCCEED
      9012:20170814:105834.945 In collect_perfstat()
      9012:20170814:105834.947 End of collect_perfstat()
      8868:20170814:105835.578 In send_buffer() host:'192.168.95.220' port:10051 entries:0/100
      8868:20170814:105835.579 End of send_buffer():SUCCEED
    Далее лог содержит в себе тоглько такие сообщения:
    Code:
     9012:20170814:105835.949 In collect_perfstat()
      9012:20170814:105835.951 End of collect_perfstat()
      8868:20170814:105836.580 In send_buffer() host:'192.168.95.220' port:10051 entries:0/100
      8868:20170814:105836.581 End of send_buffer():SUCCEED
    Если запрашивать инфу с сервера через zabbix_get, то все запрошенные данные приходят в консоль, а в логе появляются следующие сообщения:
    Code:
    9020:20170814:111749.456 Requested [UTMMonitor[10.189.173.11,warningstatus]]
      9012:20170814:111749.999 In collect_perfstat()
      9020:20170814:111750.000 EXECUTE_STR() command:' C:\Zabbix\Utils\UTMMonitor.exe 10.189.173.11 warningstatus' len:2 cmd_result:'OK'
      9012:20170814:111750.001 End of collect_perfstat()
      9020:20170814:111750.002 Sending back [OK]
    Очередь при этом пишет что все ок, в очереди нет ни одного итема.
    Почему такое может быть?
  • yukra
    Senior Member
    • Apr 2013
    • 1359

    #2
    Originally posted by Belfigor
    Очередь при этом пишет что все ок, в очереди нет ни одного итема.
    Почему такое может быть?
    Я как обычно "не силен в винде", но меня слумащает следующее:
    1) [{"response":"failed","info":"host [SAS] not found"}]
    2) "Если запрашивать инфу с сервера через zabbix_get" и при этом в логах у сервера host:'192.168.95.220', а у zabbix-get "10.189.173.11"
    3) Уверенны что вообще туда смотрите? Что в "Lates data" этого хоста? На странице "Настройка - Узлы сети", в колонке "Доступность" что светиться? Есть айтемы типа "icmp-ping" и "agent.ping" для этого хоста?

    Я не уверен что дело именно в этом, но попробуйте во первых в C:\Zabbix\zabbix_agentd.win.conf и в веб интерфейсе указать одинаковое имя (в конфиге это у вас так понимаю "SAS". А во вторых в момент появления проблемы запускать zabbix-get не со своей машины (или что там у вас живет на 10.189.173.11), а запускать zabbix-get именно с машины, на которой установлен zabbix-server. Причем запускать именно так, как это указанно в веб-интерфейсе (либо по ip-адресу, либо по DNS-имени, в зависимости от того, что в настройках).

    ЗЫ: я так понимаю используются пассивные проверки, то есть zabbix-server сам делает запрос к zabbix-agent'у на виндовой машине. При этом нет логов с сервера, нет дампов трафика, а агент вроде как работает. В данном случае кмк искать нужно на zabbix-сервере (или в сети, между zabbix-server'ом и zabbix-agent'ом, может быть в DNS, фаерволе или где-то примерно там).

    Comment

    • Belfigor
      Member
      • Jul 2016
      • 69

      #3
      192.168.95.220 это IP Сервера
      IP агента 192.168.95.34 и он опрашивает по http веб сервис запущенный по адресу 10.189.173.11
      Отсоединение шаблона с очисткой и повторное присоединение помогли. Сейчас инфа собирается, жду какой результат сервер покажет завтра.

      Comment

      Working...