Ad Widget

Collapse

Медленный ответ от двух агентов

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • ingtar
    Junior Member
    • Aug 2014
    • 3

    #1

    Медленный ответ от двух агентов

    Добрый день!
    Столкнулся с непонятной историей:
    Мониторинг порядка 1000 хостов, железные сервера и виртуалки + сетевое оборудование + Веб-чеки. Все нормально, но на двух агентах заббикс-агенты недоступны.
    При запросе из консоли zabbix_get выдает с них значения, но с задержкой.
    На одном задержка стабильно 5 секунд, на втором 20.
    Для первого:
    time zabbix_get -s problem_host1 -k agent.version
    2.2.4
    real 0m5.006s
    user 0m0.002s
    sys 0m0.001s

    Для второго:
    time zabbix_get -s problem_host2 -k agent.version
    1.8.18
    real 0m20.065s
    user 0m0.002s
    sys 0m0.002s

    Если с первым смог совладать, увеличив тайм аут ожидания ответа в настроках сервера до 6 секунд, то для второго увеличение до 21 как-то выглядит странно
    Оба эти хоста - виртуалки (CentOS 6.3, OpenVZ), на разныx серверах виртуализации, в разных сетях. На соседних машинах все ок.
    Если просто подключаться телнетом на порт - то при запросе сразу параметра, он ожидает какое-то время и отдает его.
    Если подключиться, подождать и запросить - отдаст мгновенно.
    Подключиться с хоста к агенту и снять strace я не смог - подключался к каждому процессу агента и на запрос он ничего не показывал. Возможно не так делаю
    Если кто-то сталкивался с таким - просьба помочь с решением проблемы
    Last edited by ingtar; 21-08-2014, 10:33.
  • yukra
    Senior Member
    • Apr 2013
    • 1359

    #2
    Стопаем агенг на проблемном хосте, запускаем как strace /etc/init.d/zabbix-agent start, вникаем в проблему. Перед этим желательно временно выключить все запросы от мониторинга к агенту, а то потонете в выводе.

    Перед straceом я бы проверил время (ну так, на свякий случай), корректность настройки DNS (с обратными зонами) и хотя бы iptables, а так же посмотрел бы в лог агента при loglevel = 4

    Comment

    • ableev
      Senior Member
      Zabbix Certified Specialist
      • Oct 2012
      • 276

      #3
      И в какую проблему вы хотите вникнуть таким образом?
      Дебажить init скрипт (на баше) агента через strace?

      ingtar, советую выставить логирование агента в дебаг-режим: DebugLevel в конфиге агента.
      Далее: StartAgents в конфиге выставить в 1.
      Перезапустить агента, и уже strace'ом цепляться к воркерам (не основному процессу) и смотреть, на чём затыкается.
      Code:
      zabbix   22574  0.0  0.0  48564  1048 ?        S    08:20   0:00 /usr/bin/zabbix_agentd --config /etc/zabbix_agentd.conf
      zabbix   22575  0.0  0.0  48564  1280 ?        S    08:20   0:00  \_ /usr/bin/zabbix_agentd: collector [idle 1 sec]
      zabbix   22576  0.0  0.0  48564   908 ?        S    08:20   0:00  \_ /usr/bin/zabbix_agentd: listener #1 [waiting for connection]

      Comment

      • yukra
        Senior Member
        • Apr 2013
        • 1359

        #4
        Originally posted by ableev
        И в какую проблему вы хотите вникнуть таким образом?
        Дебажить init скрипт (на баше) агента через strace?
        Да, косяк, нужно strace -f /etc/init.d/zabbix-agent start

        Comment

        • ingtar
          Junior Member
          • Aug 2014
          • 3

          #5
          ableev,yukra:
          выставил StartAgents=1, снял стрейс и нашел проблему
          Тайм-аут ДНС.
          Спасибо за помощь!

          Comment

          Working...