Ad Widget

Collapse

Zabbix Agent выборочно не "отдает" данные с хостов.

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • _anton_
    Junior Member
    • Nov 2016
    • 1

    #1

    Zabbix Agent выборочно не "отдает" данные с хостов.

    Добрый день.
    Использую версию Zabbix 3.2.
    Агент установлен более чем на 100 серверах сети с ОС Windows Server 2003, Windows Server 2012 и Linux (Debian, Ubuntu).

    Абсолютное большинство серверов мониторятся без проблем и данные с них приезжают быстро и без ошибок. Однако есть ~5 серверов (Windows) которые висят в мониторинге с ошибкой "Zabbix agent on "HostName" is unreachable for 5 minutes" и эта ошибка постоянно появляется и через какое то время исчезает и такое происходит именно с этими пятью хостами.

    Пробовал менять:
    1. В конфиге агента параметр "Timeout". Увеличивал до 10, 20, 30.
    2. Со стороны zabbix server менял параметр: "Все шаблоны/Template App Zabbix Agent/Элементы данных/Agent ping" - выставлял значение "Интервал обновления" =120.

    К сожалению, эти действия не привели к исчезновению вышеуказанной ошибки.

    Коллеги, куда еще можно капнуть?

    Zabbix в сети я установил меньше месяца назад, поэтому всех тонкостей не знаю...
  • RaddyXD
    Junior Member
    • Mar 2016
    • 12

    #2
    У меня такая же проблема, на всех виндовых хостах.
    Тоже кручу:
    Timeout
    StartAgents

    Ничего не меняется.
    Прилагаю скрин с агента по ЦПУ (для примера).
    В чем может быть проблема?

    Zabbix 3.0.1
    Zabbix Agent 3.0.4
    Attached Files

    Comment

    • sadman
      Senior Member
      • Dec 2010
      • 1611

      #3
      Проблемные элементы данных на данных хостах с типом Zabbix agent (active) или просто Zabbix agent (смотреть в Administration -> Queue ).

      Comment

      • RaddyXD
        Junior Member
        • Mar 2016
        • 12

        #4
        Originally posted by sadman
        Проблемные элементы данных на данных хостах с типом Zabbix agent (active) или просто Zabbix agent (смотреть в Administration -> Queue ).
        В очереди нету ничего. Использую пассивную проверку через агента.

        CPU снимаю через perf_counter[\1848(_Total)\1850]

        Вывод терминала:
        c:\Program Files\Zabbix Agent>zabbix_agentd.exe -t perf_counter[\1848(_Total)\1850]
        perf_counter[\1848(_Total)\1850] [d|37.786861]

        Да и не может такого быть, что бы весь стандартный шаблон был проблемный.
        На текущий момент Agent работает только на одном хосте W2008R2.

        Comment

        • sadman
          Senior Member
          • Dec 2010
          • 1611

          #5
          Originally posted by RaddyXD
          В очереди нету ничего. Использую пассивную проверку через агента.
          Сейчас нет, а когда теряться начинают?

          CPU снимаю через perf_counter[\1848(_Total)\1850]
          Есть умные ОС, которые тупо vCPU отключают, если нагрузки нет. И появляются дырки в графиках. Впрочем, судя по "(_Total)", хоть что-то должно идти.

          Да и не может такого быть, что бы весь стандартный шаблон был проблемный.
          Как будто мы знаем, какой у вас шаблон.

          Совет один пока - включить DebugLevel=4 на агенте и ловить "дырку" на графике. Сверять ее с логом и делать выводы - с perfmon не приходят данные или сервер ничего не запрашивает в эти моменты.

          Comment

          • RaddyXD
            Junior Member
            • Mar 2016
            • 12

            #6
            Originally posted by sadman
            Сейчас нет, а когда теряться начинают?


            Есть умные ОС, которые тупо vCPU отключают, если нагрузки нет. И появляются дырки в графиках. Впрочем, судя по "(_Total)", хоть что-то должно идти.


            Как будто мы знаем, какой у вас шаблон.

            Совет один пока - включить DebugLevel=4 на агенте и ловить "дырку" на графике. Сверять ее с логом и делать выводы - с perfmon не приходят данные или сервер ничего не запрашивает в эти моменты.
            очереди так и не увидел, все по нулям, но отключив все, кроме метрики perf_counter[\1848(_Total)\1850], график стабильно прорисовывается.
            может как-то агент нужно настроить?
            у меня снимается 35 итемов с интервалом 1 мин, всего с 3ех хостов.

            Comment

            • Evgenym
              Junior Member
              • Oct 2016
              • 29

              #7
              Originally posted by RaddyXD
              У меня такая же проблема, на всех виндовых хостах.
              Тоже кручу:
              Timeout
              StartAgents

              Ничего не меняется.
              Прилагаю скрин с агента по ЦПУ (для примера).
              В чем может быть проблема?

              Zabbix 3.0.1
              Zabbix Agent 3.0.4
              У меня один в один график был, когда я пробовал мониторить хосты в другой сети. В итоге проблему решил так:
              1) Поставил в сети Zabbix-прокси и настроил правила на файрволле для обмена с основным сервером
              2) Сократил количество ненужных элементов данных, убрав из низкоуровневого обнаружения создание лишних элементов для каждой службы и сетевых адаптеров, оставив только нужные.
              3) Увеличил таймаут в конфиге сервера
              4) В настройках агентов на хосте убрал имена, оставив только айпишники серверов, с которых можно проводить опрос. После этого очередь упала до единичных значений и графики пошли без разрывов.

              Детали есть в теме https://www.zabbix.com/forum/showthread.php?t=55671

              Comment

              • RaddyXD
                Junior Member
                • Mar 2016
                • 12

                #8
                Originally posted by evgenym
                У меня один в один график был, когда я пробовал мониторить хосты в другой сети. В итоге проблему решил так:
                1) Поставил в сети zabbix-прокси и настроил правила на файрволле для обмена с основным сервером
                2) Сократил количество ненужных элементов данных, убрав из низкоуровневого обнаружения создание лишних элементов для каждой службы и сетевых адаптеров, оставив только нужные.
                3) Увеличил таймаут в конфиге сервера
                4) В настройках агентов на хосте убрал имена, оставив только айпишники серверов, с которых можно проводить опрос. После этого очередь упала до единичных значений и графики пошли без разрывов.

                Детали есть в теме https://www.zabbix.com/forum/showthread.php?t=55671
                спасибо за ответ, буду пробовать.

                Comment

                Working...