Ad Widget

Collapse

Пропадает связь с агентом при сложном шаб

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Viewer
    Senior Member
    • Oct 2012
    • 131

    #1

    Пропадает связь с агентом при сложном шаб

    Добрый день!
    Сервер: Opensuse 7.0 + zabbix-mysql-server 3.0.4, виртуальный. Требуемое быстродействие 118.3. На производительность не жалуюсь, по графикам только unreachable pollers часто занят до 80 %, осталньые полеры 30-50%.
    Клиент: WS2012 R2 + zabbix agent 3.0.0 64 bit

    Как только я добавляю сложный шаблон для WSUS c выполнением скриптов PowerShell через userparameter, начинает теряться agent.ping

    На самом сервере загрузку при выполнении PS видно , периодически скачет, но всё же я бы не назвал сервер перегруженным.


    Timeout в конфигурации агента сделал 7 секунд.
    Проверки сделал пасивные.
    В шаблоне таких items, вычисляемых через PS, - оставил 10 штук , увеличил update interval до 12 часов. Т.е. упростил по максимуму.
    В момент когда по графику agent.ping пропадает я пробую с сервера zabbix_get -s server -k agent.ping. Возвращает всегда 1.
    Такие потери agent.ping были и на других серверах с другими шаблонами с Powershell и на версиях заббикса помладше.
    Подскажите как это пофиксить.
  • sadman
    Senior Member
    • Dec 2010
    • 1611

    #2
    Originally posted by Viewer
    Сервер: Opensuse 7.0 + zabbix-mysql-server 3.0.4, виртуальный. Требуемое быстродействие 118.3. На производительность не жалуюсь, по графикам только unreachable pollers часто занят до 80 %, осталньые полеры 30-50%.
    Клиент: WS2012 R2 + zabbix agent 3.0.0 64 bit

    Как только я добавляю сложный шаблон для WSUS c выполнением скриптов PowerShell через userparameter, начинает теряться agent.ping
    ...
    Такие потери agent.ping были и на других серверах с другими шаблонами с Powershell и на версиях заббикса помладше.
    Подскажите как это пофиксить.
    Куда копать не знаю, но чисто для информации с мониторинга моего всуса:

    WSUS Computer groups (135 Items)
    WSUS Info (1 Item)
    WSUS Status (19 Items)
    WSUS Synchronization (4 Items)

    Элементы данных - активный агент Zabbix. Период обновления (в основной массе) - 1800. Таймаут на агенте сразу максимальный поставил, правда. Никаких пропаж не наблюдаю. Так что с вашими десятью айтемами раз в сутки вы вообще никакой нагрузки не создаете.

    Хотя, у меня есть соображение, конечно, что профиль PowerShell-а замусорен и долго грузится, но тогда выпадать должны айтемы свмого PS, а не агента.

    Comment

    • Viewer
      Senior Member
      • Oct 2012
      • 131

      #3
      Originally posted by sadman
      Куда копать не знаю, но чисто для информации .
      Во первых, спасибо за разработанный шаблон!
      Сейчас дискавери ещё не отработало , элементов мало, я и для дискавери увеличил интервал.
      Сделал Unlink and Clear шаблону и присоединил его заново. И это положительно сказалось, agent.ping не пропадает.
      Профиль PS не замусорен, ОС специально ставил только что, чисто для WSUS.
      Я уже наблюдал такой глюк на другом заббиксе и на других клиентах.
      Понаблюдаю завтра , после дискавери.
      Last edited by Viewer; 04-08-2016, 17:02.

      Comment

      • yukra
        Senior Member
        • Apr 2013
        • 1359

        #4
        Originally posted by Viewer
        Timeout в конфигурации агента сделал 7 секунд.
        Всегда можно сделать что-то типа "date ; zabbix_get ... ; date" и "на глаз" оценить сколько требуется на проверку того или иного айтема.

        Originally posted by Viewer
        по графикам только unreachable pollers часто занят до 80 %
        В "общем случае" это не нормально. unreachable должны появляться только в моменты аварии (когда сервер[а] сильно нагружены, внезапно выключились, зависли и тп.) или в результате человеческой ошибки (привязали виндовый шаблок к линукс серверам или наоборот), при "нормальной ситуации" unreachable должно быть примерно равно нулю.

        ну а вообще я в данной теме мимокрокодил.

        Comment

        • Viewer
          Senior Member
          • Oct 2012
          • 131

          #5
          Как только подошло время проверки итемов PS и дискавери (напомню увеличил interval до 12 ч) agent.ping опять стал пропадать.

          Причем из консоли zabbix-get-ом возвращает 1, и значение итемов тоже возвращает, но не быстро, секунд 7-10
          Code:
           # /usr/bin/zabbix_get -s server -k wsus.miner[Get,Info,FullVersion]
          6.3.9600.16384
          .

          Может реально сервер перегружен ? Поборюсь с unreachable items.
          Попробую поиграть количеством поллеров.

          Вот такая у меня картина по поллерам
          Last edited by Viewer; 05-08-2016, 08:24.

          Comment

          • sadman
            Senior Member
            • Dec 2010
            • 1611

            #6
            Originally posted by Viewer
            Причем из консоли zabbix-get-ом возвращает 1, и значение итемов тоже возвращает, но не быстро, секунд 7-10
            Code:
             # /usr/bin/zabbix_get -s server -k wsus.miner[Get,Info,FullVersion]
            6.3.9600.16384
            Я бы не экономил, поставил бы больше 10 сек всяко. Но, вообще, это от хоста WSUS зависит. Потому что с API всё сложно там. Один коннект к локальному всусу из скрипта секунды три может происходить. И потом выборки, которые заставляют WSUS дергать SQL. А ежели всё это в виртуалке с одним VCPU, на плохих винтах и ограниченной памяти... вобщем, может быть всё плачевно. Нужен хороший тюнинг самого хоста.

            Originally posted by Viewer
            Может реально сервер перегружен ? Поборюсь с unreachable items.
            Попробую поиграть количеством поллеров.
            Надо смотреть, что показывает очередь Zabbix, сколько там запаздывающих айтемов и какого типа.

            Comment

            • Viewer
              Senior Member
              • Oct 2012
              • 131

              #7
              Очередь фактически чистая всегда у меня

              Сейчас я увеличил Timeout=15 в конфиге сервера, увеличил unreachable polllers = 15.
              agent.ping от этого сервера сейчас ровный, жду очередной проверки итемов с PS. Предыдущие проверки со вчера так и не получены сервером, элементы пусты.

              Comment

              • sadman
                Senior Member
                • Dec 2010
                • 1611

                #8
                Originally posted by viewer
                agent.ping от этого сервера сейчас ровный, жду очередной проверки итемов с ps. Предыдущие проверки со вчера так и не получены сервером, элементы пусты.
                Так ставьте 600 везде, чего ждать по 12 часов? Ничего такими длинными таймаутами не выиграете. Сначала без дискавери погоняйте, потом его активируйте. Общая статистика отдается более-менее быстро, видимо wsus периодически сам делает её перерасчет. Основной затык может случится только при получении инфы по группам - там начинаются самопальные выборки. Но если у вас не миллион клиентов, то и они сравнительно быстро проходят. У меня где-то 150 клиентов на wsus и времени работы выборок более, чем 10 сек я пока не видел.

                Comment

                • Viewer
                  Senior Member
                  • Oct 2012
                  • 131

                  #9
                  Originally posted by sadman
                  Так ставьте 600 везде, чего ждать по 12 часов?
                  Да просто мне чаще эти данные не нужны. Не хочу плодить паразитную нагрузку. Да и этой проблемкой занимаюсь в фоне остальной работы.
                  Сейчас для теста поменял на 600 секунд у нескольких параметров.

                  Upd.
                  Данные появились , вроде всё ок.
                  По итогу помогло существенное увеличение Timeout и количество полеров, или и то и то.
                  Last edited by Viewer; 05-08-2016, 10:10.

                  Comment

                  Working...