Ad Widget

Collapse

После рестарта агента останавливается с&

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • AngelMine
    Junior Member
    • Aug 2011
    • 6

    #1

    После рестарта агента останавливается с&

    После рестарта агента останавливается сбор данных. Правда, не всех. В основном перестают собираться данные, которые получаются на основании пользовательских скриптов. Такие данные как место на диске или загрузка сетевых интерфейсов продолжают исправно собираться. Лечится эта ситуация или путем перезапуска zabbix сервера или где то через час все само восстанавливается. Пользовательские проверки запускаются с интервалом раз в 5 минут.
    Zabbix сервер: 1.9.1
    Zabbix агент: zabbix-agent-1.8.3
  • dima_dm
    Senior Member
    • Dec 2009
    • 2697

    #2
    А Item-ы не переходят в состояние неподдерживаемые?
    Если да, то ответ ниже.
    Администрирование->Общие параметры->Обновлять неподдерживаемые элементы данных (секунды)
    Помните, что скрипты всегда должны возвращать данные (за время Timeout минимальное из настроек zabbix_agentd и zabbix_server) , т.е. не должно быть такого, что скрипт выполнился и ничего не вернул.
    Last edited by dima_dm; 30-08-2011, 12:09.

    Comment

    • AngelMine
      Junior Member
      • Aug 2011
      • 6

      #3
      Не, в состояние неподдерживаемые точно не переходит, все проверки числятся как активные. В параметре “Обновлять неподдерживаемые элементы данных” стоит 600 секунд, что все равно сильно меньше чем самостоятельное восстановление работоспособности после 1 часа.
      При включении режима отладки, в логах видно, что агент активен, но ничего не проверяет.
      30603:20110830:121814.805 In send_buffer() host:'192.168.38.251' port:10051 values:0/100
      30603:20110830:121814.805 End of send_buffer():SUCCEED
      30603:20110830:121814.805 Sleeping for 1 seconds
      Что интересно этот агент обслуживает довольно большое количество пользовательских проверок. Штук 30 наверно. На других компах с агентами, такого вроде не наблюдается. Хотя, может не обращал внимания.
      Может это какая-то фича версии 1.9.1

      Comment

      • dima_dm
        Senior Member
        • Dec 2009
        • 2697

        #4
        А какой тип проверки указывается в Web Интерфейсе Zabbix в Item?
        Zabbix агент или Zabbix агент (активный)

        Comment

        • AngelMine
          Junior Member
          • Aug 2011
          • 6

          #5
          Просто Zabbix агент

          Comment

          • dima_dm
            Senior Member
            • Dec 2009
            • 2697

            #6
            Originally posted by AngelMine
            Просто Zabbix агент
            Тогда вам нужно смотреть не логи агента, а логи Zabbix_Server.
            Приведённая вами выдержка из лога Zabbix_agentd относиться только к Zabbix агент (активный)
            Если есть очередь на Zabbix_Server Администрирование-> Очередь, нужно увеличивать количество Pollers.
            /etc/zabbix/zabbix_server.conf
            StartPollers

            Попробуйте увеличить таймауты для zabbix_agent и zabbix_server
            /etc/zabbix/zabbix_agentd.conf
            Timeout=30
            /etc/zabbix/zabbix_server.conf
            Code:
            ### Option: Timeout
            #       Specifies how long we wait for agent, SNMP device or external check (in seconds).
            #
            # Mandatory: no
            # Range: 1-30
            # Default:
            Timeout=30
            И рестартовать zabbix_agent и zabbix_server
            По умолчанию там 3 сек Timeout

            P.S. Не забываете перезапускать zabbix_agentd и zabbix_server после каждого изменения конфигурации!!!!

            Поищите на https://support.zabbix.com, может есть такой Bug, всё таки алфа версию используете.
            Last edited by dima_dm; 30-08-2011, 16:31.

            Comment

            • AngelMine
              Junior Member
              • Aug 2011
              • 6

              #7
              В нормальном состоянии очереди практически нет. Максимум 5-10 секунд. После рестарта агента, очередь начинает расти и не сдвигается ни на грамм в течение часа. Потом быстренько сама рассасывается. Таймауты ставил разные, ни на что не влияет.
              Как говорил раньше, после рестарта zabbix_server все поднимается моментом примерно за 1 минуту. Все это проявляется независимо от изменения конфигурации. Достаточно просто перезапустить агента, что бы все остановилось.

              Comment

              Working...