Ad Widget

Collapse

Разрывы в графиках с локального агента

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • DRVTiny
    Senior Member
    • Sep 2011
    • 162

    #1

    Разрывы в графиках с локального агента

    Есть zabbix-proxy, вроде бы совсем не перегруженный, большую часть времени загрузка процессора в пределах 30%, загрузка памяти - 20-25%.
    При этом через данный proxy мониторится и сам localhost, на котором он работает.

    Так вот, в графиках этого хоста - очень приличных масштабов разрывы (по полчаса и даже больше иногда). На графиках обычных, не локально установленных, агентов - совершенно аналогичные разрывы.
    Все агенты работают в активном режиме.

    В логах агента на прокси-сервере - сообщения о невозможности соединиться с этим самым прокси-сервером, то есть о невозможности установить соединение в рамках loopback-интерфейса!
    Code:
      1402:20140804:174655.467 active check data upload to [192.168.78.18:10051] started to fail ([connect] cannot connect to [[192.168.78.18]:10051]: [111] Connection refused)
      1402:20140804:174745.510 active check configuration update from [192.168.78.18:10051] started to fail (cannot connect to [[192.168.78.18]:10051]: [111] Connection refused)
      1402:20140804:174840.945 active check data upload to [192.168.78.18:10051] is working again
      1402:20140804:174855.946 active check data upload to [192.168.78.18:10051] started to fail ([connect] cannot connect to [[192.168.78.18]:10051]: [4] Interrupted system call)
    В чём может быть загвоздка?

    Прим: прокси-сервер мониторит 798 хостов, 76000 значений, на 50% из которых есть триггеры
  • yukra
    Senior Member
    • Apr 2013
    • 1359

    #2
    Количество и загруженность пуллеров? Очередей? Дока, бест практишь.

    Comment

    • DRVTiny
      Senior Member
      • Sep 2011
      • 162

      #3
      А вообще при каких обстоятельствах Zabbix закрывает tcp socket для входящих соединений? Когда у него все trapper'ы заняты на 100% такое происходит? И как Zabbix определяет, что отдельный траппер загружен на N%? Внутри траппера порождаются потоки и N=100*(кол-во занятых)/(всего потоков)?
      У нас мониторятся процессы-трапперы, довольно часто они заняты на 100%, но это не точно коррелируется с отсутствием данных: на 100% траппер может быть загружен 30 минут, но данных при этом нет только за 5 минут.

      Comment

      • yukra
        Senior Member
        • Apr 2013
        • 1359

        #4
        Originally posted by DRVTiny
        А вообще при каких обстоятельствах Zabbix закрывает tcp socket для входящих соединений? Когда у него все trapper'ы заняты на 100% такое происходит? И как Zabbix определяет, что отдельный траппер загружен на N%? Внутри траппера порождаются потоки и N=100*(кол-во занятых)/(всего потоков)?.
        исходники открыты, strace и gdb никто не запрещает. Заодно потом и статью (на хабр например) сможете написать.
        Originally posted by DRVTiny
        У нас мониторятся процессы-трапперы, довольно часто они заняты на 100%, но это не точно коррелируется с отсутствием данных: на 100% траппер может быть загружен 30 минут, но данных при этом нет только за 5 минут.
        подмините колво пуллеров. Если они нагруженны на 100% - это значит что они на грани. Они могут успевать обрабатывать все нужные значения, а еще могут не успеть. А еще айтем может выпасть в неподдерживаемые и тоже перестать рисоваться график.

        Comment

        • pzabortsev
          Senior Member
          • Dec 2012
          • 338

          #5
          Originally posted by DRVTiny
          соединение в рамках loopback-интерфейса!
          BTW: судя по логам у Вас агент подключается не через loopback.

          Посмотрите графики загрузки внутренних процессов zabbix-proxy. Скорее всего узнаете, в чем проблема.

          Comment

          Working...