Ad Widget

Collapse

Переодические провалы в графиках

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • buklov
    Junior Member
    • Jun 2009
    • 7

    #1

    Переодические провалы в графиках

    Уже не знаю что делать, но периодически появляются такие ошибки
    которые влекут за собой провалы в графиках, раз в пару часов точно.

    Серверы находятся в одной сети, между ними гигабит, в это время на сервере работают люди и ни каких особых проблем нету.

    Сначала думал что проблемы из-за того что mysql не справляется, поставил postgresql, история повторилась в точности

    думал проблема в агенте, перешёл на 1.8, так же история

    пинг в это время ни одного потерянного пакета не обнаруживает

    выставил Timeout=30 , ни чего не изменилось

    какие ещё возможны варианты решения???

    ps: думал что проблемы из-за слишком высокой нагрузки на сервер, но история и ночью повторяется, когда сервер простаивает


    20929:20100115:032024.154 Item [ts00:system.cpu.load[,avg1]] error: Get value from agent failed: Cannot connect to [10.0.0.241:10050] [Connection refused]
    20929:20100115:032024.155 ZABBIX Host [ts00]: first network error, wait for 15 seconds
    20950:20100115:032040.431 Item [ts00:agent.ping] error: Get value from agent failed: Cannot connect to [10.0.0.241:10050] [Connection refused]
    20950:20100115:032040.654 ZABBIX Host [ts00]: another network error, wait for 15 seconds
    20950:20100115:032058.662 Item [ts00:agent.ping] error: Get value from agent failed: Cannot connect to [10.0.0.241:10050] [Interrupted system call]
    20950:20100115:032058.663 ZABBIX Host [ts00]: another network error, wait for 15 seconds
    20950:20100115:032118.668 Item [ts00:agent.ping] error: Get value from agent failed: Cannot connect to [10.0.0.241:10050] [Interrupted system call]
    20950:20100115:032223.811 Item [ts00:agent.ping] error: Get value from agent failed: Cannot connect to [10.0.0.241:10050] [Interrupted system call]
    20950:20100115:032325.825 Item [ts00:agent.ping] error: Get value from agent failed: Cannot connect to [10.0.0.241:10050] [Connection refused]
  • sergeyfromkomi
    Senior Member
    • Dec 2009
    • 126

    #2
    Может быть проблема с типом счётчика ..... для скорости > 140 Mbps нужен 64-битный счётчик ...

    Comment

    • dima_dm
      Senior Member
      • Dec 2009
      • 2697

      #3
      Включи debug на zabbix_agent. Если в логах запросы в это время и какие ошибки?

      Comment

      • buklov
        Junior Member
        • Jun 2009
        • 7

        #4
        а как там в логах определить время??? вначале пишутся какие-то непонятные цифры с точками типа таких 84080:20100115:150328.579

        есть ошибка типа такой
        2020:20100116:143257.943 Process listener error: ZBX_TCP_WRITE() failed [Программа на вашем хост-компьютере разорвала установленное подключение.]
        Last edited by buklov; 20-01-2010, 16:27.

        Comment

        • dima_dm
          Senior Member
          • Dec 2009
          • 2697

          #5
          Originally posted by buklov
          а как там в логах определить время??? вначале пишутся какие-то непонятные цифры с точками типа таких 84080:20100115:150328.579

          есть ошибка типа такой
          Это PID zabbix_agent
          PID: DATE:TIME.миллисекунды

          Originally posted by buklov
          2020:20100116:143257.943 Process listener error: ZBX_TCP_WRITE() failed [Программа на вашем хост-компьютере разорвала установленное подключение.
          Может на сервере много TCP сессий открыто и срабатывают ограничения ядра OS (там где запущен zabbix agent)?

          Comment

          • buklov
            Junior Member
            • Jun 2009
            • 7

            #6
            это терминальный сервер, 90 пользователей, windows 2003 ent
            вроде не должно быть ограничений

            Comment

            • dima_dm
              Senior Member
              • Dec 2009
              • 2697

              #7
              Захватите снифером трафик, и посмотрите, кто является инициатором разрыва tcp 10050 соединения

              Comment

              Working...