Ad Widget

Collapse

Get value from agent failed: ZBX_TCP_READ() failed [Connection reset by peer]

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • freelsd
    Member
    • Jul 2009
    • 46

    #1

    Get value from agent failed: ZBX_TCP_READ() failed [Connection reset by peer]

    Привет. Работаю с заббикс по снмп, очень нравится - но вот линуху не могу отмониторить. Вот собсно все конфиги, буду очень благодарен за помощь.
    PS одно у заббикса расстраивает: база с бешеной скоростью растет, уже гектар за месяц.
    Zabbix_server: FreeBSD
    Zabbix_client: Debian
    Template: Linux
    No firewalls, no closed ports.
    -------------
    Zabbix_server:
    telnet *.*.228.50 10050
    Trying *.*.228.50...
    Connected to zabbix_client.
    Escape character is '^]'.
    Connection closed by foreign host.
    ---------------
    zabbix_client conf:
    Server=zabbix_server_ip

    # Server port for sending active checks

    ServerPort=10051

    # Unique hostname. Required for active checks.

    Hostname=RESOLVED_HOSTNAME_4_zabbix_server_ip

    StartAgents=5
    DebugLevel=3

    PidFile=/var/run/zabbix-agent/zabbix_agentd.pid

    LogFile=/var/log/zabbix-agent/zabbix_agentd.log

    Timeout=3
  • noname
    Senior Member
    • Jan 2008
    • 120

    #2
    По поводу размера базы скажу Вам так: сколько намониторите, столько занимать и будет. На странице 36 в мануале zabbix вы можете найти комментарий по поводу размеров базы. Увеличьте интервал проверок для тех параметров, что часто и много мониторятся. Уменьшите время history (инфа будет браться из trends, где хранятся агрегированные за определенный промежуток времени данные). Если мониторятся свитчи, рекомендую перейти на 64-битные счетчики (конечно же, если поддерживаются).

    По поводу сервера, попробуйте следующее:
    zabbix_get -s ip_твоего_сервера_который_мониторится -k agent.ping

    Может быть, имеют место проблемы в сети, тогда ты это увидишь, повторив несколько раз вышеупомянутую команду.
    Last edited by noname; 05-08-2009, 08:00.

    Comment

    • flycat
      Member
      • May 2007
      • 30

      #3
      Скорее всего, на агенте "не совсем" верно указан сервер.
      У меня была похожая проблема при включённом на клиенте IPv6. В этом случае агент считает его дефолтным протоколом и если вы указали, например сервер как 10.1.1.70, а агент ожидает коннекта с ::ffff:10.1.1.70. Соответственно, сервер не может сконнектиться.
      Для начала попробуйте включить в /etc/zabbix/zabbix-agentd.conf отладку (DebugLevel=4) и почитать лог.

      Comment

      • freelsd
        Member
        • Jul 2009
        • 46

        #4
        Тут косяк еще хуже, с клиента на сервер телнет не коннектится по 10051. А с сервера к клиенту коннектится

        При всем при этом статистика со свичей я снимаю заббикс сервером нормально.

        Comment

        • noname
          Senior Member
          • Jan 2008
          • 120

          #5
          1. Сервер сам опрашивает разными способами.
          - Со свитчей ты снимаешь по 161 порту (твой сервер коннектится к свитчу на 161 порт).
          - С агентов ты снимаешь по порту 10050 (то есть твой сервер коннектится к серваку по порту 10050).

          2. 10051 нужен на сервере заббикса, если ты снимаешь данные так называемыми active checks (то есть у тебя агент не слушает соединения по порту 10050, чтобы дождаться опроса сервера, а сам ему отдает, и тут уже сервер заббикса должен слушать на 10051, а не хочет ли ему кто-то о чем-то рассказать)

          Comment

          • flycat
            Member
            • May 2007
            • 30

            #6
            Ничего не хуже: с клиента на сервер коннект нужен только для активных проверок.
            А если с сервера на клиента коннект есть, попробуйто просто в телнете дать:
            agent.version
            и получить
            1.6.5 (к примеру)

            Comment

            • flycat
              Member
              • May 2007
              • 30

              #7
              И опять-таки повторюсь: логи, логи, логи! :d

              Comment

              • freelsd
                Member
                • Jul 2009
                • 46

                #8
                5140:20090805:154516 Getting list of active checks failed. Will retry after 60 seconds
                5140:20090805:154619 Timeout while answering request
                ---------
                Это все что в логах

                Comment

                • flycat
                  Member
                  • May 2007
                  • 30

                  #9
                  DebugLevel=4 включали?

                  Comment

                  • freelsd
                    Member
                    • Jul 2009
                    • 46

                    #10
                    Да.
                    Все, спасибо заработало - обратная зона была не для того ай пи на сервере.

                    Comment

                    Working...