Ad Widget

Collapse

Постоянные ошибки связи с агентами

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Firm
    Senior Member
    • Dec 2009
    • 342

    #1

    Постоянные ошибки связи с агентами

    Имеется server 1.8 (то же было и на 1.6). В логах периодически (когда одиночные, когда множественные) ошибки вида:

    20526:20091223:180411.912 Item [<host1>:vfs.fs.size[/usr,free]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
    20526:20091223:180411.956 ZABBIX Host [<host1>]: another network error, wait for 15 seconds
    20517:20091223:180412.280 Item [<host1>:system.swap.size[,free]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
    20517:20091223:180412.289 ZABBIX Host [<host1>]: another network error, wait for 15 seconds
    [skipped]
    20526:20091223:183017.087 Item [<host2>roc.num[,,run]] error: Get value from agent failed: Cannot connect to [<host2>:10050] [Interrupted system call]
    20526:20091223:183017.117 ZABBIX Host [<host2>]: first network error, wait for 15 seconds

    Агенты находятся как в том же сегменте сети, что и сервер, так и в других. В логах агентов - чисто. Проблем со связью в эти моменты не было. Увеличение у сервера значения StartPollers особо не помогает.

    server: centos 5.3, zabbix_serverd: 1.8
    agents: centos 5.3, ubuntu 9.04, zabbix_agentd: 1.8
  • Yrik
    Junior Member
    • Aug 2009
    • 2

    #2
    Ïîäòâåðæäàþ.
    Â ñåòè 27 àãåíòîâ, òîëüêî 1 àãåíò ïðèñûëàåò òàêèå îøèáêè.
    zabbix_agent -V
    ZABBIX Agent v1.6.5 (revision 7442) (3 April 2009)
    Compilation time: Sep 1 2009 14:21:32
    Ñèñòåìà: Debian

    Comment

    • dima_dm
      Senior Member
      • Dec 2009
      • 2697

      #3
      Попробуй увеличить таймауты для zabbix_agent и zabbix_server
      /etc/zabbix/zabbix_agentd.conf
      Timeout=30
      /etc/zabbix/zabbix_server.conf
      Timeout=30
      И рестартовать zabbix_agent и zabbix_server
      По умолчанию там 3 сек Timeout
      Last edited by dima_dm; 30-12-2009, 14:45.

      Comment

      • Yrik
        Junior Member
        • Aug 2009
        • 2

        #4
        ïðîáëåìó ðåøèë

        Âîîáùåì ïðîáëåìó ðåøèë.
        Ïåðåä ýòèìè îøèáêàìè â ëîãå áûëî ñïåðâà ÷òî àãåíò íå ìîæåò ïîëó÷èòü äàííûå ïî item net.tcp.service[ftp], óæ íå ïîíÿòíî ïî÷åìó (êîãäà server 1.6.6 ñòîÿë âñå ïîëó÷àë), íó êîðî÷å êîãäà îí íå ìîã ïîëó÷èòü ýòè äàííûå, â zabbix ïàäàë ýòîò ñåðâåð ÷åðåç 15 ñåêóíä. ß óáðàë ýòîò item è ùàñ âñå ïðåêðàñíî ìîíèòîðèòüñÿ.
        Îáíîâëåíèå àãåíòà íà 1.8 íå ïîìîãëî.
        Last edited by Yrik; 31-12-2009, 04:35.

        Comment

        • Hober
          Senior Member
          • Dec 2008
          • 109

          #5
          Originally posted by Yrik
          Âîîáùåì ïðîáëåìó ðåøèë.
          Ïåðåä ýòèìè îøèáêàìè â ëîãå áûëî ñïåðâà ÷òî àãåíò íå ìîæåò ïîëó÷èòü äàííûå ïî item net.tcp.service[ftp], óæ íå ïîíÿòíî ïî÷åìó (êîãäà server 1.6.6 ñòîÿë âñå ïîëó÷àë), íó êîðî÷å êîãäà îí íå ìîã ïîëó÷èòü ýòè äàííûå, â zabbix ïàäàë ýòîò ñåðâåð ÷åðåç 15 ñåêóíä. ß óáðàë ýòîò item è ùàñ âñå ïðåêðàñíî ìîíèòîðèòüñÿ.
          Îáíîâëåíèå àãåíòà íà 1.8 íå ïîìîãëî.
          Àíàëîãè÷íî è íà proxy, ïåðåñòàåò ïîñûëàòü äàííûå õîñòà ( ãäå âûâàëèëàñü äàííàÿ îøèáêà ).
          Zabbix Servers - 1
          Zabbix Proxy - 145
          Monitored Servers: ~ 1400

          Comment

          • Alexei
            Founder, CEO
            Zabbix Certified Trainer
            Zabbix Certified SpecialistZabbix Certified Professional
            • Sep 2004
            • 5654

            #6
            Originally posted by firm
            Имеется server 1.8 (то же было и на 1.6). В логах периодически (когда одиночные, когда множественные) ошибки вида:
            Интересная проблема. Я видел подобное, но никогда не удавалось понять что действительно является причиной. Обычно происходит на больших системах.

            Сколько активных хостов, айтемов и тригеров?
            Alexei Vladishev
            Creator of Zabbix, Product manager
            New York | Tokyo | Riga
            My Twitter

            Comment

            • shark
              Junior Member
              • Feb 2010
              • 7

              #7
              Originally posted by alexei
              èíòåðåñíàÿ ïðîáëåìà. ß âèäåë ïîäîáíîå, íî íèêîãäà íå óäàâàëîñü ïîíÿòü ÷òî äåéñòâèòåëüíî ÿâëÿåòñÿ ïðè÷èíîé. îáû÷íî ïðîèñõîäèò íà áîëüøèõ ñèñòåìàõ.

              ñêîëüêî àêòèâíûõ õîñòîâ, àéòåìîâ è òðèãåðîâ?
              ó ìåíÿ àíàëîãè÷íàÿ ïðîáëåìà. óçëîâ â ñåòè ïîðÿäêà 100.

              Comment

              • Firm
                Senior Member
                • Dec 2009
                • 342

                #8
                Originally posted by Alexei
                Интересная проблема. Я видел подобное, но никогда не удавалось понять что действительно является причиной. Обычно происходит на больших системах.

                Сколько активных хостов, айтемов и тригеров?
                Number of hosts monitored: 29
                Number of items monitored: 2318
                Number of triggers enabled: 974

                Comment

                • watto
                  Member
                  • Jun 2008
                  • 47

                  #9
                  Òî÷íî òàêàÿ æå ïðîáëåìà. Óçëîâ ñåòè - 5, ýëåìåíòîâ äàííûõ - 277, òðèãåððîâ - 147.
                  Zabbix 1.8.

                  Comment

                  • Hober
                    Senior Member
                    • Dec 2008
                    • 109

                    #10
                    Originally posted by watto
                    òî÷íî òàêàÿ æå ïðîáëåìà. óçëîâ ñåòè - 5, ýëåìåíòîâ äàííûõ - 277, òðèãåððîâ - 147.
                    Zabbix 1.8.
                    íà êàêèõ èòåìàõ?
                    Zabbix Servers - 1
                    Zabbix Proxy - 145
                    Monitored Servers: ~ 1400

                    Comment

                    • watto
                      Member
                      • Jun 2008
                      • 47

                      #11
                      Originally posted by Hober
                      íà êàêèõ èòåìàõ?
                      net.tcp.service[ftp]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]

                      net.tcp.service[ssh]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]

                      agent.ping] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]

                      Comment

                      Working...