Ad Widget

Collapse

Zabbix agent network error

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Fullmetal8ender
    Member
    • Nov 2012
    • 81

    #1

    Zabbix agent network error

    Доброго времени суток!
    Испытываю периодическое появление ошибок в логе
    Code:
    13566:20121107:173045.499 Zabbix agent item [vfs.fs.discovery] on host [1cbase] failed: first network error, wait for 15 seconds
    13572:20121107:173103.451 Zabbix agent item [vfs.fs.discovery] on host [1cbase] failed: another network error, wait for 15 seconds
    С разных хостов, для разных элементов.
    Zabbix server v2.0.3 (revision 30485) (03 October 2012)
    Linux 3.2.12-gentoo
    Timeout=9
    Тут видно что сервер закрывает соединение




    Кто может подсказать в чем причина?
  • zalex_ua
    Senior Member
    Zabbix Certified Trainer
    Zabbix Certified SpecialistZabbix Certified Professional
    • Oct 2009
    • 1286

    #2
    Я знаю в чем причина, вот - https://support.zabbix.com/browse/ZBXNEXT-1395
    Надеюсь скоро опубликую блогпост на эту тему

    Comment

    • SirMax
      Junior Member
      • Jul 2012
      • 14

      #3
      Объясню все очень просто.
      Я уже писал на этом форуме вопрос. Убил часа 1.5 на то чтобы разобраться в проблеме.
      Смысл в том что на том сервере (клиенте заббикса), который отваливается наверняка есть флоппи драйв.
      Автоопределение в винде работает следующим образом:
      находит все подцепленные диски
      затем определяет их файловую систему
      Так вот:
      он находит флоппи диск драйв, потом пытается определить фаловую систему на нем и, т.к. у флоппи драйвов нет возможности определить вставлена дискета или нет, он пытается определить типа файловой системы на этом диске.
      А т.к. дискеты там нет, он тратит 6 секунд на это, после чего пытается вернуть серверу результат. Но сервер уже забивает на ответ из-за таймаута.

      Самое простое решение: отрубить в винде флоппи драйв в диспетчере устройств.
      Не самое хорошее решение, но с другой стороны кому сейчас нужен флоппик на сервере под виндой? :-)
      Возможно в следующих версиях эту багу исправят.

      Comment

      • Fullmetal8ender
        Member
        • Nov 2012
        • 81

        #4
        Всем спасибо за ответ. Действительно не задумывался о природе такого поведения, а сейчас стало понятно.
        С другой стороны я же выставил
        Timeout=9
        А он закрывает соединение через 6 секунд.
        И еще странно что такую же ошибку получаю на FreeBSD.
        Поищу в чем там может быть причина

        Comment

        • SirMax
          Junior Member
          • Jul 2012
          • 14

          #5
          на сколько я понял ответ разработчиков там не так просто поменять таймаут для ожидания этого ответа и они вообще его менять не рекомендуют.

          Comment

          • Fullmetal8ender
            Member
            • Nov 2012
            • 81

            #6
            Я думаю все не так категорично.
            Таймаут нельзя изменить для конкретного типа элементов, но изменить для всех можно на сервере или на конкретном клиенте.
            Просто в конкретном случае с дисководами они не предлагают это как решение. Мне так кажется

            Comment

            • zalex_ua
              Senior Member
              Zabbix Certified Trainer
              Zabbix Certified SpecialistZabbix Certified Professional
              • Oct 2009
              • 1286

              #7
              Originally posted by sirmax
              он находит флоппи диск драйв, потом пытается определить фаловую систему на нем и, т.к. у флоппи драйвов нет возможности определить вставлена дискета или нет, он пытается определить типа файловой системы на этом диске.
              А т.к. дискеты там нет, он тратит 6 секунд на это, после чего пытается вернуть серверу результат.
              НЕТ !
              Причина не в дисководе а в контроллере гибких дисков на материнке (биосе) !
              Если физически привод (дисковод) есть НО нет дискеты то тратится 1 секунда на детект. Проверено и будет хорошо показано в статье, обещаю что на днях опубликую

              Там будут описаны дополнительные детали

              Comment

              • SirMax
                Junior Member
                • Jul 2012
                • 14

                #8
                да там даже не одна секунда тратится... у меня по логам около 5-6 получалось.
                Да какая разница контроллер, или сам дисковод:
                факт на лицо. попытка детектирования файловой системы при отсутсвии дискеты приводит к таймауту.
                выключаем из диспетчера задач дисковод (ну или вообще его из системы выключаем) все работает.
                Можно собрать агента так, чтобы он игнорировал диск A:
                ну может еще какие девайсы из мира *nix - это будет не очень красивое но решение.
                А вообще ждем статью.

                Comment

                • SirMax
                  Junior Member
                  • Jul 2012
                  • 14

                  #9
                  Originally posted by fullmetal8ender
                  Я думаю все не так категорично.
                  Таймаут нельзя изменить для конкретного типа элементов, но изменить для всех можно на сервере или на конкретном клиенте.
                  Просто в конкретном случае с дисководами они не предлагают это как решение. Мне так кажется
                  Да. Именно так. И именно это и имел в виду. В общем-то как они сказали они вообще не очень рекомендуют увеличение таймаутов (особенно сильное) вообще

                  Comment

                  Working...