Ad Widget

Collapse

Zabbix unreachable poller processes more than 75% busy

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • toptop
    Junior Member
    • Dec 2022
    • 13

    #1

    Zabbix unreachable poller processes more than 75% busy

    Последнеее время часто стал срабатывать трригер Zabbix unreachable poller processes more than 75% busy: 96.61 % , после этого по всем нодам стабатывает триггер Zabbix agent on {HOSTNAME} is unreachable for 5 minutes: Up (1) .
    гуг рекомендует увечить кол-во значений
    StartPollers= 20
    StartPollersUnreachable=3

    на какое то время помогло , после новый сообщений повысил значения до

    StartPollers= 520
    StartPollersUnreachable=7
    VMwareCacheSize=128M
    CacheSize=6G
    ValueCacheSize=1G

    Трригер срабатывает стабильно 1 раз в неделю . По ресурсам не упираюсь в потолок ,

    zabbix_server (Zabbix) 5.0.15
    zabbix_agentd (daemon) (Zabbix) 5.0.14
    mysql Ver 15.1 Distrib 5.5.68-MariaDB, for Linux (x86_64) using readline 5.1​
  • Hamardaban
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • May 2019
    • 2713

    #2
    Скорее всего это симптомы, а не причина.
    И последовательность скорее обратная - сначала идет отвал агентов, потом эти "недоступности" начинает обрабатывать PollersUnreachable и говорит о том что их много для текущих настроек....
    Когда возникает "проблема" всё ли в порядке с сетью? Не приостанавливается ли VM на резервирование? Нет ли потерь пакетов на маршрутизаторах\файерволах? и т.п.
    Last edited by Hamardaban; 19-10-2023, 09:54.

    Comment

    • toptop
      Junior Member
      • Dec 2022
      • 13

      #3
      Originally posted by Hamardaban
      Скорее всего это симптомы, а не причина.
      И последовательность скорее обратная - сначала идет отвал агентов, потом эти "недоступности" начинает обрабатывать PollersUnreachable и говорит о том что их много для текущих настроек....
      Когда возникает "проблема" всё ли в порядке с сетью? Не приостанавливается ли VM на резервирование? Нет ли потерь пакетов на маршрутизаторах\файерволах? и т.п.

      Думал про это , но каких либо пролем в данный момент не было . ошибка упала в 19:12 и поле этого стали не доступны все агенты .
      Click image for larger version

Name:	zaserver.jpg
Views:	2336
Size:	39.9 KB
ID:	472510

      Comment

      • Alex_UUU
        Senior Member
        • Dec 2018
        • 541

        #4
        Уже не раз описывал подобные симптомы и спрашивал совета, но проблема так и не локализована. Сервер 5.2. Замечено, что где-то на сети (далеко-далеко) происходит расколбас пакетов, т.е. прерывание сети, но не полное. В результате или сервер ии агент считают, что связь есть, а другая сторона - нет, и пытаютсяпередать пакеты. Но сервер не принимает коннекты, чую, что формирует некую очередь и потом начинает их сбрасывать. Он даже для веб-морды пишет в логах, что коннект отвергнут. В результате начинают заваливаться хосты, идет массовая сработка триггеров и отсылка уведомлений все встает в ступор.

        Comment

        • Hamardaban
          Senior Member
          Zabbix Certified SpecialistZabbix Certified Professional
          • May 2019
          • 2713

          #5
          Совет один - обновляйтесь!
          Появилось много нового , старые баги исправлены , новые добавлены.

          Comment

          • Alex_UUU
            Senior Member
            • Dec 2018
            • 541

            #6
            Originally posted by Hamardaban
            Совет один - обновляйтесь!.
            Два правила:
            • Лучшее - враг хорошего.
            • Не трогай налаженный механизм - он не подведет.
            Всегда выручали и не подводили. :-)


            Comment


            • Hamardaban
              Hamardaban commented
              Editing a comment
              Увы - это хорошая стратегия только в короткую.
              Жизнь===изменение. И мир не таков каким бы нам хотелось чтобы он был.
              И если не бежать то отстанешь, и рано или поздно окажешься с кучей унаследованного гуано которое проще выкинуть чем изменить или продолжать с ним работать.

              We must run as fast as we can, just to stay in place. And if you wish to go anywhere you must run twice as fast as that. (1862)
              Last edited by Hamardaban; 25-10-2023, 07:08.
          Working...