Ad Widget

Collapse

проблема в Заббиксе - есть данные, но триггер иногда сообщает, что данных нет

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • AND123
    Member
    • Jul 2020
    • 47

    #1

    проблема в Заббиксе - есть данные, но триггер иногда сообщает, что данных нет

    Раза два в сутки срабатывают все триггеры о недоступности сетевых интерфейсов коммутатора. Данные получаем по SNMP
    Если смотреть график данных за этот момент срабатывания триггера - данные есть и показывают, что интерфейс доступен.
    В самом триггере прописано - {Cisco_xxxx:cbgpPeer2State[**.**.***.**].nodata(10m)}=1
    В чем может быть дело? проблема в заббиксе?
  • Hamardaban
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • May 2019
    • 2713

    #2
    Посмотрите не на график, а на сами данные. На графике сверху справа есть выпадающий список как показывать - данными или графиком.
    Обратите внимание на то есть ли разрывы в данных более чем на 10 минут.

    Comment

    • AND123
      Member
      • Jul 2020
      • 47

      #3
      Вывел данные. За 2-а часа везде - established (6)
      Хотя в этот период триггер срабатывал на то, что как будто нету данных

      Comment

      • Hamardaban
        Senior Member
        Zabbix Certified SpecialistZabbix Certified Professional
        • May 2019
        • 2713

        #4
        срабатывание триггеров коррелируется с работой huosekeeper? может с заданиями на сервере?
        прослеживается какая либо периодичность\регулярность?

        Comment

        • AND123
          Member
          • Jul 2020
          • 47

          #5
          по остальным то триггерам схожим нет такого.
          по времени ни какой зависимости нет. То 8 часов, то 12 часов, то 9 часов - через сколько это происходит

          По поводу Houskeeper - хз. как это посмотреть и увидеть?
          Сейчас увидел, что в 11-04 началась проблема - Zabbix server: Utilization of history syncer processes over 75%
          Как раз через 10 минут в 10-14 началась рассылка что мол отвалилась Циска. Хотя по факту данные есть.
          В 11-21 - Zabbix server: Utilization of preprocessing worker processes over 75%
          При этом в 11-19 пришли сообщения, что Циска доступна. проблема ушла
          Last edited by AND123; 04-08-2022, 10:25.

          Comment

          • AND123
            Member
            • Jul 2020
            • 47

            #6
            Вот некоторые графики
            Click image for larger version

Name:	image.png
Views:	167
Size:	180.3 KB
ID:	449288
            Click image for larger version

Name:	image.png
Views:	160
Size:	30.3 KB
ID:	449289
            Click image for larger version

Name:	image.png
Views:	154
Size:	111.6 KB
ID:	449290

            Comment

            • Hamardaban
              Senior Member
              Zabbix Certified SpecialistZabbix Certified Professional
              • May 2019
              • 2713

              #7
              явная проблема с historysyncer - возможно не успевает в базу данные писать - отсюда и "пропуски" данных.
              рекомендации - тюнить взаимодействие с базой. база должна быть быстрой!
              в крайнем случае поиграть количеством StartDBSyncers

              Comment

              • AND123
                Member
                • Jul 2020
                • 47

                #8
                Тюнинг настроен. кешы выделены большого объема
                на счет StartDBSyncers выставлен в 20
                база данных занимает уже 102Гб.

                Comment

                • Hamardaban
                  Senior Member
                  Zabbix Certified SpecialistZabbix Certified Professional
                  • May 2019
                  • 2713

                  #9
                  А какой у вас NVPS? Что за база? Используется ли патрицирование?
                  StartDBSyncers=20 - это очень много! могут мешать друг другу.

                  Comment

                  • AND123
                    Member
                    • Jul 2020
                    • 47

                    #10
                    Как получить NVPS пока не знаю. Смотрю что это за данные в заббиксе
                    База на MySQL
                    Click image for larger version  Name:	image.png Views:	0 Size:	7.6 KB ID:	449330
                    Last edited by AND123; 04-08-2022, 15:19.

                    Comment


                    • Hamardaban
                      Hamardaban commented
                      Editing a comment
                      nvps - новых значений в секунду. на картинке внизу
                  • AND123
                    Member
                    • Jul 2020
                    • 47

                    #11
                    Я смотрел в интернете документации по nvps. Там пишут, что значение выводимое в информации о системе, может не соответствовать действительности.
                    Нужно выводить график из данных агента заббикса. Пока вот не понял, какие именно данные за это отвечают

                    И самое интересно по "нашей" проблеме. Все остальные триггеры которые используют любое другое выражение, кроме nodata - работает нормально. Да и не заметил я, чтобы были пропуски в получении данных.

                    Comment

                    • Hamardaban
                      Senior Member
                      Zabbix Certified SpecialistZabbix Certified Professional
                      • May 2019
                      • 2713

                      #12
                      Еще раз напишу - вероятно проблема во взаимодействии сервера z и базы данных. периодически данные попадают в базу с задержками. вот в момент таких задержек и срабатывает nodata.
                      Потом данные записываются - но триггер уже сработал....
                      NVPS - это оценка. естественно она не точна и есть нюансы. но позволяет понять нагруженость системы.
                      при вашем соотношении количества items и nvps яб задумался об уменьшении частоты съема метрик и оптимизации с использованием тротлинга (естественно если это допустимо).
                      конечно вам виднее что и как собирать и хранит, но зачастую lld приносит много мусора...

                      посмотрите на состояние historysyncer через ps - в строке процесса есть краткая статистика
                      увеличьте уровень логирования historysyncer сервра - может может что-то в логе понятнее станет.
                      включите логирование медленных запросов.
                      попробуйте посмотреть логи со стороны базы.

                      Comment

                      Working...