Ad Widget

Collapse

Зависание zabbix 5 сервера.

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • SevenSticks
    Junior Member
    • May 2022
    • 13

    #1

    Зависание zabbix 5 сервера.

    Добрый день.

    Недавно стрельнула проблема, локализовать причины которой так и не удалось.
    Ни с того ни с сего завис zabbix сервер, перестали сниматься даже его, заббиксовые метрики, на графиках провал и восстановление после рестарта сервера.
    В логах пусто.
    База PgSQL 1.5ТБ
    Может кто-то сталкивался?
    Спасибо!

    Click image for larger version

Name:	Screenshot 2022-05-30 065511.png
Views:	170
Size:	412.8 KB
ID:	445306
  • SevenSticks
    Junior Member
    • May 2022
    • 13

    #2
    Если нужна какая-то дополнительная информация, с радостью предоставлю.

    Comment

    • Diesel315
      Senior Member
      • Jan 2020
      • 159

      #3
      Просто мысли вслух...
      Сейчас проблема наблюдается? Если вы пытаетесь найти причину единичного сбоя в прошлом, то это как правило бесполезно... Все расследования надо проводить по горячим следам с использованием всех возможных логов и не только Zabbix.
      Пытаться найти причину проблемы в прошлом по истечении времени, как правило бесперспективно...

      Считайте просто данное событие недоразумением... Если повторится, то максимально изучать все логи... Если начнет проблема прогрессировать, то включать режимы debug...

      Comment


      • SevenSticks
        SevenSticks commented
        Editing a comment
        Спасибо за совет, проблема повторилась спустя два дня, при чем снова ночью.
        На сервере весьма ограничено дисковое пространство и так как заббикс у нас не маленький, есть предположение что включение дебага может утилизировать оставшееся место.
        Тогда вообще все встанет.
    • Diesel315
      Senior Member
      • Jan 2020
      • 159

      #4
      Ну а по другому никак... Гадать можно долго, условно от нехватки памяти (ОЗУ+SWAP), до тормозов дисковой подсистемы в моменте...
      Поднимите еще один zabbix сервер и натравите его только на этот, снимайте все возможные показатели с высокой частотой съёма, может и найдете проблему...
      Я бы грешил либо на память, либо на дисковую подсистему... ну еще бы изучал пристально логи БД, может и БД чюдит...

      Comment


      • SevenSticks
        SevenSticks commented
        Editing a comment
        Есть второй заббикс, попробуем с него замониторить, ибо не понятно что творится с хардварной частью первого, так как он перестает снимать метрики со своей машины в момент проблемы.
        Так же, буду ждать нового воспроизведения, вернусь с диагностическими данными.
        Спасибо!
    • Semiadmin
      Senior Member
      • Oct 2014
      • 1625

      #5
      Если есть второй заббикс, то им можно замониторить и внутренние заббикс-процессы первого (то, что на скриншоте).

      Comment


      • SevenSticks
        SevenSticks commented
        Editing a comment
        Хорошая идея, спасибо!
        Так и сделаю.
    • SevenSticks
      Junior Member
      • May 2022
      • 13

      #6
      В общем настроил я мониторинг на втором заббикс сервере, он у нас третьей версии.
      Между пятым и третьим заббиксом, получаются расхождения на графиках.

      Третий почему-то считает что пуллеров утилизируется больше)
      Attached Files

      Comment

      • Diesel315
        Senior Member
        • Jan 2020
        • 159

        #7
        Попробуйте уровнять версии. У вас второй продакшн? Если да, то почему старой версии?
        Если есть какие-то причины и не хотите менять версию, то просто поднимите новую ВМ (хоть на своем рабочем месте, если память оперативная позволяет)...

        Comment


        • SevenSticks
          SevenSticks commented
          Editing a comment
          У нас третий заббикс не целевой, мы с него переехали на пятый, этот еще не выведен из эксплуатации просто.
          Попробую выкрутится, может действительно подниму у себя сервер, спасибо!
          Last edited by SevenSticks; 07-06-2022, 07:12.
      • Semiadmin
        Senior Member
        • Oct 2014
        • 1625

        #8
        С третьим заббиксом ничего, конечно, не получится. И сейчас он у вас, думаю, показывает свои собственные внутренние метрики, а не метрики целевого сервера. Поднимайте zabbix 5.* или 6.0 и воспользуйтесь вот этой инструкцией и стандартным шаблоном "Remote Zabbix server health"

        Comment

        • SevenSticks
          Junior Member
          • May 2022
          • 13

          #9
          Коллеги, всем большое спасибо, проблема самоустранилась =)

          Comment

          Working...