Ad Widget

Collapse

Место на диске быстро заканчивается

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • VladimirN
    Member
    • May 2014
    • 38

    #1

    Место на диске быстро заканчивается

    Добрый день.

    С некоторого времени на сервере с установленным Zabbix-сервером стало быстро заканчиваться свободное место. Ориентировочно началась проблема 30 декабря, в выходной день, вероятность каких-то изменений системы возможна, но маловероятна. Выяснил что база posqtgre занимает больше всего места (сейчас около 224Гб). Подскажите пожалуйста как выяснить что именно пишет активно в базу информацию, на что обратить внимание?

    ОС: Debian11
    ZabbixServer: 6.4.10
    База: PostgreSQL 13
  • Hamardaban
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • May 2019
    • 2713

    #2
    Вопрос очень комплексный и не имеет простого ответа.
    Размер базы мониторится?
    Как настроено удаление данных? TSDB? Партиционирование?Удаляли ли ранее большой объем данных из базы?
    Возможно сработало какое-то автообнаружение и насоздавало кучу элементов.
    Посмотрите на размер таблиц в базе и посмотрите какая активно растет. По ее имени можно понять на какой тип эд стоит смотреть.
    Пересмотрите и оптимизируйте периоды сбора данных и хранения истории. Особое внимание уделите lld.

    Comment

    • VladimirN
      Member
      • May 2014
      • 38

      #3
      Отдельно размер базы мониторится из самой системы Zabbix, т.е. примерно можно сказать когда началась проблема.
      Про удаление данных, TSDB, портирование и т.д. ничего не могу сказатьувы, но отдельного специалиста по работе с базой данных у нас нет. Была настроена система Zabbix которая работала примерно полтора года без каких-то дополнительных манипуляций (за исключением перевода системы на более новые версии)

      Посмотрел, в базе самая большая таблица history_uint, размер таблицы 119Гб, индекс 74Гб , остальные таблицы в разы меньше (trends_iunt - 20Гб, history - 12Гб)
      Не подскажите, в каком направлении дальше действовать?

      Comment

      • Hamardaban
        Senior Member
        Zabbix Certified SpecialistZabbix Certified Professional
        • May 2019
        • 2713

        #4
        history_uint - целочисленные значения элементов данных. не трэнды. это нормально что она самая большая.
        в логах z сервера есть какие нибудь упоминания о проблемах с housekeeping или об ошибках в период когда возникла проблема?
        вспоминайте- восстнавливайте хронологию того что делали с системой \ в системе.

        Comment

        • VladimirN
          Member
          • May 2014
          • 38

          #5
          Если правильно помню, то проблемы с housekeeping были после миграции на более новую версию postgresql (Zabbix housekeeper processes more than 75% busy), но эта ситуация была в начале ноября 2023 и решилась успешно.

          В середине декабря был настроен мониторинг нескольких единиц сетевого оборудования, наверное в выходные отключу мониторинг части узлов и посмотрю что это изменит, а дальше уже по ситуации.

          Спасибо Вам за помощь!

          Comment

          • Alex_UUU
            Senior Member
            • Dec 2018
            • 541

            #6
            имхо, как сказал ранее увыажаемый Hamardaban​, проблема, скорее всего в насозданных "левых" ЭД с минимальным временем опроса. Можно и 0 поставить, но смысл? Если по регламенту реагирование на проблему "в течении 30 минут", то смысл ставить опрос каждую секунду?

            Я бы на вкладке ЭД посмотрел бы интервалы опросов. Также в таблице сделать выборку типа select item_id,count(*) as cnt from history_uint group by item_id order by cnt desc
            и посмотрел бы, каких ЭД больше всего.

            Также, как вариант много данных бывает в текстовых ЭД (но тут не та табла).

            Comment

            Working...