Привет!
Появилась проблема:
Добавляю в заббикс 50 хостов (на каждом по 80...100 эл. данных) и заббикс начинает "тормозить" при работе с таблицей history_unit.
Хосты мониторятся через прокси.
Длятся тормоза примерно 30 минут - 1 час.
Через час работа заббикса восстанавливается, но часто исторические данные за диапазон времени, когда были "фризы", оказываются рваные (пропуски на графиках).
Так-же в этот диапазон времени срабатывают триггеры, которые считают значния исходя из времени: bla-bla.avg(10m)<100.
Каких либо других тормозов нет - любые другие данные, которые завязаны на другие таблицы заббикс отдает без задержек (события, списки хостов...).
Но вот последние данные или графики - как будто отрезало в этот момент времени. А когда все восстанавливается - данные дорисовываются.
Как я понимаю проблема в том что заббикс не успевает вовремя записать данные в БД: нагрузка на хистори-синкер вырастает на 100% в это время. А через время нагрузка на него возвращается в норму.
Судя по статистике в утилите innotop - работа в БД идет в основном с таблицами history_unit.
На аппаратную составляющую не грешу - сервера должно вполне хватать:
SSD 700GB x 2 шт в Raid1
256Gb RAM
60 ядер cpu
БД 30Гб с партиционированием по дням, в том числе партиционирована и history_unit.
Конфиги БД и Сервера ниже.
Вопрос - куда копать, чтобы заббикс успевал писать в базу при пиковых нагрузках.
Появилась проблема:
Добавляю в заббикс 50 хостов (на каждом по 80...100 эл. данных) и заббикс начинает "тормозить" при работе с таблицей history_unit.
Хосты мониторятся через прокси.
Длятся тормоза примерно 30 минут - 1 час.
Через час работа заббикса восстанавливается, но часто исторические данные за диапазон времени, когда были "фризы", оказываются рваные (пропуски на графиках).
Так-же в этот диапазон времени срабатывают триггеры, которые считают значния исходя из времени: bla-bla.avg(10m)<100.
Каких либо других тормозов нет - любые другие данные, которые завязаны на другие таблицы заббикс отдает без задержек (события, списки хостов...).
Но вот последние данные или графики - как будто отрезало в этот момент времени. А когда все восстанавливается - данные дорисовываются.
Как я понимаю проблема в том что заббикс не успевает вовремя записать данные в БД: нагрузка на хистори-синкер вырастает на 100% в это время. А через время нагрузка на него возвращается в норму.
Судя по статистике в утилите innotop - работа в БД идет в основном с таблицами history_unit.
На аппаратную составляющую не грешу - сервера должно вполне хватать:
SSD 700GB x 2 шт в Raid1
256Gb RAM
60 ядер cpu
БД 30Гб с партиционированием по дням, в том числе партиционирована и history_unit.
Конфиги БД и Сервера ниже.
Вопрос - куда копать, чтобы заббикс успевал писать в базу при пиковых нагрузках.
Comment