Схема: 1 zabbix-server и 2 zabbix-proxy в разных ДЦ база на PostgresSQL
Загрузка: new values per second ~ 800
Довольно часто возникает ситуация когда теряется связь между каким-либо прокси и сервером (на срок от 10-20 мин), в результсяте на прокси копятся поступающие значения от агентов. После восстановления связности, он начинает отправлять их zabbix-серверу и тут начинается непонятное.
Если отставание небольшое (около 5 мин) сервер успешно нагоняет все данные и работа продолжается. Начиная с отставания в 10 мин сервер достаточно быстро нагоняет данные до -5 мин от текущего времени и все, на этом он почему то останавливается и дальше данные так и идут с отставанием в 5 мин. Приходиться останавливать прокси и чистить таблицу в базе данных чтобы пошли свежие значения.
Загрузка CPU в режиме "нагона" значений около 80-90% в рабочем режиме около 45%, база на дисковой полке и затыка с дисками точно нет. Памяти 32 Gb и почти вся отдана базе данных.
Значения StartDBSyncers=32 - на Proxy и StartDBSyncers=64 на сервере
Судя по графикам загрузка процессов busy history syncer processes не более 20%
Большая загрузка (под 100%) процессов
Не уверен что это связано с ними.
Буду благодарен если подскажете куда копать и в чем может быть причина столь долгого нагона значений Zabbix-сервером.
Загрузка: new values per second ~ 800
Довольно часто возникает ситуация когда теряется связь между каким-либо прокси и сервером (на срок от 10-20 мин), в результсяте на прокси копятся поступающие значения от агентов. После восстановления связности, он начинает отправлять их zabbix-серверу и тут начинается непонятное.
Если отставание небольшое (около 5 мин) сервер успешно нагоняет все данные и работа продолжается. Начиная с отставания в 10 мин сервер достаточно быстро нагоняет данные до -5 мин от текущего времени и все, на этом он почему то останавливается и дальше данные так и идут с отставанием в 5 мин. Приходиться останавливать прокси и чистить таблицу в базе данных чтобы пошли свежие значения.
Загрузка CPU в режиме "нагона" значений около 80-90% в рабочем режиме около 45%, база на дисковой полке и затыка с дисками точно нет. Памяти 32 Gb и почти вся отдана базе данных.
Значения StartDBSyncers=32 - на Proxy и StartDBSyncers=64 на сервере
Судя по графикам загрузка процессов busy history syncer processes не более 20%
Большая загрузка (под 100%) процессов
- busy timer processes
- escalator processes
- alerter processes
Не уверен что это связано с ними.
Буду благодарен если подскажете куда копать и в чем может быть причина столь долгого нагона значений Zabbix-сервером.
Comment