Всем привет.
Вот такая проблема. На сервере стали происходить довольно частые скачки нагрузки. Мы связываем это с проблемами сети. Вот что на мой взгляд происходит:
У нас есть Zabbix Server в ДЦ, который обслуживает офис и есть ряд Zabbix Proxy расположенных на территории клиентов. Количество машин и объём метрик весьма немалый (суммарный объём данных за 3 месяца почти 1Tb). Если начинаются проблемы с сетью и канал между сервером и проксями подает (пусть ненадолго), а потом восстанавливается, то все прокси увидев сервер начинают отдавать туда накопленные данные. В этот момент и происходит скачок нагрузки и сервер просто зашивается!
Опять же, насколько я понимаю, прокси никоим образом не пытается понять насколько нагружен сервер, перед тем как отдать ему данные верно?
И что теперь делать? Наращивать мощность сервера - не вариант. Когда с сетью всё в порядке, общий LA не превышает 3-4 на 12 ядерной системе, т.е. в штатных условиях, сервер справляется с нагрузкой без каких-то проблем. Делать крутой сервер только для того, чтобы он держал нагрузку в краткие моменты проблем с сетью - это нерентабельно и неоправдано.
По идее нужен механизм, который бы ограничивал поступление данных на сервер, если он перегружен, но опять же насколько я понимаю, такого механизма нет.
В условиях современного Интернета, когда потеря сетевой связности между сегментами Сети является обычным делом, такогое поведение Zabbix, на мой взгляд, является серьёзной проблемой в архитектуре Zabibx.
Кто что думает, по этому поводу?
Вот такая проблема. На сервере стали происходить довольно частые скачки нагрузки. Мы связываем это с проблемами сети. Вот что на мой взгляд происходит:
У нас есть Zabbix Server в ДЦ, который обслуживает офис и есть ряд Zabbix Proxy расположенных на территории клиентов. Количество машин и объём метрик весьма немалый (суммарный объём данных за 3 месяца почти 1Tb). Если начинаются проблемы с сетью и канал между сервером и проксями подает (пусть ненадолго), а потом восстанавливается, то все прокси увидев сервер начинают отдавать туда накопленные данные. В этот момент и происходит скачок нагрузки и сервер просто зашивается!
Опять же, насколько я понимаю, прокси никоим образом не пытается понять насколько нагружен сервер, перед тем как отдать ему данные верно?
И что теперь делать? Наращивать мощность сервера - не вариант. Когда с сетью всё в порядке, общий LA не превышает 3-4 на 12 ядерной системе, т.е. в штатных условиях, сервер справляется с нагрузкой без каких-то проблем. Делать крутой сервер только для того, чтобы он держал нагрузку в краткие моменты проблем с сетью - это нерентабельно и неоправдано.
По идее нужен механизм, который бы ограничивал поступление данных на сервер, если он перегружен, но опять же насколько я понимаю, такого механизма нет.
В условиях современного Интернета, когда потеря сетевой связности между сегментами Сети является обычным делом, такогое поведение Zabbix, на мой взгляд, является серьёзной проблемой в архитектуре Zabibx.
Кто что думает, по этому поводу?
Comment