| Service | Count | Downtime | SLA | |
| Server | 137+2 |
|
56,6% | |
| red (род. Server) |
|
12,6% | ||
| green(род. Server) |
|
76,6% | ||
| blue(род. Server) |
|
26,6% | ||
| Routers | 24+3 |
|
60,6% | |
| red (род. Routers) |
|
56,6% | ||
| green(род. Routers) |
|
90,6% | ||
| blue(род. Routers) |
|
99,6% | ||
Необходимо организовать мониторинг сервисов по методике SLA. Планируется отслеживать доступность роутеров, серверов, сервисов внутри компании. Стандартный Dashoboard предоставляемый в zabbix не совсем устраивает. После продолжительного времени пришли к выводу что необходимо выводить для всеобщего обозрения следующий дашборд (см таблицу)
1 колонка - Service
Здесь за основу по сути пойдет то что мы видим в "Услуги" название родителя и его "child". Здесь в целом все ясно.
2 Колонка -Count.
Здесь хотят видеть общее количество узлов которое мониторятся (тоесть, допустим серверов было 120 на понедельник, в течение недели добавили еще 2 и после добавления в систему нам показывается этот прирост).
3.Колонка Downtime по сути эти данные есть если провалиться в услугах по любому из дереву или его child
4. Колонка - SLA
Cобственное само SLA... Хорошо бы если в zabbix можно было задавать исходное значение. Допустим за месяц должно быть не больше 40 часов простоя и SLA считалось от этого значения.
Кто либо делал похожие проекты может есть наработки?
Готов услышать советы или наработки можно и на платной основе
Comment