Ad Widget

Collapse

Написал книгу по enterprise-мониторингу на Zabbix — фидбек приветствуется

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Sobakin
    Junior Member
    • May 2026
    • 1

    #1

    Написал книгу по enterprise-мониторингу на Zabbix — фидбек приветствуется

    Привет всем.

    Собрал в одном месте то, чего мне самому не хватало когда разворачивал Zabbix на крупном предприятии — не туториал по установке, а именно про дизайн системы мониторинга.

    Книга( скорее сборник статей пока) называется Zabbix Enterprise Guide, доступна бесплатно:
    HTML Code:
    https://slowdownyw.github.io/zabbix-enterprise-guide/  https://github.com/slowdownyw/zabbix-enterprise-guide
    Что внутри (15 глав):
    Severity как действие, а не цвет лампочки
    Теги, группы, LLD — системный подход
    Разделение IT и OT-мониторинга
    Runbook'и, SLA, дашборды
    90-day roadmap внедрения, GitOps
    Антипаттерны

    Ориентирована на тех, кому достался Zabbix "как есть" от предыдущей команды, и на тех, кто проектирует мониторинг с нуля.

    Книга живая — статус у каждой главы указан явно (от
    Last edited by Sobakin; 18-05-2026, 11:59.
  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3443

    #2
    Спасибо, интересно, обязательно почитаю.
    Сразу же вопрос: если будут комментарии, то куда их лучше направлять? Комментировать на Гитхабе, или же можно здесь?

    Comment


    • Sobakin
      Sobakin commented
      Editing a comment
      Да можно тут. Структурно она пока неидеальна, но вью дает нормальное, на мой взгляд.
  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3443

    #3
    Да можно тут.
    Начал читать. Ещё раз спасибо, интересно и почти со всем согласен.
    Однако, как профессиональный зануда, позволю себе несколько замечаний

    1. "Любимое" моё замечание, постоянно повторяемое на этом форуме: говоря о каких-то возможностях Zabbix, следует уточнять, о какой версии идёт речь. Я имел возможность работать с Zabbix, начиная с версии 2.0, и могу засвидетельстовать, что продукт постоянно развивается: в каждой новой версии какие-то прежние ограничения убираются, какие-то новые "фичи" добавляются. Другими словами, обсуждать абстрактный Zabbix без указания версии - вещь тоже довольно абстрактная; даже если ваш документ актуален сейчас, то после выхода очередной версии он рискует устареть.

    2. Язык. Это, конечно, придирка - я-то в силу возраста имею опыт и хорошо понимаю профессиональный жаргон, поэтому нормально перевариваю смесь "французского с нижегородским". Такой стиль хорошо подходит, например, для форума и других площадок неформального общения; но ваш проект позиционируется как книга, поэтому было бы желательно, как минимум, сделать на эту тему соответствующий disclaimer ( ) прямо в манифесте.

    3. Замечание, связанное с предыдущим: было бы прекрасно для терминов (понятий) Zabbix иметь в глоссарии их официальные названия по-русски и по-английски. Это, кстати, та область, которой сильно не хватает в официальной документации. Особенно это касается понятий, которые переводятся не дословно ("trigger" - "триггер", "problem" - "проблема"), а другими словами ("item" - "элемент данных", "host" - "узел сети", "service" - вообще зависит от контекста: если речь идёт об SLA, то "услуга", в остальных случаях - как правило, либо "служба", либо "сервис").

    4. При разговоре о тегах имеет смысл упомянуть ссылку на "Template guidelines", где есть список тегов, которые рекомендуется использовать на разных уровнях (шаблон, item, trigger, прототип). Ссылка

    5. В главе про LLD и прототипы явно не хватает упоминаний про макросы с контекстом. Это важнейшая вещь, позволяющая, как минимум, настраивать разные пороговые значения в триггерах для разных обнаруженных объектов одного типа. Общий принцип: для порогового значения можно на уровне шаблона задать значение по умолчанию, которое при необходимости можно переопределить на уровне конкретного хоста (для всех объектов этого хоста), а затем на конкретном хосте ещё и переопределить для конкретного объекта.

    (по мере чтения, возможно, ещё что-нибудь добавлю)
    Last edited by Kos; Yesterday, 08:24. Reason: опечатка

    Comment


    • Sobakin
      Sobakin commented
      Editing a comment
      Спасибо за уделенное время. Уже в работе. Настроен довести дело до конца) Часть поправил сегодня, пока не пушил. Завтра будет апдейт по причесыванию терминологии, англицизмов и т.п. Буду держать в курсе.
  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3443

    #4
    Ещё замечания:
    • Не хватает логичного содержания, чтобы читать книгу последовательно. Вроде бы, с левой стороны есть что-то, что похоже на содержание, но там почему-то глава 16 идёт между главами 6 и 7.
    • Не всегда используемые термины понятны сразу (особенно это относится к аббревиатурам), причём не все из них есть в глоссарии; приходится гуглить. Например, отсутствуют упоминаемые MVP, rac (кстати, попробуйте сами погуглить эту аббревиатуру) или SPAN (какое из значений имеется в виду?).
    • В некоторых местах, видимо, должно быть оформление в виде списка, но этот список "разъезжается". Например:
    • Далеко не все ссылки актуальны. Я, поскольку часто "пасусь" на сайте компании Zabbix, на этой странице сходу вижу несколько:
    Устаревшая ссылка Актуальная
    https://share.zabbix.com https://www.zabbix.com/integrations
    https://www.zabbix.com/documentation/current/en/manual/installation/requirements/best_practices https://www.zabbix.com/documentation/current/en/manual/best_practices
    https://blog.zabbix.com/category/best-practices/ https://blog.zabbix.com/category/handy-tips/
    https://github.com/zabbix-tooling/awesome-zabbix ???
    ссылка на русскоязычное сообщество Zabbix https://www.zabbix.com/forum/in-russian
    • Пара замечаний к подразделу "LLD — где использовать, где нет":
      • Сетевые интерфейсы (net.if.discovery): не только Linux и Windows, но также UNIX (Solaris/AIX/HP-UX) и сетевое оборудование (свитчи, роутеры, фаерволы);
      • Цитата:
    Всегда задавай filter в discovery rule. Не «все интерфейсы», а «{#IFNAME} not match @bonded|loopback|docker»
    Я бы добавил: лучше (особенно в фильтрах!) ссылаться не на глобальное регулярное выражение (как в данном примере), а на регулярное выражение, заданное макросом на уровне шаблона - тогда его при необходимости можно переопределить на уровне конкретного хоста (а исключения обязательно найдутся).
    Пример: «{#IFNAME} does not match {$NET.IF.IFNAME.NOT_MATCHES}», при этом {$NET.IF.IFNAME.NOT_MATCHES} = ^([Ll]o[0-9.]*$|docker|veth|cali|lxc)
    • Цитата:
    При апгрейде версии правки будут потеряны. Только клонировать.
    Я бы уточнил: при апгрейде версии Zabbix шаблоны не обновляются автоматически. Это ручная операция, которую делает админ путём повторного импорта шаблонов; но да - при апгрейде самих шаблонов можно потерять свои прежние правки, поэтому я тоже придерживаюсь практики в проде использовать свои собственные клоны шаблонов.

    Comment


    • Sobakin
      Sobakin commented
      Editing a comment
      Спасибо! По поводу логического содержания, так как это была серия несвязанных заметок, есть небольшой провал в этом вопросе. Но если двигаться по книге, то контекст и понимание должны накапливаться Думаю, добавлю краткие обзорные абзацы в начале каждой главы. Сделаю навигацию более удобной, "читать дальше".
      По поводу аббревиатур, изначально планировалось, что аудитория будет немного подготовлена. Например, тот же SPAN, в контексте мониторинга сети, не должен вызывать вопросов у более-менее погруженного в ИТ читателя. RAC и 1С, то же самое. Добавлю в глоссарий.
      Разметка и линки, принято!
      Техническая часть задумывалась как примитивные демонстрации для концептуального понимания. Про макрос на уровне шаблона, изменю.
      Про риски обновления шаблонов напишу более явно.

      Еще раз благодарю за участие!
Working...