Ad Widget

Collapse

Итоги внедрения 1.4.x

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • easy_john
    Junior Member
    • Jan 2008
    • 28

    #1

    Итоги внедрения 1.4.x

    Небольшие итоги об установке zabbix 1.4.x в большой сети.

    Для нас мониторинговая система должна отвечать двум задачам:
    1. сообщать о выходе какой-либо метрики за пределы нормы (при этом быть достаточно настраиваемой, что бы не завалить однообразными письмами)
    2. давать понимание того, что именно в прошлом, от чего стало плохо.

    по первому пункту:
    - не хватает продвинутой системы оповещения, например возможности повторного отправления сообщений, каждые N минут, пока триггер TRUE. А так же ограничения отправки писем, например не более N сообщений о событиях группы M в течении часа (суток).

    - Очень важное: не хватает статистических формул (в основном для тестирования каналов связи): медианы и выборки "M значений за N времени > X". существующими математическими формулами такую статистику не повторить!

    по второму:
    - нет гибкой выборки периода отображения графиков. зачастую график за час, это слишком много, особенно, если нужно видеть уровень значений между двумя пиками.

    Еще из тонкостей:
    - наличие бесполезных вещей. например аудит (administration - audit). зачем знать что триггер изменен, если нет данных на что он зменился, а главное, каким он был до изменения?

    - возникли трудности с каскадными зависимостями: мы не хотим получать оповещение о "недоступности сервиса, если недоступен весь хост", так же как "о всех хостах, если недоступен коммутатор к которому они подключены". Настройка таких зависимостей, хоть и реализуема теоретически, практически при наличии уже десятка коммутаторов и нескольких десятков серверов изменить все триггеры вручную нет никаких сил. Или я просто не нашел способа их грамотно настроить?

    PS. Бегло поискал сhangelog 1.6.x на сайте, но не нашел. На rootconf слышал только, что вроде добавили возможность не заваливать письмам.. значит все остальные вопросы остаются в силе.
  • Alexei
    Founder, CEO
    Zabbix Certified Trainer
    Zabbix Certified SpecialistZabbix Certified Professional
    • Sep 2004
    • 5654

    #2
    Зачем ставить 1.4 когда есть 1.6 решающий большинство перечисленных проблем?
    Alexei Vladishev
    Creator of Zabbix, Product manager
    New York | Tokyo | Riga
    My Twitter

    Comment

    • easy_john
      Junior Member
      • Jan 2008
      • 28

      #3
      Originally posted by Alexei
      Зачем ставить 1.4 когда есть 1.6 решающий большинство перечисленных проблем?
      Тестирование было, когда ветка 1.6 еще не была релизом.
      Скажите пожалуйста, какие конкретно вещи из перечисленных уже изменились.
      Вероятно мы попробуем еще одну попытку внедрения.

      Comment

      • Alexei
        Founder, CEO
        Zabbix Certified Trainer
        Zabbix Certified SpecialistZabbix Certified Professional
        • Sep 2004
        • 5654

        #4
        Originally posted by easy_john
        Скажите пожалуйста, какие конкретно вещи из перечисленных уже изменились.
        Все изменилось в лучшую сторону. Одинственное ограничение - минимальный отрезок времени для графа ограничен одним часом, но и его легко обойти.
        Alexei Vladishev
        Creator of Zabbix, Product manager
        New York | Tokyo | Riga
        My Twitter

        Comment

        • easy_john
          Junior Member
          • Jan 2008
          • 28

          #5
          Originally posted by Alexei
          Все изменилось в лучшую сторону. Одинственное ограничение - минимальный отрезок времени для графа ограничен одним часом, но и его легко обойти.
          А (самое важное) статистические формулы появились?
          Ну график понятно можно сырыми значениями посмотреть.

          Comment

          • Alexei
            Founder, CEO
            Zabbix Certified Trainer
            Zabbix Certified SpecialistZabbix Certified Professional
            • Sep 2004
            • 5654

            #6
            Originally posted by easy_john
            А (самое важное) статистические формулы появились?
            Вычисляемые айтемы? Нет, но запланированы на 1.8.
            Alexei Vladishev
            Creator of Zabbix, Product manager
            New York | Tokyo | Riga
            My Twitter

            Comment

            • easy_john
              Junior Member
              • Jan 2008
              • 28

              #7
              Originally posted by Alexei
              Вычисляемые айтемы? Нет, но запланированы на 1.8.
              медиана и выборка "M значений за N времени больше(меньше) X"
              без этих вещей мониторить канал бессмысленно.
              значит будем ждать 1.8

              Comment

              • Alexei
                Founder, CEO
                Zabbix Certified Trainer
                Zabbix Certified SpecialistZabbix Certified Professional
                • Sep 2004
                • 5654

                #8
                Originally posted by easy_john
                медиана и выборка "M значений за N времени больше(меньше) X"
                без этих вещей мониторить канал бессмысленно.
                значит будем ждать 1.8
                Медиана - это 95% percentile? Если так, то это уже в графах 1.6. "M значений за N времени больше(меньше) X" поддерживается тригерами.
                Alexei Vladishev
                Creator of Zabbix, Product manager
                New York | Tokyo | Riga
                My Twitter

                Comment

                • easy_john
                  Junior Member
                  • Jan 2008
                  • 28

                  #9
                  Originally posted by Alexei
                  Медиана - это 95% percentile? Если так, то это уже в графах 1.6. "M значений за N времени больше(меньше) X" поддерживается тригерами.
                  Медиана это 50-й процентиль
                  Хорошо. Изучу 1.6. Спасибо.

                  Comment

                  Working...