Ad Widget

Collapse

Шаблоны для Allied Telesis

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • dima_dm
    Senior Member
    • Dec 2009
    • 2697

    #16
    Originally posted by aprudnev
    Мне очень бы хотелось такое увидеть в заббиксе (и не только для сетевых объектов - скажем для сервера видеть одну тулбар - процессор, цветами system/user, вторую IO, третью memory). Дико не хватает. Толку от того что все зеленое если там может на всех портах идет трафик шторм в 50% загрузки (видел много раз).
    Вы можете создать такие отчёты через комплексные экраны или карты.
    Мое мнение, что сводные таблички интересны только HelpDesk, которые всё равно ничего сделать не могут, их задача только увидеть аварию и сообщить кому нужно, с этой задачей успешно справляется красный круг вокруг проблемного элемента и соответствующее оповещение. А для анализа аварии нужны подробные графики и детальные данные.
    Как показывает практика, чем больше выдать данных для анализа HelpDesk, тем дольше они думают и пытаются что-то анализировать, прежде чем вызвать специалиста, и теряется драгоценное время.
    Неоднократно наблюдал мощные DDoS атаки на сетевые сегменты. При атаке подскакивает загрузка CPU, Memory ну и загрузка портов, в этот момент оборудование вообще перестаёт отвечать на SNMP запросы, даже если съем данных проходит по выделенному линку. Поэтому толку будет не много.
    Я решаю подобные задачи комплексным мониторингом, т.е. провожу полноценный мониторинг не только всех компонентов сети, но и серверов за ними. Мое мнение, что только при такой организации мониторинга, можно увидеть полную картину аварии.
    В этой схеме есть дублированные данные, например по загрузке порта, снимаются и с сервера и switch, Firewall и Router-a, зато понижается вероятность, что я вообще ничего не увижу на мониторинге в момент атаки.
    Работает схема хорошо, атаки на сегменты я вижу в реальном времени и с подробными графиками. Раньше всех срабатывают оповещения по серверам, это самый чувствительный индикатор здоровья сети.
    Last edited by dima_dm; 30-10-2010, 10:13.

    Comment

    • aprudnev
      Junior Member
      • Oct 2010
      • 17

      #17
      Originally posted by dima_dm
      Вы можете создать такие отчёты через комплексные экраны или карты.
      Мое мнение, что сводные таблички интересны только helpdesk, которые всё равно ничего сделать не могут, их задача только увидеть аварию и сообщить кому нужно, с этой задачей успешно справляется красный круг вокруг проблемного элемента и соответствующее оповещение. А для анализа аварии нужны подробные графики и детальные данные.
      Как показывает практика, чем больше выдать данных для анализа helpdesk, тем дольше они думают и пытаются что-то анализировать, прежде чем вызвать специалиста, и теряется драгоценное время.
      Неоднократно наблюдал мощные ddos атаки на сетевые сегменты. При атаке подскакивает загрузка cpu, memory ну и загрузка портов, в этот момент оборудование вообще перестаёт отвечать на snmp запросы, даже если съем данных проходит по выделенному линку. Поэтому толку будет не много.
      Я решаю подобные задачи комплексным мониторингом, т.е. провожу полноценный мониторинг не только всех компонентов сети, но и серверов за ними. Мое мнение, что только при такой организации мониторинга, можно увидеть полную картину аварии.
      В этой схеме есть дублированные данные, например по загрузке порта, снимаются и с сервера и switch, firewall и router-a, зато понижается вероятность, что я вообще ничего не увижу на мониторинге в момент атаки.
      Работает схема хорошо, атаки на сегменты я вижу в реальном времени и с подробными графиками. Раньше всех срабатывают оповещения по серверам, это самый чувствительный индикатор здоровья сети.

      Как раз наоборот. Именно что сводные таблички позволяют видеть обстановку не хэлпдэску а тем кто начинает разбираться, а кроме того, я например на нее просто поглядываю время от времени и изредка нахожу интереснейшие вещи, которые больше вообще НИЧЕМ найти невозможно. Примеры:
      - вдруг на ВСЕХ портах 10 процентов трафика. НА ВСЕХ. Причина - какой то бродкаст или же потерянный динамический мак адрес (такое бывает если к примеру роутинг несимметричный а таймаут на арпу длиннее таймаута на кеш мак адресов.
      - небольшие но постоянные ошибки.
      - в свитч включили хаб зацикленный сам на себя. Результат - бродкаст шторм по ВСЕМ портам.
      - пару лет назад - у нас день, в другой стране ночь, наблюдаем исходящий трафик. День, другой третий. Задумываемся, вешаем туда нетфлоу, находим файлообменник.

      Дело в том что человек лучше всего запоминает именно зрительные образы. И поэтому когда я вижу картинку
      - все порты сети на которых есть заметный трафик
      - вместе с показателями этого трафика
      - и это о 2000 объектов

      то я ее могу мгновенно оценить. Никакой триггер или автоматический алгоритм этого сделать не в состоянии. Абсолютно. Другое дело, что триггеры тоже нужны, но ведь частое явление
      - прибегают соседи - _что то странное_
      - смотрим на картинку. Вроде все нормально, но... необычно.
      - через 5 минут на зеленым линиям видим что вроде как трафик по туннелям идет явно неверно. А также то что перегружены пара файреволлов у черта на рогах. Не настолько чтобы алерты вызвать но много выше чем обычно.
      - через 2 минуты находим причину.

      Графики вещь хорошая (они там тоже есть причем не простые а с числом пакетов и со средними размерами пакетов) но это уже для тонкого анализа. А для _что происходит_ именно общая картинка загрузки, алерты и ворнинги - это уже _поздно пить боржоми, почки отваливаются_.

      Причем это же не графики а именно компактные бары загрузки. На один экран влезает около тысячи объектов. Причем система выбирает - скажем показывать лишь каналы на которых загрузка больше 1 процента или пакетов в секунду больше 100. Цветом статус, длиной трафик, ошибки, потери... Если была дос атака - на экране светится последнее снятое состояние, там такую атаку видно вообще МГНОВЕННО - просто сразу, даже и думать не приходится... Автоматические же триггеры многие вещи не увидят - не увидят _необычный трафик_, не увидят например то что я вижу сейчас - явно неверный роутинг в одном месте, не увидят _вдруг все порты показывают одинаковые 5 мегабит загрузки - все на трех свитчах..._ и так далее. На все случаи триггеров не напасешься. Может у меня сейчас 10 серверов имеют 80% загрузки... в принципе такая загрузка нормальна и я не могу на нее триггер вешать, но я хочу видеть - тогда я смогу заранее оценить наступающие кранты и принять меры. Триггеры я на это не напишу - а глазами увижу мгновенно. Причина - как я уже сказал - мозг образы распознает очень эффективно, куда лучше чем компьютер.


      Вот прямо сейчас - я открыл один из экранов (активные каналы продакшена) и СРАЗУ, за 2 секунды, могу сказать что происходит
      - ночь
      - бэкап сервера базы данных (вижу откуда и куда идет трафик)
      - бэкап еще одного сервера
      - еще что то идет по туннелю с другим городом
      - все остальное спокойно, все спят хотя понемногу пакетики бегают
      - все в порядке

      Все это за пару секунд. Заббикс мне покажет все зеленым. Покажет ну 4 - 8 графиков на одном экране. А та система мне отобрала из нескольких тысяч наиболее интересные каналы, и показала их больше сотни сразу... а мозг мгновенно оценил и выдал свою оценку (предыдущий абзац). (Я уменьшил чтобы не показывать конкретные названия и прочее).

      Дальше я ткну если хочу мышей в канал с трафиком и там будут такие же графики. Собственно, дальше уже и заббикс все отлично делает Но вот увидеть все вместе он не позволяет, и потому вы не сможете по заббиксу определить _что у меня сейчас происходит_. А по snmpstat я определяю это мгновенно даже в такой ночной ситуации -все спят-.
      Attached Files
      Last edited by aprudnev; 30-10-2010, 12:14.

      Comment

      • dima_dm
        Senior Member
        • Dec 2009
        • 2697

        #18
        Когда Вы подробнее написали о чём речь, я понял основную мысль. Вывести 1000 элементов на один экран в хорошо читаемом виде, это очень хорошая идея.
        Попробуйте разместить запрос на новую фичу для комплексных экранов.

        P.S. для читателей форума snmpstat http://snmpstat.sourceforge.net/
        Last edited by dima_dm; 30-10-2010, 13:34.

        Comment

        • aprudnev
          Junior Member
          • Oct 2010
          • 17

          #19
          Originally posted by dima_dm
          Когда Вы подробнее написали о чём речь, я понял основную мысль. Вывести 1000 элементов на один экран в хорошо читаемом виде, это очень хорошая идея.
          Попробуйте разместить запрос на новую фичу для комплексных экранов.

          P.S. для читателей форума snmpstat http://snmpstat.sourceforge.net/
          На самом деле там две идеи
          (1) Компактрые пефоменс бары. Каждый бар - линия, возможно несколько цветов (я скажем рисую трафик - потери - ошибки зеленым - красным - желтым) толщиной в 1 пиксель. К одному объекту легко цепляются примерно 2 - 4 таких бара.
          (2) Правило АКТИВНОСТИ, то есть можно высвечивать не все а попросить систему -показывай лишь серверы с CPU больше 10% или LA больше 2 или IO больше 1 мегабайта в секунду- (или с любой ошибкой). В snmpstat это хардкодед, но естественно просится через простенькое правило (в случае универсальной системы типа заббикса)

          И вот в сумме это дает очень интересные результаты.

          (А snmpstat собственно я и поддерживаю, но абсолютно не хватает рук да и устарело там уже многое, кроме двух вещей
          - очень простой конфигурации мониторинга (он сам умеет находить интерфейсы по их имени причем несколькими способами)
          - презентейшен лейера с интегрированной картиной мира...

          А, ну еще там простенькая идея работает - всегда на экране есть маленький фрейм с текущим состоянием _сколько чего в каком статусе_ и с именем последнего поменявшегося объекта - даже если делаешь что-то еще, сразу видишь проблему. Была еще одна фича - можно было включить режим _при падении играет злобная музыка пока оператор тикет не создаст_ - тоже очнеь помогало если есть сервис 24x7

          Ну и эффективность но оно и очевидно - базы там нету, просто файлы которые потом через пару месяцев обобщаются в тренды.

          Практически все оно есть в заббиксе и много лучше, кроме вот тех двух вещей.)
          Last edited by aprudnev; 30-10-2010, 21:22.

          Comment

          • Jimson
            Senior Member
            • Jan 2008
            • 1327

            #20
            ну раз snmpstat устарел и поддерживать его, если я правильно понял, уже и не очень хочется, то почему бы не приложить навыки к zabbix самостоятельно и к открытию ZBXNEXT приложить еще и пачик ?
            расширение функционала скринов, на мой взгляд, вещь очень насущная, к тому же новый элемент скрина + новый тип графика сущность обособленная, сопровождать ее будет достаточно просто, а ее наличие и кол-во следящих за соответсвующим ZBXNEXT будет сигналить разработчикам о востребованности лучше чем скучный и одинокий ZBXNEXT без каментов и пачика

            Comment

            • aprudnev
              Junior Member
              • Oct 2010
              • 17

              #21
              Originally posted by Jimson
              ну раз snmpstat устарел и поддерживать его, если я правильно понял, уже и не очень хочется, то почему бы не приложить навыки к zabbix самостоятельно и к открытию ZBXNEXT приложить еще и пачик ?
              расширение функционала скринов, на мой взгляд, вещь очень насущная, к тому же новый элемент скрина + новый тип графика сущность обособленная, сопровождать ее будет достаточно просто, а ее наличие и кол-во следящих за соответсвующим ZBXNEXT будет сигналить разработчикам о востребованности лучше чем скучный и одинокий ZBXNEXT без каментов и пачика

              Я уже подумал об этом. Хотелось бы сделать такое расширение, но с кем то кто знает хорошо - скажем, я могу сидеть и отлаживать тонкости как рисовать оные бары или какие параметры нужно ввести в _статус вью_, но скажем как ввести новый тип объекта или апдейтить оный скрин через adjax - с нуля займет слишком много времени... Пару дней подумаю и наверное попробую сформулировать риквест (заодно проведу опрос в своей компании, что из snmpstat хотелось бы перенести в заббикс).

              На самоа деле это в таком виде не замена snmpstat а расширение заббикса. А вот что касается замены то оно не так просто. snmpstat имеет очень простую конфигурацию

              router-name snmp-community ip-address {
              interface * object-name [/priority]
              ....
              }

              router-name ...

              Примерно

              eqx-sw-gb-1a xxxxx eqx-sw-1gb-1a {
              Gi0/1 * server1
              Gi0/2 * server2
              Gi0/3 * 0/3-vlan25
              ...

              плюс есть правило которое меняет северити событий - упавший канал первую минуту имеет иную северити и иной цвет, чем упавший больше минуты назад, аналогично и вставший назад.

              В итоге легко мониторится несколько тысяч портов, очень простая конфигурация (да и ее легко сгенерировать), система сама знает как искать snmp по именам, знает еще кучу встроенных правил (типа что на туннелях - если нет входного трафика то это плохое состояние). Что то легко ложится на универсальный заббикс, а что то не очень, скажем распознавание портов по их именам и использорвание потом имен объектов подключенных туда - так себе ложится... Поэтому с заменой snmpstat - это уже второй этап, не такой простой. А вот первый - расширение - достаточно понятный и его я быстро сформулирую и наверное поучавствую в исполнении.

              Comment

              • 24pm
                Junior Member
                • Oct 2010
                • 25

                #22
                Originally posted by dima_dm
                Открепите шаблон от хоста, чтобы в хосте не осталось никаких элементов и прикрепите снова, и всё у Вас получится.
                Спасибо, график действительно появился, только почему-то на Мониторинг - Графики приходится выбирать график из низпадающего списка Графиков, а если там выбрано "График=все", то нет ни списка графиков ни их самих. Это так и должно быть?

                Спасибо dima_dm ещё раз за оперативность! Такой тех.поддержки я не встречал за 6 лет ещё нигде, хотя пользуюсь и многими платными!

                aprudnev, успеха вам! Идея очень интересная! Было бы замечательно увидеть это в Zabbix!

                P.S. Можно ли в графиках задавать свои подписи в легенде? И переназначать для отдельных хостов, если подпись должна отличаться от той, что в шаблоне?

                P.P.S. Можно ли сделать комплексный экран для шаблона? Т.к. по серверам мне в принципе нужны одинаковые экраны.
                Last edited by 24pm; 01-11-2010, 12:32.

                Comment

                • dima_dm
                  Senior Member
                  • Dec 2009
                  • 2697

                  #23
                  Originally posted by 24pm
                  Спасибо, график действительно появился, только почему-то на Мониторинг - Графики приходится выбирать график из низпадающего списка Графиков, а если там выбрано "График=все", то нет ни списка графиков ни их самих. Это так и должно быть?
                  Да. Так и должно быть.

                  Originally posted by 24pm
                  P.S. Можно ли в графиках задавать свои подписи в легенде? И переназначать для отдельных хостов, если подпись должна отличаться от той, что в шаблоне?
                  В Zabbix 1.8.4 будет.

                  User macros were extended so that they can be used in both trigger and item names.

                  Originally posted by 24pm
                  P.P.S. Можно ли сделать комплексный экран для шаблона? Т.к. по серверам мне в принципе нужны одинаковые экраны.
                  Можно использовать галочку "Динамический элемент" при добавлении графика в комплексный экран. Тогда Вы сможете выбирать хосты из выпадающего списка, и видеть по ним графики.

                  Comment

                  • zalex_ua
                    Senior Member
                    Zabbix Certified Trainer
                    Zabbix Certified SpecialistZabbix Certified Professional
                    • Oct 2009
                    • 1286

                    #24
                    Originally posted by dima_dm
                    Originally posted by 24pm
                    P.P.S. Можно ли сделать комплексный экран для шаблона? Т.к. по серверам мне в принципе нужны одинаковые экраны.
                    Можно использовать галочку "Динамический элемент" при добавлении графика в комплексный экран. Тогда Вы сможете выбирать хосты из выпадающего списка, и видеть по ним графики.
                    Дополнительно к сказанному: в версии 2.0 появятся действительно комплексные экраны для шаблонов. Именно то что спраштвает 24pm

                    Comment

                    • Jimson
                      Senior Member
                      • Jan 2008
                      • 1327

                      #25
                      Originally posted by zalex_ua
                      Дополнительно к сказанному: в версии 2.0 появятся действительно комплексные экраны для шаблонов. Именно то что спраштвает 24pm
                      ну судя по всему будет 1.9 перед 2.0 и скрины уже там будут (в смысле есть)

                      Comment

                      • dima_dm
                        Senior Member
                        • Dec 2009
                        • 2697

                        #26
                        Originally posted by Jimson
                        ну судя по всему будет 1.9 перед 2.0 и скрины уже там будут (в смысле есть)
                        В Zabbix просто такая система нумерации релизов, все нечётные, это не стабильные alpha релизы. Стабильные релизы все чётные.
                        Т.е.
                        1.7.X - не стабильный релиз
                        1.8.X - стабильный.
                        Где-то я об этом читал, но где, не помню.
                        Last edited by dima_dm; 02-11-2010, 08:40.

                        Comment

                        • zalex_ua
                          Senior Member
                          Zabbix Certified Trainer
                          Zabbix Certified SpecialistZabbix Certified Professional
                          • Oct 2009
                          • 1286

                          #27
                          Originally posted by Jimson
                          ну судя по всему будет 1.9 перед 2.0 и скрины уже там будут (в смысле есть)
                          Да они уже есть в транке (альфа 1.9.0 уже даже выпущена) - я уже испытал - работает.

                          Originally posted by dima_dm
                          В Zabbix просто такая система нумерации релизов, все нечётные, это не стабильные alpha релизы. Стабильные релизы все чётные.
                          Т.е.
                          1.7.X - не стабильный релиз
                          1.8.X - стабильный.
                          Где-то я об этом читал, но где, не помню.
                          Вот оно.

                          Comment

                          • 24pm
                            Junior Member
                            • Oct 2010
                            • 25

                            #28
                            Originally posted by dima_dm
                            Я рекомендую всем использовать генератор, т.к. попробовал уже все возможные в Zabbix способы мониторинга сетевого оборудования.
                            ...
                            > Originally Posted by 24pm View Post
                            > P.S. Подскажите, пожалуйста, можно ли включить в название графика название порта? Или хотя бы гре-нибудь в описании?

                            Вот генератор и решит эту и много других задач, с которыми Вы будите сталкиваться в процессе настройки мониторинга.
                            Посмотрел скрипт cisco_xml.pl... есть ли где нибудь быстрое how-to как что в нём нужно исправить, чтоб заточить под мониторинг своего устройства? Возникло 2 вопроса:

                            1) В коде часто упоминается OID'ы .1.3.6.1.2. на моём же Allied Telesis они начинаются с "iso.3.6.1.2.1." - это значит нужно поменять их по всему коду? Если так, то подскажите, пожалуйста, где можно узнать значение этих OID'ов для моего устройства, На форуме аллайда мне не отвечают... может быть есть общая теория или способ как получить их описание?

                            2) Как с помощью Вашего скрипта включить в график название порта? Или он уже это делает без доп. настройки?

                            Comment

                            • dima_dm
                              Senior Member
                              • Dec 2009
                              • 2697

                              #29
                              Originally posted by 24pm
                              1) В коде часто упоминается OID'ы .1.3.6.1.2. на моём же Allied Telesis они начинаются с "iso.3.6.1.2.1." - это значит нужно поменять их по всему коду? Если так, то подскажите, пожалуйста, где можно узнать значение этих OID'ов для моего устройства, На форуме аллайда мне не отвечают... может быть есть общая теория или способ как получить их описание?
                              OID'ы для вашего устройства нужно искать на сайтах поддержки этих устройств.
                              Для перевода OID-в в числовую форму и наоборот используйте


                              iso= 1
                              т.е. iso.3.6.1.2.1. = 1.3.6.1.2.1
                              Originally posted by 24pm
                              2) Как с помощью Вашего скрипта включить в график название порта? Или он уже это делает без доп. настройки?
                              Да, делает.

                              Comment

                              • 24pm
                                Junior Member
                                • Oct 2010
                                • 25

                                #30
                                Спасибо, dima_dm сайт Cisco действительно расшифровывает OIDы (видимо они стандартные): заменил iso на 1 и убрал последнюю цифру - и всё стало хорошо

                                Сгенерировал xml с помощью cisco_xml.pl, но при импорте в Zabbix получил ошибку:
                                Code:
                                    * Некорректный формат ключа 'key_name[param1,param2,...]'
                                    * Cannot create Item
                                В xml подстроку "key_name" не нешёл - видимо ругается на синтаксис самого файла. Подскажите, пожалуйста, что нужно посмотреть...

                                Comment

                                Working...