Ad Widget

Collapse

Мониторинг программного рейда в linux на zabbix.

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • lexey
    Senior Member
    • Sep 2011
    • 104

    #16
    при создании триггера опять такая же ошибка
    я так и не понял как использовать текстовое выражение триггера

    какая функция триггера задействована у Вас в этом выражении?
    {HOSTNAME:hp.battery.regexp(Failed)}=1

    не могу найти regexp у меня версия zabbix 1.8
    Last edited by lexey; 09-04-2014, 12:55.

    Comment

    • lexey
      Senior Member
      • Sep 2011
      • 104

      #17
      из списка условий что нужно выбрать чтобы появилось правильная проверка на соответствие текстового поля?
      когда raid.status принимает числовые значения все понятно, можно выбрать условие например больше или меньше 1.
      а как быть с текстовыми?

      например хотел сделать условие Last Value NOT N но выдает такую ошибку...
      говорит что не верный формат, пробовал и другие значения но не могу найти правильный
      Incorrect trigger expression format " {constant}#Controller Status: OK "
      Check expression part starting from " {my_server:hp.controller.last(5)}#Controller Status: OK "
      Attached Files
      Last edited by lexey; 09-04-2014, 12:10.

      Comment

      • lexey
        Senior Member
        • Sep 2011
        • 104

        #18
        взял выражение
        find string T last value. N=X, where X is 1 - if found, 0 - otherwise
        T = OK
        N = 1

        в итоге получилось
        {my_server:hp.controller.str(OK)}=1

        если не найдет T то N<>X и триггер сработает

        проверить на живых серваках не хочется, будет ли так работать?

        Comment

        • aib
          Senior Member
          • Jan 2014
          • 1615

          #19
          Если боитесь на живых серваках пробовать - пробуйте на Zabbix Server.
          Создайте противоположный триггер и проверьте, что получается.
          Code:
          {my_server:hp.controller.str(OK)}#1
          Если триггер срабатывает, когда все в порядке - отлично, то что надо

          Меняем обратно знак сравнения и всё.
          Sincerely yours,
          Aleksey

          Comment

          • lexey
            Senior Member
            • Sep 2011
            • 104

            #20
            нашел тестовый сервер для проверки, raid 1 и две жестких диска.
            вытащил один диск. в утилитах hp состояние Raid с ошибкой.

            однако
            C:\Documents and Settings\admin>,"C:\Program Files\Compaq\Hpacucli\Bin\hpacucli.
            exe" ctrl all show status

            Smart Array 6i in Slot 0
            Controller Status: OK
            Cache Status: Disabled
            Battery Status: Failed

            C:\Documents and Settings\admin>,"C:\Program Files\Compaq\Hpacucli\Bin\hpacucli.
            exe" ctrl slot=0 pd all show

            Smart Array 6i in Slot 0
            array A (Failed)
            physicaldrive 1:0 (port 1:id 0 , Parallel SCSI, 0 Byte, Failed)
            physicaldrive 1:1 (port 1:id 1 , Parallel SCSI, 72.8 GB, OK)
            не пойму почему состояние контроллера OK?
            тогда нужно проверять каждый жесткий диск?

            C:\Documents and Settings\admin>,"C:\Program Files\Compaq\Hpacucli\Bin\hpacucli.
            exe" ctrl slot=0 pd all show |find "physicaldrive 1:0"
            physicaldrive 1:0 (port 1:id 0 , Parallel SCSI, 0 Byte, Failed)
            опять же не понятно как сделать триггер, используя эту выводимую строку
            {my_server:hp.drivers.str(physicaldrive 1:0 (port 1:id 0 , Parallel SCSI, 0 Byte, Failed))}#1
            где hp.drivers - жесткие диски сервака
            или как бы сделали Вы?
            Last edited by lexey; 10-06-2014, 11:29.

            Comment

            • aib
              Senior Member
              • Jan 2014
              • 1615

              #21
              Состояние контроллера ОК, потому-что сам контроллер работает.
              Это батарейки у него нет(или сдохла), даи подключенный диск поломался.

              А сам контроллер doing well, sir, yes, sir!

              Если вам нужно состояние RAID - То его и надо контролировать.
              И проще контролировать только слово OK или FAILED, в зависимости от того, что вам удобнее.
              Триггер по НЕ наличию OK - или триггер по наличию FAILED сделать одинаково просто.

              PS чисто для собственного любопытства. Вы назвали тему "МОниторинг рейда в Linux" - а все примеры приводите под Windows. Что-то поменялось в планах после создания темы, но перед первыми экспериментами?
              Sincerely yours,
              Aleksey

              Comment

              • yukra
                Senior Member
                • Apr 2013
                • 1359

                #22
                Originally posted by aib
                PS чисто для собственного любопытства. Вы назвали тему "МОниторинг рейда в Linux" - а все примеры приводите под Windows. Что-то поменялось в планах после создания темы, но перед первыми экспериментами?
                Тему создал некто strike1984 08-04-2010, а lexey тут появился 01-04-2014 со словами "Чтобы не поднимать новую тему напишу тут", а потом 03-04-2014 вспомнил что у него есть еще оказывается Windows, но решил тему не менять.

                Comment

                • aib
                  Senior Member
                  • Jan 2014
                  • 1615

                  #23
                  oops!
                  my bad, sorry

                  "Продолжаем разговор" (с) Малыш и Карлсон
                  Sincerely yours,
                  Aleksey

                  Comment

                  • lexey
                    Senior Member
                    • Sep 2011
                    • 104

                    #24
                    Originally posted by aib
                    ps чисто для собственного любопытства. Вы назвали тему "МОниторинг рейда в linux" - а все примеры приводите под windows. Что-то поменялось в планах после создания темы, но перед первыми экспериментами?
                    тему создовал не я, просто решил продолжить. Настроил мониторинг программых рейд, а аппаратных не было сервера поэксперементировать, вот только нашел для эксперементов подходящий сервер.

                    Comment

                    • lexey
                      Senior Member
                      • Sep 2011
                      • 104

                      #25
                      Originally posted by aib
                      Состояние контроллера ОК, потому-что сам контроллер работает.
                      Это батарейки у него нет(или сдохла), даи подключенный диск поломался.

                      А сам контроллер doing well, sir, yes, sir!

                      Если вам нужно состояние RAID - То его и надо контролировать.
                      понял что состояние контроллера OK почему, не понял как из выводимого конфига hpacucli вытянуть состояние RAID, точнее не нашел.
                      Диск я вытащил сам, для проверки вот он и оказался Failed
                      получается нужно каждый диск опрашивать, а состояние RAID нету

                      а если сделать так, если есть ОК или Failed то выводиться строка содержащяя значение
                      не понятно какое значение выбрать в триггере для проверки данного действия
                      C:\Documents and Settings\admin>,"C:\Program Files\Compaq\Hpacucli\Bin\hpacucli.
                      exe" ctrl slot=0 pd all show |find "Failed"
                      array A (Failed)
                      physicaldrive 1:0 (port 1:id 0 , Parallel SCSI, 0 Byte, Failed)

                      C:\Documents and Settings\admin>,"C:\Program Files\Compaq\Hpacucli\Bin\hpacucli.
                      exe" ctrl slot=0 pd all show |find "OK"
                      physicaldrive 1:1 (port 1:id 1 , Parallel SCSI, 72.8 GB, OK)
                      Last edited by lexey; 11-06-2014, 09:06.

                      Comment

                      • aib
                        Senior Member
                        • Jan 2014
                        • 1615

                        #26
                        Простейший вариант - создать триггеры для:
                        - контроллера
                        - батареи контроллера
                        - каждого диска

                        В этом случае вы сможете самостоятельно назвать триггеры, добавив характерное описание. Например, назвать триггер "Верхний левый диск во второй корзине справа - FAILED".

                        Более сложный вариант - использовать в триггере функцию
                        Code:
                        [B]str 	[/B]1st - string, 2nd - sec or #num 	str, log, text
                        	Find string in last (most recent) value. Parameter defines string to find. Case sensitive!
                        Second optional parameter is number of seconds or number of collected values to analyse. In this case more than one value will be processed.
                        Returns:
                        1 - found
                        0 - otherwise
                        Пример использования:
                        Code:
                        [B]Пример 6[/B]
                        
                        Zabbix агент нуждается в обновлении
                        
                        Используем функцию str():
                        
                        {zabbix.zabbix.com:agent.version.str("beta8")}=1
                        
                        Это выражение будет определено как ПРОБЛЕМА, когда версия Zabbix агента содержит в себе 'beta8' (возможно 1.0beta8).
                        в вашем случае будет что-то вроде
                        Code:
                        {server_name:raid.drive.str("FAILED")}=1
                        и триггер будет срабатывать, если в пришедших данных встретит слово FAILED
                        Sincerely yours,
                        Aleksey

                        Comment

                        • ArtemK
                          Senior Member
                          • May 2013
                          • 232

                          #27
                          могу выложить шаблон и powershell скрипт, который сам написал для мониторинга HP'шных RAID'ов. Там и дискавери есть и прочее. Велосипед вероятно далёк от идеала, но у меня нормально пашет. Надо?

                          Comment

                          • aib
                            Senior Member
                            • Jan 2014
                            • 1615

                            #28
                            Да, пожалуйста!
                            Буду рад!!!
                            Sincerely yours,
                            Aleksey

                            Comment

                            • ArtemK
                              Senior Member
                              • May 2013
                              • 232

                              #29
                              HP RAID скрипты и шаблон. Скачать без смс и регистрации

                              Так скриптов оказалось побольше, я и не помнил уже. Но там readme найдете, я думаю, разберётесь. Надеюсь, велосипед будет полезным

                              Comment

                              Working...