Ad Widget

Collapse

Мониторинг параметров raid на hp

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Incher
    Member
    • Sep 2012
    • 38

    #1

    Мониторинг параметров raid на hp

    Имеется несколько серверов HP ProLiant, мониторинг параметров RAID ведется с помощью "родной" утилиты HP - hpacucli. Пользовательские параметры такие:
    Code:
    UserParameter=raid.status[*],sudo /usr/sbin/hpacucli ctrl slot=$1 show status |grep -i $2 |tail -n1 |cut -d' ' -f6
    UserParameter=raid.volume[*],sudo /usr/sbin/hpacucli ctrl slot=$1 ld $2 show |grep -i status |cut -d' ' -f11
    UserParameter=raid.drive.status[*],sudo /usr/sbin/hpacucli ctrl slot=$1 pd 1I:1:$2 show |grep -i status |cut -d' ' -f11
    Первый параметр считывает состояние либо контроллера, либо кэша (в зависимости передаваемого в ключе аргумента).
    Второй - состояние логических дисков (RAID-томов), третий - состояние физических дисков. Частота обновления - 10 минут.
    Однако, история значений, например, для физ. диска выглядит странно (прилагаю скриншот) - несколько раз подряд приходит "OK", потом несколько пустых значений, потом снова "OK" и т.п. То есть значения поступают нерегулярно, хотя сбоев в работе RAID'а не отмечалось. На другом сервере такая жа картина для статуса кэша и логич. диска.

    С чем это может быть связано?
    Attached Files
  • dima_dm
    Senior Member
    • Dec 2009
    • 2697

    #2
    Скорее всего с установленными Timeout для zabbix_agent и zabbix_server.
    Попробуйте увеличить таймауты для zabbix_agent и zabbix_server
    /etc/zabbix/zabbix_agentd.conf
    Timeout=30
    /etc/zabbix/zabbix_server.conf
    Code:
    ### Option: Timeout
    #       Specifies how long we wait for agent, SNMP device or external check (in seconds).
    #
    # Mandatory: no
    # Range: 1-30
    # Default:
    Timeout=30
    И рестартовать zabbix_agent и zabbix_server
    По умолчанию там 3 сек Timeout

    Comment

    • Incher
      Member
      • Sep 2012
      • 38

      #3
      Originally posted by dima_dm
      Скорее всего с установленными Timeout для zabbix_agent и zabbix_server.
      Попробуйте увеличить таймауты для zabbix_agent и zabbix_server
      /etc/zabbix/zabbix_agentd.conf
      Timeout=30
      /etc/zabbix/zabbix_server.conf
      Code:
      ### Option: Timeout
      #       Specifies how long we wait for agent, SNMP device or external check (in seconds).
      #
      # Mandatory: no
      # Range: 1-30
      # Default:
      Timeout=30
      И рестартовать zabbix_agent и zabbix_server
      По умолчанию там 3 сек Timeout
      На zabbix-сервере таймаут был установлен 30 сек., на одном из наблюдаемых серверов тоже 30, на другом 3, но ситуация у них аналогичная, изменила на втором с 3 на 30, может, его показания изменятся, однако на первом сервере, видимо, дело не в таймауте...

      Comment

      • dima_dm
        Senior Member
        • Dec 2009
        • 2697

        #4
        Делали?
        >И рестартовать zabbix_agent и zabbix_server
        Посмотрите время выполнения скрипта, возможно оно превышает 30 секунд.
        P.S. Состояние дисковой подсистемы можно мониторить и по SNMP через hp-agents

        Comment

        • Bock
          Junior Member
          • Feb 2013
          • 26

          #5
          Скорее всего проблема в том, что обновление этих items у вас идёт одновременно. А 2 запущенных hpacucli быть не может и там возникает ошибка.
          Лично мы дёргаем hpacucli каждые 10-15 минут и кладём в /tmp, где уже скриптами грепаем на плохое состояние.

          Comment

          • WarBull
            Junior Member
            • Feb 2012
            • 26

            #6
            Скажите плиз а под Виндой какие команды использовать?
            У меня несколько серваков dl380 - нужно снимать показания с raidов

            Comment

            • Bock
              Junior Member
              • Feb 2013
              • 26

              #7
              Судя по интернету, hpacucli есть и под винду.
              Писать, видимо, свои кастомные UserParameters под это.

              Comment

              • _AlekseY_
                Member
                • Apr 2012
                • 77

                #8
                Под винду рекомендую вот эту тему посмотреть - https://www.zabbix.com/forum/showthread.php?t=27057
                Отличные шаблоны. Доступное описание. Мониторит кучу параметров.

                Comment

                • WarBull
                  Junior Member
                  • Feb 2012
                  • 26

                  #9
                  Интересная ветка, сделал как там написано. У меня HP Proliant DL 380 G5, накатил HP Smart Array, Cli, WBEM под свою 2003 винду 64-bit, в конце конфига дописал:
                  ################################################HP _Server#################################
                  #hp discovery
                  #
                  UserParameter=hp.discovery[*],cscript "C:\Program Files (x86)\Zabbix Agent\zabbix_hp_discovery.vbs" //Nologo "$1"
                  #hp wbem
                  UserParameter=hp.wbem[*],cscript "C:\Program Files (x86)\Zabbix Agent\zabbix_hp_wbem.vbs" //Nologo "$1" "$2" "$3"
                  #hp system
                  UserParameter=hp.system[*],cscript C:\Program Files (x86)\Zabbix Agent\zabbix_hp_system.vbs" //Nologo "$1"
                  #eventlog query
                  UserParameter=eventlog.query[*],cscript "C:\Program Files (x86)\Zabbix Agent\zabbix_win_eventlog.vbs" //Nologo "$1" "$2"
                  # allow weird chars in userparameters arguments
                  UnsafeUserParameters=1

                  Также разрешил запись лога - там не пишется ничего! и естессно в Web-интерфейсе Zabbix'а тишина - новая группа элементов не добавляется!

                  Comment

                  • WarBull
                    Junior Member
                    • Feb 2012
                    • 26

                    #10
                    В статье написано, что Perl скрипты должны создать у хостов группу HP_Server, но при запуске их на Zabbix-сервере - ошибка

                    ./hp_sensor_all_temperature.pl

                    malformed JSON string, neither array, object, number, string or atom, at character offset 1 (before "(end of string)") at ./hp_sensor_all_temperature.pl line 62.

                    Comment

                    • WarBull
                      Junior Member
                      • Feb 2012
                      • 26

                      #11
                      Все сорри разобрался - путь прописал $url = "http://127.0.0.1/zabbix/api_jsonrpc.php";

                      Comment

                      • WarBull
                        Junior Member
                        • Feb 2012
                        • 26

                        #12
                        Сорри!

                        Новые графики так и не создаются! В консоли все ОК а в Web-интерфейсе ничего нет

                        Comment

                        Working...