Ad Widget

Collapse

Разночтение между Zabbix и ipmitool

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • IgorB
    Member
    • Apr 2016
    • 58

    #1

    Разночтение между Zabbix и ipmitool

    Коллеги, приветствую

    Я тут наткнулся на одну непонятность. Сервер Lenovo RD350 G5. Снимаем показания c BMC по ipmi. По сенсорам "PSU1 Present", "PSU2 Present" и "PSU Redundancy" получаем, что ipmitool выдает 0 (все хорошо, как оно по факту и должно быть), а Zabbix показывает 1. Только по ним - по остальным сенсорам все хорошо.

    Никто не сталкивался с таким?

    ОС - Centos 7.3.1611 (x64)
    Zabbix server (MySQL) - 3.0.8
    ipmitool - 1.8.15
    OpenIPMI - 2.0.19
  • yukra
    Senior Member
    • Apr 2013
    • 1359

    #2
    Originally posted by IgorB
    Коллеги, приветствую

    Я тут наткнулся на одну непонятность. Сервер Lenovo RD350 G5. Снимаем показания c BMC по ipmi. По сенсорам "PSU1 Present", "PSU2 Present" и "PSU Redundancy" получаем, что ipmitool выдает 0 (все хорошо, как оно по факту и должно быть), а Zabbix показывает 1. Только по ним - по остальным сенсорам все хорошо.

    Никто не сталкивался с таким?

    ОС - Centos 7.3.1611 (x64)
    Zabbix server (MySQL) - 3.0.8
    ipmitool - 1.8.15
    OpenIPMI - 2.0.19
    https://www.zabbix.com/documentation...itemtypes/ipmi читали?
    Например, датчик 'Power Unit Stat' имеет тип “type:0x9”, который означает “Блок питания”. Смещение 00h означает “Выключено/Обесточено”. Другими словами, если младший значимый бит равен 1, то сервер выключен. Для проверки этого бита можно воспользоваться функция band с маской 1.
    Не ваш случай? Когда ipmitool отдает значение в формате "ок\ошибка", а заббикс читает "raw" значение, которое вам нужно самостоятельно интерпретировать?

    Comment

    • IgorB
      Member
      • Apr 2016
      • 58

      #3
      Эту страницу документации я читал. Но, честно говоря, я поленился запускать сервер с DebugLevel=4. Из вывода ipmitool как-то можно вытянуть нужную информацию?

      ipmitool sensor list для этих сенсоров в колонке "Status" (4-я колонка) возвращает 0x0180 (у похожих сенсоров - 0x0080). Найти, как расшифровать этот статус, перевести его я что-то не могу. Во всех описаниях - просто "статус". Это текущее raw-значение?

      Comment

      • yukra
        Senior Member
        • Apr 2013
        • 1359

        #4
        Code:
        [root@zabbix ~]# ipmitool sensor list
        System Temp      | 35.000     | degrees C  | ok    | -9.000    | -7.000    | -5.000    | 75.000    | 77.000    | 79.000    
        CPU Temp         | 0x0        | discrete   | 0x0000| na        | na        | na        | na        | na        | na        
        FAN 1            | 8725.000   | RPM        | ok    | 215.000   | 400.000   | 585.000   | 29260.000 | 29815.000 | 30370.000 
        FAN 2            | 8725.000   | RPM        | ok    | 215.000   | 400.000   | 585.000   | 29260.000 | 29815.000 | 30370.000 
        FAN 3            | 9280.000   | RPM        | ok    | 215.000   | 400.000   | 585.000   | 29260.000 | 29815.000 | 30370.000 
        FAN 4            | 8355.000   | RPM        | ok    | 215.000   | 400.000   | 585.000   | 29260.000 | 29815.000 | 30370.000 
        FAN 5            | na         |            | na    | na        | na        | na        | na        | na        | na        
        CPU Vcore        | 0.872      | Volts      | ok    | 0.640     | 0.664     | 0.688     | 1.344     | 1.408     | 1.472     
        +3.3VCC          | 3.296      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712     
        +12 V            | 12.031     | Volts      | ok    | 10.494    | 10.600    | 10.706    | 13.091    | 13.197    | 13.303    
        CPU DIMM         | 1.552      | Volts      | ok    | 1.152     | 1.216     | 1.280     | 1.760     | 1.776     | 1.792     
        +5 V             | 5.088      | Volts      | ok    | 4.096     | 4.320     | 4.576     | 5.344     | 5.600     | 5.632     
        -12 V            | -12.292    | Volts      | ok    | -13.844   | -13.650   | -13.456   | -10.934   | -10.740   | -10.546   
        VBAT             | 3.136      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712     
        +3.3VSB          | 3.296      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712     
        AVCC             | 3.296      | Volts      | ok    | 2.816     | 2.880     | 2.944     | 3.584     | 3.648     | 3.712     
        Chassis Intru    | 0x1        | discrete   | 0x0100| na        | na        | na        | na        | na        | na        
        PS Status        | 0x0        | discrete   | 0x00ff| na        | na        | na        | na        | na        | na        
        [root@zabbix ~]# ipmitool sensor get 'PS Status'
        Locating sensor record...
        Sensor ID              : PS Status (0x55)
         Entity ID             : 10.1 (Power Supply)
         Sensor Type (Discrete): Power Supply (0x08)
         Sensor Reading        : 0h
         Event Message Control : Per-threshold
         States Asserted       : Power Supply
         Assertion Events      : Power Supply
                                 [Presence detected]
         Assertions Enabled    : Power Supply
                                 [Failure detected]
         Deassertions Enabled  : Power Supply
                                 [Failure detected]
         OEM                   : 0
        [root@zabbix ~]#
        Я без понятия что есть 4 колонка. Но из вывода второй команды видно что это датчик типа 0x08, а его значение 0x0 (или 0h что по сути одно и тоже: ноль в 16ричной системе). Дальше из pdfки, таблица 42-3 на странице 503 я вижу что для сенсора 08h значение 00h значит: "Presence detected", то есть все ок.

        Comment

        • IgorB
          Member
          • Apr 2016
          • 58

          #5
          Originally posted by yukra
          [CODE[root@zabbix ~]# ipmitool sensor get 'PS Status'
          Locating sensor record...
          Sensor ID : PS Status (0x55)
          Entity ID : 10.1 (Power Supply)
          Sensor Type (Discrete): Power Supply (0x08)
          Sensor Reading : 0h
          Event Message Control : Per-threshold
          States Asserted : Power Supply
          Assertion Events : Power Supply
          [Presence detected]
          Assertions Enabled : Power Supply
          [Failure detected]
          Deassertions Enabled : Power Supply
          [Failure detected]
          OEM : 0
          [root@zabbix ~]# [/CODE]
          Я без понятия что есть 4 колонка. Но из вывода второй команды видно что это датчик типа 0x08, а его значение 0x0 (или 0h что по сути одно и тоже: ноль в 16ричной системе). Дальше из pdfки, таблица 42-3 на странице 503 я вижу что для сенсора 08h значение 00h значит: "Presence detected", то есть все ок.
          У меня эта команда по этим сенсорам показывает похожие данные - type 0x08, reading -0h.
          То ли я чего-то не понимаю, то ли тут опять идет возврат к вопросу - почему Zabbix читает 1? Не 0, не 8, не еще что-то, а именно 1? Чему эта единица соответствует? Какую битовую маску на нее натягивать, чтобы получить правильный триггер?

          Comment

          • yukra
            Senior Member
            • Apr 2013
            • 1359

            #6
            Originally posted by igorb
            У меня эта команда по этим сенсорам показывает похожие данные - type 0x08, reading -0h.
            То ли я чего-то не понимаю, то ли тут опять идет возврат к вопросу - почему zabbix читает 1? Не 0, не 8, не еще что-то, а именно 1? Чему эта единица соответствует? Какую битовую маску на нее натягивать, чтобы получить правильный триггер?
            Думаю кому-то все таки придется запустить сервер с debug=4. Я этого не буду делать, поскольку не использую мониторинг ipmi (точнее не использую встроенный механизм).

            Comment

            Working...