Можете пратити здравље и доступност уређаја са интелигентним интерфејсом за управљање платформом (IPMI) у Zabbix-у. Да бисте извршили IPMI провере, Zabbix сервер мора бити почетно конфигурисан са IPMI подршком.
IPMI је стандардизовани интерфејс за даљинско управљање рачунарским системима "укљученим" или "ван опсега". Омогућава праћење cтатуса хардвера директно са такозваних "ван опсега" картица за управљање, независно од оперативног система или од тога да ли је машина уопште укључена.
Zabbix IPMI праћење ради само за уређаје који имају IPMI подршку (HP iLO, DELL DRAC, IBM RSA, Sun SSP, итд.).
Процес IPMI менаџера заказује IPMI провере помоћу IPMI анкетара. Домаћин увек анкетира само један IPMI анкетар истовремено, смањујући број отворених веза са BMC контролерима. Стога је безбедно повећати број IPMI анкетирача без бриге о преоптерећењу BMC контролера. Процес IPMImanager се аутоматски покреће када се покрене барем један IPMI полери.
Погледајте такође познати проблеми за IPMI провере.
Домаћин мора бити конфигурисан за обраду IPMI провера. Мора се додати IPMI интерфејс, са одговарајућим IP бројевима и бројевима портова, и морају бити дефинисани параметри IPMI аутентикације.
За више детаља погледајте [конфигурацију домаћина] (/manual/config/hosts/host).
Подразумевано, Zabbix сервер није конфигурисан да покреће било који IPMI полер, тако да било које додате IPMI ставке неће радити. Да бисте ово променили, отворите конфигурациону датотеку Zabbix сервера (zabbix_server.conf) као root и потражите следећи ред:
# StartIPMIPollers=0
Откачите га и подесите број анкетара на, рецимо, 3 , тако да гласи:
StartIPMIPollers=3
Сачувајте датотеку и поново покрените zabbix_server после.
Када конфигуришете ставку) на нивоу домаћина:
id:
- да бисте навели ID сензора;name:
- да бисте навели пуно име сензора. Ово може бити корисно у ситуацијама када се сензори могу разликовати само навођењем пуног имена.IPMI агент подржава уграђену ставку ipmi.get, која враћа информације везане за IPMI сензоре и може се користити за откривање IPMI сензора.
Враћена вредност: JSON објекат
Временска ограничења IPMI порука и број поновних покушаја су дефинисани у OpenIPMI библиотеци. Због тренутног дизајна OpenIPMI-ја, није могуће конфигурисати ове вредности у Zabbix-у, ни на нивоу интерфејса нити на нивоу ставке.
Временско ограничење неактивности IPMI сесије за LAN је 60 +/-3 секунде. Тренутно није могуће имплементирати периодично слање команде "Активирај сесију" са OpenIPMI-јем. Ако нема провера IPMI ставки од Zabbix-а до одређеног BMC-а дуже од временског ограничења сесије конфигурисаног у BMC-у, онда следећа IPMI провера након истека временског ограничења ће истећи због временског ограничења појединачних порука, поновних покушаја или грешке пријема. Након тога се отвара нова сесија и покреће се потпуно поновно скенирање BMC-а. Нови UDP порт може се отворити за управљање новом сесијом. Неактивност је дефинисана одсуством и одлазних захтева и долазних одговора. Ако желите да избегнете непотребна поновна скенирања BMC-а, препоручује се да подесите IPMI интервал испитивања ставки испод временског ограничења неактивности IPMI сесије конфигурисаног у BMC-у.
Да бисте пронашли сензоре на хосту, покрените Zabbix сервер са омогућеним DebugLevel=4. Сачекајте неколико минута и пронађите записе о откривању сензора у Zabbix-у logfile сервера:
$ grep 'Added sensor' zabbix_server.log8358:20130318:111122.170 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:7 id:'CATERR' reading_type:0x3 ('discrete_state') type:0x7 ('processor') full_name:'(r0.32.3.0).CATERR'8358:20130318:111122.170 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:15 id:'CPU Therm Trip' reading_type:0x3 ('discrete_state') type:0x1 ('temperature') full_name:'(7.1).CPU Therm Trip'8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'System Event Log' reading_type:0x6f ('sensor specific') type:0x10 ('event_logging_disabled') full_name:'(7.1).System Event Log'8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'PhysicalSecurity' reading_type:0x6f ('sensor specific') type:0x5 ('physical_security') full_name:'(23.1).PhysicalSecurity'8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'IPMI Watchdog' reading_type:0x6f ('sensor specific') type:0x23 ('watchdog_2') full_name:'(7.7).IPMI Watchdog'8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'Power Unit Stat' reading_type:0x6f ('sensor specific') type:0x9 ('power_unit') full_name:'(21.1).Power Unit Stat'8358:20130318:111122.171 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'P1 Therm Ctrl %' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(3.1).P1 Therm Ctrl %'8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:16 id:'P1 Therm Margin' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(3.2).P1 Therm Margin'8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:13 id:'System Fan 2' reading_type:0x1 ('threshold') type:0x4 ('fan') full_name:'(29.1).System Fan 2'8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:13 id:'System Fan 3' reading_type:0x1 ('threshold') type:0x4 ('fan') full_name:'(29.1).System Fan 3'8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'P1 Mem Margin' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(7.6).P1 Mem Margin'8358:20130318:111122.172 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'Front Panel Temp' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(7.6).Front Panel Temp'8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:15 id:'Baseboard Temp' reading_type:0x1 ('threshold') type:0x1 ('temperature') full_name:'(7.6).Baseboard Temp'8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:9 id:'BB +5.0V' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +5.0V'8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'BB +3.3V STBY' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +3.3V STBY'8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:9 id:'BB +3.3V' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +3.3V'8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'BB +1.5V P1 DDR3' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +1.5V P1 DDR3'8358:20130318:111122.173 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:17 id:'BB +1.1V P1 Vccp' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +1.1V P1 Vccp'8358:20130318:111122.174 Added sensor: host:'192.168.1.12:623' id_type:0 id_sz:14 id:'BB +1.05V PCH' reading_type:0x1 ('threshold') type:0x2 ('voltage') full_name:'(7.1).BB +1.05V PCH'
За декодирање типова и стања IPMI сензора, доступна је копија IPMI 2.0 спецификација (имајте у виду да нема даљег ажурирања за IPMI спецификацију су планирана).
Први параметар за почетак је "reading_type". Користите "Табелу 42-1, Расези кодова типа догађаја/очитавања" из спецификација да бисте декодирали код "reading_type". Већина сензора у нашем примеру има "reading_type:0x1" што значи сензор "прага". "Табела 42-3, Кодови типа сензора" показује да "type:0x1" значи сензор температуре, "type:0x2" - сензор напона, "type:0x4" - вентилатор итд. Сензори прага се понекад називају "аналогним" сензорима јер мере континуиране параметре попут температуре, напона, обртаја у минути.
Још један пример - сензор са "reading_type:0x3". "Табела 42-1, Распони кодова типа догађаја/очитавања" каже да кодови типа очитавања 02h-0Ch значе "Генерички дискретни" сензор. Дискретни сензори имају до 15 могућих стања (другим речима - до 15 значајних битова). На пример, за сензор 'CATERR' са "type:0x7", "Табела 42-3, Кодови типа сензора" показује да овај тип значи "Процесор", а значење појединачних битова је: 00h (најмање значајан бит) - IERR, 01h - Термално искључивање итд.
У нашем примеру постоји неколико сензора са "тип_очитавања:0x6f". За ове сензоре, "Табела 42-1, Распони кодова типа догађаја/очитавања" саветује да се користи "Табела 42-3, Кодови типа сензора" за декодирање значења битова. На пример, сензор "Power Unit Stat" има тип "type:0x9" што значи "Power Unit". Офсет 00h значи "PowerOff/Гашење напајања". Другим речима, ако је најмање значајан бит 1, онда је сервер искључен. Да бисте тестирали овај бит, може се користити функција bitand
са маском '1'. Израз окидача може бити овакав
bitand(last(/www.example.com/Power Unit Stat,#1),1)=1
да би се упозорило на искључење сервера.
Имена дискретних сензора у OpenIPMI-2.0.16, 2.0.17 и 2.0.18 често имају додатну "0
" (или неку другу цифру или слово) додану на крају. На пример, док ipmitool
и OpenIPMI-2.0.19 приказују имена сензора као "PhysicalSecurity
" или "CATERR
", у OpenIPMI-2.0.16, 2.0.17 и 2.0.18 имена су "PhysicalSecurity
" или "CATERR
", односно.
Приликом конфигурисања IPMI ставке са Zabbix сервер који користи OpenIPMI-2.0.16, 2.0.17 и 2.0.18, користите ова имена која се завршавају са "0" у * IPMI сензор* пољу ставки IPMI агента. Када се ваш Zabbix сервер надогради на нову newLinux дистрибуцију, која користи OpenIPMI-2.0.19 (или новију), ставке са овим IPMI дискретним сензорима ће постати "НИСУ ПОДРЖАНЕ". Морате да промените њихова имена * IPMI сензора* (на крају уклоните '0') и сачекате неко време пре него што поново постану " Омогућено ".
Неки IPMI агенти обезбеђују и сензор прага и дискретни сензор под истим именом. Предност се увек даје сензору прага.
Ако се IPMI провере не изврше (из било ког разлога: све IPMI ставке домаћина су онемогућене/неподржане, домаћин онемогућен/избрисан, домаћин у одржавању итд.) IPMI веза ће бити прекинута са Zabbix сервера или проксија за 3 до 4 сата у зависности од времена када Zabbix сервер/прокси је покренут.