Ad Widget

Collapse

Не получает данные по IPMI с сервера BULL

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Oysed
    Junior Member
    • Sep 2023
    • 5

    #1

    Не получает данные по IPMI с сервера BULL

    Добрый день, коллеги!
    Сервер Zabbix 6.0.10

    Есть сервер HP, ключ ipmi.get выводит полный JSON сенсоров сервера (всё работает хорошо, все датчики мониторятся)

    Есть сервер BULL S ключ ipmi.get выводит только ПЕРВЫЙ сенсор и вообще не хочет получать данные по остальным сенсорам
    ipmitool - нормально опрашивает данный сервер

    Команда получения данных с BULL работает, выводит полный список сенсоров
    ipmitool -H serverBULL -U zabbix -P zabbix sensor

    Подскажите куда копать​
  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3404

    #2
    Релиз 6.0.10 бы выпущен в 2022 году, сейчас уже 2024-й. Я бы начал с того, что обновился бы на текущий релиз (на данный момент это 6.0.26), поскольку есть вероятность, что если это баг, то его за это время уже могли найти и поправить. И копал бы дальше только в случае, если это обновление не поможет.

    Comment

    • Oysed
      Junior Member
      • Sep 2023
      • 5

      #3
      Попробовал все версии, установил Debian 11 и Zabbix 6.4.11
      Результат одинаковый, получает данные только от первого сенсора по ipmi.get
      Если написать отдельный айтем с ключом - key Pwr.Consumption sensor - Pwr Consumption получаю ошибку error 0x10000d4 while reading threshold sensor
      ipmi.get (debian 11) сервер BULL
      [{"id":"ACPI Pwr State","name":"(r0.32.7.0).ACPI Pwr State","sensor":{"type":34,"text":"system_acpi_pow er_state"},"reading":{"type":111,"text":"sensor specific"},"state":{"state":1,"text":"S0/G0 working"}}]
      ipmi.get (debian 12) сервер BULL
      [{"id":"ACPI Pwr State","name":"(r0.32.7.0).ACPI Pwr State","sensor":{"type":34,"text":"system_acpi_pow er_state"},"reading":{"type":111,"text":"sensor specific"},"state":{"state":1,"text":"S0/G0 working"}},{"id":"ACPI Pwr State","name":"(r0.32.7.0).ACPI Pwr State","sensor":{"type":34,"text":"system_acpi_pow er_state"},"reading":{"type":111,"text":"sensor specific"},"state":{"state":1,"text":"S0/G0 working"}}]
      root@Debian12zabbix6:~# ipmitool -H server -U zabbix -P zabbix sdr
      IANA PEN registry open failed: No such file or directory
      ACPI Pwr State | 0x01 | ok
      Pwr Consumption | 488 Watts | ok
      Pwr Redundancy | 0x01 | ok
      CPU0 status | 0x80 | ok
      CPU1 status | 0x80 | ok
      PS0 Status | 0x01 | ok​

      Comment

      • Kos
        Senior Member
        Zabbix Certified SpecialistZabbix Certified Professional
        • Aug 2015
        • 3404

        #4
        Originally posted by Oysed
        Попробовал все версии, установил Debian 11 и Zabbix 6.4.11
        Результат одинаковый, получает данные только от первого сенсора по ipmi.get
        Ну, в таком случае остаётся только писать баг-репорт на support.zabbix.com. На мой взгляд, если ipmitool показывает данные, то и Zabbix должен уметь их забирать.

        Comment

        • Alex_UUU
          Senior Member
          • Dec 2018
          • 541

          #5
          Может с правами что-то не то? Обычно тестируешь по учеткой с большими правами, чем у заббикса.

          Comment

          • Oysed
            Junior Member
            • Sep 2023
            • 5

            #6
            Права давал полные на IPMI admin/admin all - не дало результата
            Нашел похожую тему с проблемой openipmi не может опросить некоторые сервера
            Пока не разобрался в чём точно дело

            20349:20240209:150600.595 In zbx_perform_openipmi_ops() host:'[serverBULL]:623' phost:0x55a28f0f30e0 from zbx_read_ipmi_sensor()
            20349:20240209:150600.600 In zbx_got_thresh_reading_cb()
            20349:20240209:150600.600 zbx_got_thresh_reading_cb() fail: [16777428] Unknown error 16777428
            20349:20240209:150600.600 End of zbx_got_thresh_reading_cb():NOTSUPPORTED
            20349:20240209:150600.600 End zbx_perform_openipmi_ops() from zbx_read_ipmi_sensor()
            20349:20240209:150600.600 End of zbx_read_ipmi_sensor():NOTSUPPORTED
            20349:20240209:150600.600 Sensor 'CPU1 DIMM 2 val' cannot be discovered. Error: error 0x10000d4 while reading threshold sensor​

            Comment

            • Hamardaban
              Senior Member
              Zabbix Certified SpecialistZabbix Certified Professional
              • May 2019
              • 2713

              #7
              Покажите вывод команды "ipmitool -H server -U zabbix -P zabbix sensor" - там более развернутая инфа.

              И попробуйте увеличить логирование для ipmi poller ов и посмотреть на чем обламывается запрос сенсоров.

              Comment

              • Oysed
                Junior Member
                • Sep 2023
                • 5

                #8
                В баг трекере у человека похожая ситуация, ошибка ZBX-22769

                Zabbix не использует ipmitool для опроса серверов
                Он использует openipmi

                "" Can you use openipmish, do "debug msg on" and then a "domain open ...." and send me the output" ""

                Никак не пойму как через openipmi именно к серверу подключиться?

                root@Debian12zabbix6:~# ipmitool -H server -U zabbix -P zabbix sensor
                IANA PEN registry open failed: No such file or directory
                ACPI Pwr State | 0x1 | discrete | 0x0100| na | na | na | na | na | na
                Pwr Consumption | 400.000 | Watts | ok | na | na | na | na | na | na
                Pwr Redundancy | 0x1 | discrete | 0x0100| na | na | na | na | na | na
                CPU0 status | 0x80 | discrete | 0x8000| na | na | na | na | na | na
                CPU1 status | 0x80 | discrete | 0x8000| na | na | na | na | na | na
                PS0 Status | 0x1 | discrete | 0x0100| na | na | na | na | na | na
                PS1 Status | 0x1 | discrete | 0x0100| na | na | na | na | na | na
                WEO | 0x1 | discrete | 0x0100| na | na | na | na | na | na
                PCI0 RISER | 0x2 | discrete | 0x0200| na | na | na | na | na | na​

                Comment

                • Oysed
                  Junior Member
                  • Sep 2023
                  • 5

                  #9

                  Вот причина недоступности данных, они реально не отображаются при запросе
                  Вопрос, кто виноват
                  Zabbix не виноват
                  Сервер или openipmi

                  openipmish
                  domain open dom -sdrs lan -U zabbix -P zabbix serverBULL

                  Event
                  Object Type: Sensor
                  Name: dom(r0.32.7.0).ACPI Pwr State
                  Operation: Add

                  Event
                  Object Type: Sensor
                  Name: dom(46.1).
                  Operation: Add

                  Event
                  Object Type: Entity
                  Name: dom(34.1)
                  Operation: Add

                  Event
                  Object Type: Sensor
                  Name: dom(34.1).▒
                  Operation: Add

                  Event
                  Object Type: Sensor
                  Name: dom(34.1).▒
                  Operation: Add

                  Event
                  Object Type: Sensor
                  Name: dom(34.1).▒
                  Operation: Add

                  Event
                  Object Type: Sensor
                  Name: dom(34.1).
                  Operation: Add


                  Comment

                  • Hamardaban
                    Senior Member
                    Zabbix Certified SpecialistZabbix Certified Professional
                    • May 2019
                    • 2713

                    #10
                    А я думаю что причина «облома» заббикса в том, что второй сенсор «Pwr Consumption | 400.000 | Watts | ok | na | na | na | na | na | na» ни пороговы ни дискретный, а неизвестного заббиксу типа и рушит всю последовательность обработки.
                    На форуме и в интернете обсуждали похожие датчики но решения не припомню.

                    Хотя возможно это всё мой бред - еще раз посоветую увеличить уровень логирования и посмотреть что в логах

                    Вот тут разъяснения как заббикс читает и интерпретирует данные IPMI https://www.zabbix.com/documentation...itemtypes/ipmi

                    PS
                    Посмотрел на своих серверах - есть такие датчики и нормально обрабатываются LLD заббикса (6.4.11)
                    т.е. для решения остается 2 варианта - обновить заббикс\ipmi до последних версий или принять что кривой IPMI на устройстве (обновлять BMC?) и забирать данные скриптами с ipmitools.
                    Last edited by Hamardaban; 12-02-2024, 09:10.

                    Comment

                    • Victor Sklyarov
                      Senior Member
                      • Apr 2016
                      • 184

                      #11
                      Ситуация с получением датчиков через openipmi вообще-то очень нехорошая. Мой опыт получения каких то данных с серверов по IPMI говорит, что не стоит этим даже заниматься, есть масса других способов мониторить серверы. (zabbix server 6.0.25, SLES 15 SP4, количество серверов более 2000, каналы самые разные, не более 1мбит/с, зверинец серверов HP G5-10, Lenowo, Huawei, Dell) Попытка получить все датчики через ipmi.get в двух из трёх случаях приводит к тайм ауту. Собственно нужны они мне были эти датчики только для понимания - подключен ли IPMI. Очень хорошо видно фонарь в узлах сети. Зашёл с другого конца. Сделал запрос на один конкретный датчик на каждом сервере. Вроде как-то всё стало лучше, но у меня стал регулярно падать zabbix server. Анализ логов всегда указывал на виновника -запрос IPMI. Кончилось тем, что убрал все запросы IPMI и с тех пор живу спокойно. На всех новых серверах использую REDFISH. на старых HP G5-7 мониторю через WBEM providers. Мой вам совет, не мучайтесь вы с этим IPMI У серверов BULL REDFISH присутствует

                      Comment

                      Working...