Ad Widget

Collapse

Ошибки в логах заббикса после обновления с 5.4 на 6.0ю8

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • ultrix
    Junior Member
    • May 2018
    • 11

    #1

    Ошибки в логах заббикса после обновления с 5.4 на 6.0ю8

    Всем здравствуйте!

    Не могу исправить следующую ошибку, которая сыпется в логи заббикс_сервера каждые 10-15 секунд. Предположительно, что это проблема в базе данных, но в логах postgress ероров нет.

    Версия заббикса: 6.0.8
    Версия postgres 14
    Версия timescaleDB 2.7.2

    Если нужны еще какие-то данные, то обязательно предоставлю.

    Собственно в логах валится следующая ошибка:

    Code:
    zabbix_server [20718]: ERROR [file and function: <service_manager.c,sync_services_links>, revision:c7c3044a4a2, line:837] Something impossible has just happened.
    20718:20221027:120549.164 === Backtrace: ===
    20718:20221027:120549.164 9: /usr/sbin/zabbix_server: service manager [NODE="1"]Home[/NODE] [processed 0 events, updated 0 event tags, deleted 0 problems, synced 0 service updates, idle 5.004915 sec during 5.004992 sec](zbx_backtrace+0x3f) [0x5626fe8e64c0]
    20718:20221027:120549.164 8: /usr/sbin/zabbix_server: service manager [NODE="1"]Home[/NODE] [processed 0 events, updated 0 event tags, deleted 0 problems, synced 0 service updates, idle 5.004915 sec during 5.004992 sec](+0xf3b45) [0x5626fe78bb45]
    20718:20221027:120549.164 7: /usr/sbin/zabbix_server: service manager [NODE="1"]Home[/NODE] [processed 0 events, updated 0 event tags, deleted 0 problems, synced 0 service updates, idle 5.004915 sec during 5.004992 sec](service_manager_thread+0x3d5) [0x5626fe7921aa]
    20718:20221027:120549.164 6: /usr/sbin/zabbix_server: service manager [NODE="1"]Home[/NODE] [processed 0 events, updated 0 event tags, deleted 0 problems, synced 0 service updates, idle 5.004915 sec during 5.004992 sec](zbx_thread_start+0x37) [0x5626fe8f6855]
    20718:20221027:120549.164 5: /usr/sbin/zabbix_server: service manager [NODE="1"]Home[/NODE] [processed 0 events, updated 0 event tags, deleted 0 problems, synced 0 service updates, idle 5.004915 sec during 5.004992 sec](+0x667d4) [0x5626fe6fe7d4]
    20718:20221027:120549.164 4: /usr/sbin/zabbix_server: service manager [NODE="1"]Home[/NODE] [processed 0 events, updated 0 event tags, deleted 0 problems, synced 0 service updates, idle 5.004915 sec during 5.004992 sec](MAIN_ZABBIX_ENTRY+0x7b8) [0x5626fe6ff9fe]
    20718:20221027:120549.164 3: /usr/sbin/zabbix_server: service manager [NODE="1"]Home[/NODE] [processed 0 events, updated 0 event tags, deleted 0 problems, synced 0 service updates, idle 5.004915 sec during 5.004992 sec](daemon_start+0x384) [0x5626fe8e60c1]
    20718:20221027:120549.164 2: /usr/sbin/zabbix_server: service manager [NODE="1"]Home[/NODE] [processed 0 events, updated 0 event tags, deleted 0 problems, synced 0 service updates, idle 5.004915 sec during 5.004992 sec](main+0x339) [0x5626fe6fe08b]
    20718:20221027:120549.164 1: /lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xeb) [0x7f98d7add09b]
    20718:20221027:120549.164 0: /usr/sbin/zabbix_server: service manager [NODE="1"]Home[/NODE] [processed 0 events, updated 0 event tags, deleted 0 problems, synced 0 service updates, idle 5.004915 sec during 5.004992 sec](_start+0x2a) [0x5626fe6fcdba]

    Изучал функцию sync_services_links - судя по исходникам, она ищет что-то в базе и пытается это "залинкать"(таблицу? ячейку в табилце?....) . Но что именно и главное как исправить, так и не понял.

    Подскажите пожалуйста, как избавиться от этой ошибки. Возможно есть что-то для восстановления БД после "поломки".

    Проблема появилась именно после обновления.
  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3404

    #2
    При переходе к шестой версии изменилась структура таблицы SERVICES - она была разбита на две (SERVICES и SLA), причём структура самой таблицы SERVICES отличается.
    Возможно, какие-то из имевшихся у вас настроек не удалось корректно сконвертировать, либо изначально настройки были не вполне корректные (например, в настройках периода он начинается позже, чем заканчивается).
    Я бы прошёлся по нынешним настройкам Services/SLA - сначала через веб-интерфейс, а затем (если не поможет) - просто глянул бы в базе содержимое талиц SERVICES* и SLA* (в частности - SLA_SCHEDULE и SLA_EXCLUDED_DOWNTIME).

    Comment

    • jemievardy
      Junior Member
      • Nov 2022
      • 1

      #3
      Возможно, какие-то из имевшихся у вас настроек не удалось корректно сконвертировать, либо изначально настройки были не вполне корректные (например, в настройках периода он начинается позже, чем заканчивается).

      Comment

      • ultrix
        Junior Member
        • May 2018
        • 11

        #4
        Originally posted by Kos
        При переходе к шестой версии изменилась структура таблицы SERVICES - она была разбита на две (SERVICES и SLA), причём структура самой таблицы SERVICES отличается.
        Возможно, какие-то из имевшихся у вас настроек не удалось корректно сконвертировать, либо изначально настройки были не вполне корректные (например, в настройках периода он начинается позже, чем заканчивается).
        Я бы прошёлся по нынешним настройкам Services/SLA - сначала через веб-интерфейс, а затем (если не поможет) - просто глянул бы в базе содержимое талиц SERVICES* и SLA* (в частности - SLA_SCHEDULE и SLA_EXCLUDED_DOWNTIME).
        Спасибо огромное за ответ !

        Я удалил все настройки обслуживания - ошибка не ушла.

        Как должна выглядеть таблицаы services sla_shedule и SLA_EXCLUDED_DOWNTIME ? Что именно там посмотреть ?

        Смотрю во все эти таблицы и не понимаю что в них не так

        Comment

        • ultrix
          Junior Member
          • May 2018
          • 11

          #5
          Огромное спасибо ! Я разобрался. Удалил данные из таблицы services_links (по логике там должно было быть пусто) и после этого ошибка ушла.

          Но параллельно ей была еще одна ошибка, которая появляется со странной периодичностью. Может не появлятся долго, 5-10-20 минут, а потом может внезапно начать спамить.

          Code:
          zabbix_server [4567]: ERROR [file and function: <lld_item.c,lld_items_get>, revision:c7c3044a4a2, line:618] Something impossible has just happened.
          4567:20221107:131123.562 === Backtrace: ===
          4567:20221107:131123.563 12: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](zbx_backtrace+0x3f) [0x5570a9b7a4c0]
          4567:20221107:131123.563 11: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](+0x184732) [0x5570a9ab0732]
          4567:20221107:131123.563 10: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](lld_update_items+0xea) [0x5570a9abc015]
          4567:20221107:131123.563 9: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](lld_process_discovery_rule+0x4a3) [0x5570a9a9cb46]
          4567:20221107:131123.563 8: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](+0x16d871) [0x5570a9a99871]
          4567:20221107:131123.563 7: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](lld_worker_thread+0x2f6) [0x5570a9a99ed2]
          4567:20221107:131123.563 6: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](zbx_thread_start+0x37) [0x5570a9b8a855]
          4567:20221107:131123.563 5: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](+0x66dc5) [0x5570a9992dc5]
          4567:20221107:131123.563 4: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](MAIN_ZABBIX_ENTRY+0x7b8) [0x5570a99939fe]
          4567:20221107:131123.563 3: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](daemon_start+0x384) [0x5570a9b7a0c1]
          4567:20221107:131123.563 2: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](main+0x339) [0x5570a999208b]
          4567:20221107:131123.563 1: /lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xeb) [0x7f6cc482409b]
          4567:20221107:131123.563 0: /usr/sbin/zabbix_server: lld worker [NODE="1"]Home[/NODE] [processed 1 LLD rules, idle 12.930015 sec during 12.962126 sec](_start+0x2a) [0x5570a9990dba]

          Comment

          • Kos
            Senior Member
            Zabbix Certified SpecialistZabbix Certified Professional
            • Aug 2015
            • 3404

            #6
            Originally posted by ultrix
            Я удалил все настройки обслуживания - ошибка не ушла.

            Как должна выглядеть таблицаы services sla_shedule и SLA_EXCLUDED_DOWNTIME ? Что именно там посмотреть ?

            Смотрю во все эти таблицы и не понимаю что в них не так
            Я ничего не писал про настройки обслуживания (maintenance) - это не имеет отношения к настройкам услуг (Services) и SLA.
            У периодов обслуживания и у SLA свои, не связанные друг с другом периоды.

            Раньше (до версии 6.0) настройки Services/SLA делались через меню Configuration → Services​, а сохранялись в таблице Services.
            Начиная с версии 6.0, для них отведено отдельное главное меню Services, а сами настройки разделены на Services и SLA (в соответствующих подменю), которые хранятся в разных таблицах (плюс ещё несколько таблиц для связей их между собой).

            Если я понимаю правильно, то при отсутствии настроек для Services и SLA соответствующие таблицы (т.е. все таблицы с именами, начинающимися на SERVICES* и SLA*) будут пустыми.
            Если этих настроек было немного, то проще их пересоздать заново.

            Comment

            • Kos
              Senior Member
              Zabbix Certified SpecialistZabbix Certified Professional
              • Aug 2015
              • 3404

              #7
              Originally posted by ultrix
              Но параллельно ей была еще одна ошибка, которая появляется со странной периодичностью. Может не появлятся долго, 5-10-20 минут, а потом может внезапно начать спамить.
              Code:
              zabbix_server [4567]: ERROR [file and function: <lld_item.c,lld_items_get>, revision:c7c3044a4a2, line:618] Something impossible has just happened.
              Это уже другая проблема, связанная с работой механизма LLD (низкоуровневого обнаружения). Лучше для начала обновиться на последний релиз текущей версии (скажем, для 6.0 сейчас это 6.0.10), и, если проблема всё ещё останется, то обсуждать её в отдельной ветке.

              Comment


              • ultrix
                ultrix commented
                Editing a comment
                Огромное вам спасибо за ответы ! Попробую обновится, если ошибка появится снова.
            • ultrix
              Junior Member
              • May 2018
              • 11

              #8
              Если что, по предыдущей ошибке выполнил действия описанные вот тут

              и вот тут:

              (думаю важно будет для истории).

              Ошибка так и не появилась! Тикет можно перенести в сделанное. Всем еще раз огромное спасибо!
              Last edited by ultrix; 07-11-2022, 15:07.

              Comment

              • ultrix
                Junior Member
                • May 2018
                • 11

                #9
                выполнено.

                Comment

                Working...