Ad Widget

Collapse

Zabbix 3.0 - цикличный рестарт

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Aksel
    Senior Member
    • Aug 2014
    • 101

    #1

    Zabbix 3.0 - цикличный рестарт

    Добрый вечер.
    Установил Zabbix 3.0, залил базу с 2.4. Все работало 4-5 часов, потом вдруг zabbix-server рестартанул и не поднялся. По логам видно что происходит циклическая перезагрузка.

    В логах:

    14512:20160217:125112.913 server #83 started [discoverer #7]
    14515:20160217:125112.913 server #86 started [discoverer #10]
    14551:20160217:125112.920 escalation cancelled: action id:**** deleted
    14551:20160217:125112.920 Got signal [signal:11(SIGSEGV),reason:128,refaddrnil)]. Crashing ...
    14551:20160217:125112.920 ====== Fatal information: ======
    14551:20160217:125112.920 Program counter: 0x7fce070d0c4c
    14551:20160217:125112.920 === Registers: ===
    14551:20160217:125112.920 r8 = 3ff = 1023 = 1023
    14551:20160217:125112.920 r9 = 2f = 47 = 47
    14551:20160217:125112.920 r10 = 0 = 0 = 0
    14551:20160217:125112.920 r11 = 0 = 0 = 0
    14551:20160217:125112.920 r12 = 7fff5556efb0 = 140734625148848 = 140734625148848
    14551:20160217:125112.920 r13 = 17ec300 = 25084672 = 25084672
    14551:20160217:125112.920 r14 = 56c4b310 = 1455731472 = 1455731472
    14551:20160217:125112.920 r15 = 0 = 0 = 0
    14551:20160217:125112.920 rdi = 425d2da188c5a900 = 4782028551144974592 = 4782028551144974592
    14551:20160217:125112.920 rsi = 4ee5d6 = 5170646 = 5170646
    14551:20160217:125112.920 rbp = 7fff5556ee80 = 140734625148544 = 140734625148544
    14551:20160217:125112.920 rbx = 7fff5556ef40 = 140734625148736 = 140734625148736
    14551:20160217:125112.920 rdx = 17f2bff = 25111551 = 25111551
    14551:20160217:125112.920 rax = 0 = 0 = 0
    14551:20160217:125112.920 rcx = 7fffffd0 = 2147483600 = 2147483600
    14551:20160217:125112.920 rsp = 7fff5556ee68 = 140734625148520 = 140734625148520
    14551:20160217:125112.921 rip = 7fce070d0c4c = 140522858286156 = 140522858286156
    14551:20160217:125112.921 efl = 10206 = 66054 = 66054
    14551:20160217:125112.921 csgsfs = 33 = 51 = 51
    14551:20160217:125112.921 err = 0 = 0 = 0
    14551:20160217:125112.921 trapno = d = 13 = 13
    14551:20160217:125112.921 oldmask = 0 = 0 = 0
    14551:20160217:125112.921 cr2 = 0 = 0 = 0
    14551:20160217:125112.921 === Backtrace: ===

    вместо **** action id, которого у меня нет в таблице.


    Ну думаю залился криво бекап. Все удалил, отчистил базу, создал заново. Настроил обнаружение, настроил шаблоны, завел хосты, добавил уведомлялки. Опять сервак проработал несколько часов и сдох. Собственно в логах тоже самое.

    Что может происходить? И как можно обратиться к разрабам?
    Заранее всем спасибо за ответы и помощь.
    Last edited by Aksel; 17-02-2016, 22:51.
  • FreeD
    Member
    • Aug 2011
    • 68

    #2
    https://support.zabbix.com/ сюда писали?

    Comment

    • zmdpc
      Senior Member
      • Oct 2014
      • 484

      #3
      Ну я применил несколько другой порядок, установил 2.4.7, залил базу, обновил до 3.0 ... рестарт служб обязателен. Проблем нет... попробуйте такой вариант. По факту у вас не было этапа апгрейда базы с 2.4 до 3.0 по вашему алгоритму...

      Comment

      • glebs.ivanovskis
        Senior Member
        • Jul 2015
        • 237

        #4
        Если проблему можно стабильно воспроизвести, запустите сервер с настройками DebugLevel=4 и приложите лог (не обрывайте на Backtrace, там начинается самое интересное). Будет очень здорово, если приложите и результат вот этого:
        objdump -Dswx sbin/zabbix_server | gzip -c > zabbix_server.objdump.gz

        Comment

        • Aksel
          Senior Member
          • Aug 2014
          • 101

          #5
          Я проблему устранил. Может конечно и костыльно, но устранил.

          История - Было создано "Действие", по нему отработало несколько триггеров и они остались висеть в базе и дожидаться своего решения. После этого я сделал бекап базы, залил ее на новый сервак. И я как понимаю сделал фатальную ошибку. ДО решения всех проблем по отработанному триггеру, я УДАЛИЛ ДЕЙСТВИЕ.

          То есть запись в таблице - escalations осталась, а вот самого actionid уже не было... Вот это и приводило к падению всей машины....

          Временно создал действие с нужным actionid и все заработало.


          Тему можно закрыть. Цикличная перезагрузка была только изза моих не правильных действий.

          Comment

          Working...