Ad Widget

Collapse

проблема с SLA

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Kicum
    Member
    • Dec 2019
    • 30

    #1

    проблема с SLA

    Доброго дня, проблема с воссановлением SLA.
    Производились работы, был выставлен период обслуживания, не уложились в срок, часть узлов сообщило о проблеме, было выставлено дополнительное время но на ситуацию это не повлияло проблема так и осталась. Сейчас значение SLA падает.
    Было получено оповещение о восстановлении отрицательным временем:
    ✅ Ok
    Восстановлен сервис: SL ХХХХХХ
    Длительность: -20h -51m -45s

    сейчас картина по SLA выглядит:
    не могу прикрепить почему то файл но если текстово то выглядит так
    2024-03-01 99.9% 0 0 9h 40m 44s -9h 40m 44s
    2024-02-29 99.9% 0 0 1d -1d
    2024-02-28 99.9% 0 0 1d -1d
    2024-02-27 99.9% 0 0 1d -1d
    2024-02-26 99.9% 0 0 1d -1d
    2024-02-25 99.9% 0 0 1d -1d
    2024-02-24 99.9% 81.4224 19h 32m 29s 4h 27m 31s -4h 26m 21s
    пробывал возобновить тригеры, и подовить их SLA так и падает, что можно сделать еще ? может кто сталкивался.
  • Kicum
    Member
    • Dec 2019
    • 30

    #2
    может у кого есть мысли хоть в какую сторону копать?

    Comment

    • Alex_UUU
      Senior Member
      • Dec 2018
      • 541

      #3
      Скорее всего Если "обслуживание" кончилось и триггеры сработали, то дальнейшее увеличеное времени "обслуживания" уже не повлияет в т.ч. и на СЛА, т.к. триггеры в сработке. Тут, может лучше увеличить обслуживание закрыть старые проблемы.

      Comment

      • Kicum
        Member
        • Dec 2019
        • 30

        #4
        Originally posted by Alex_UUU
        Скорее всего Если "обслуживание" кончилось и триггеры сработали, то дальнейшее увеличеное времени "обслуживания" уже не повлияет в т.ч. и на СЛА, т.к. триггеры в сработке. Тут, может лучше увеличить обслуживание закрыть старые проблемы.
        в том и дело что проблем нету SLA зеленый.

        Comment

        • Kicum
          Member
          • Dec 2019
          • 30

          #5
          проблему локализовал, это верхний уровень, унего есть сервис id, все дочерние объекты работают, создал рядом новый перенес все дочерние обеъекты в него, SLA не падает.
          вопрос, что то можно сделать с serviceid ? погасить активные тригеры к примеру есть параметр ProblemHousekeepingFrequency=60 но он или не работает или не отрабатывает.
          версия zabbix 6.4

          Comment

          • Kicum
            Member
            • Dec 2019
            • 30

            #6
            Проблему решил, напишу для истории, сделал дополнительный объект дочерний, создал сработку по нему и вернул исходное состояние. Дождался восстановления, SLA начал вернулся в нормально состояние, хотя и до этого он показывл что все ок.
            Click image for larger version  Name:	image.png Views:	0 Size:	8.6 KB ID:	480191
            Last edited by Kicum; 05-03-2024, 17:04.

            Comment

            Working...