Ad Widget

Collapse

Триггер в статусе unknown.

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Patjomkin
    Member
    • Nov 2012
    • 50

    #1

    Триггер в статусе unknown.

    Доброе время всем. Может, кто подскажет.
    По срабатыванию триггера настроена отправка почты, смс.
    В actions условие для отправки:
    Trigger value = "PROBLEM"
    Host group = "RemoteHosts"
    Но вот проблема, вчера сервер лёг и при этом zabbix не прислал сообщений, вернее по некоторым прислал (загрузка cpu) а по некоторым нет (загрузка памяти, переполнение диска).
    Смотрю EVENTS:
    Status Severity Duration Ack Actions
    OK Average 1d 27m No -
    OK Disaster 1d 27m No Ok
    PROBLEM High 1m 5s No Ok
    PROBLEM High 4m 56s No Ok
    PROBLEM Disaster 1m No Ok
    UNKNOWN High 1m 1s No -
    UNKNOWN Disaster 1m No -
    UNKNOWN High 1m 2s No -
    Т.е. триггера сработали, но в статус PROBLEM не перешли. В чём может быть проблема настройки? Что необходимо сделать, чтобы такого больше не повторилось?
  • Heilig
    Senior Member
    Zabbix Certified Trainer
    Zabbix Certified SpecialistZabbix Certified Professional
    • Mar 2013
    • 366

    #2
    Это очень интересный и не простой вопрос (https://support.zabbix.com/browse/ZBXNEXT-341). Какую версию Zabbix Вы используете?

    Неизвестно в 1.8 - означает одно из:
    - Zabbix не может высчитать выражение триггера
    - Вы отключили (disable) хост/триггер/элемент
    - сервер недоступен
    - выражение триггера было недавно изменено
    - пере запущен Zabbix сервер

    В Zabbix 2.0 ситуация улучшилась, состояние триггера "неизвестно" удалено. Теперь, триггеры всегда находятся в состояниях ОК или ПРОБЛЕМА (хотя они все еще могут переходить в неизвестное состояние, это состояние используется в информационных целях). Вопрос частично актуален, так как элемент данных может перейти в статус не поддерживаемый, что повлечет за собой возникновение ошибки в настройках триггера (колонка error) и Вы снова не получите "заветную" sms или email. Многим пользователям тяжело понять что это не проблема, а реализация/идея. Зачем Вам 20 смс, например по дискам, памяти и т.д., если у Вас лег сервер? У Вас будет время на их чтение? А если упала сотня серверов...

    В качестве решения, могу порекомендовать:
    - ориентироваться на простые проверки (например, "банальный" пинг сервера)
    - обновиться до последней стабильной версии
    - мониторить количество не поддерживаемых элементов данных (ключ "zabbix[items_unsupported]")
    - использовать функцию nodata() в выражении триггеров.
    При этом главное, это вовремя выявлять и устранять причины по которым элементы данных переходят в не поддерживаемое состояние (https://support.zabbix.com/browse/ZB...#comment-74484), а не читать тонны "спама".

    Comment

    Working...