Ad Widget

Collapse

Триггер недоступности агента не возвращ&

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Viewer
    Senior Member
    • Oct 2012
    • 131

    #1

    Триггер недоступности агента не возвращ&

    Добрый день!
    Помогите в пофиксить проблему
    Opensuse 11.4. Zabbix 2.2.5 (revision 47411).
    После перезагрузки серверов тригер недоступности агента часто не возвращается в состояние "ОК"
    Тригер: Server:agent.ping.nodata(5m)}=1
    В вебинтерфейсе видно что тригер уходит в состяние "Unknown".
    Code:
    Cannot evaluate function "ServerName:agent.ping.nodata(5m)"
    У некоторых отдельных тригеров тоже ошибки Agent is unavailable.

    Проверяю с сервера - агент доступен:
    Code:
    # zabbix_get -s 10.1.1.1 -k "agent.ping"
    1
    Помогите подиагностить и решить проблему
  • aib
    Senior Member
    • Jan 2014
    • 1615

    #2
    У вас триггер срабатывает, если не было данных за последние 5 минут.
    Предполагаю, что и обратно он выключится, если за последние 5 минут данные были.

    Так-же проверьте интервал опроса - может, вы его 1 раз в час контролируете?
    Sincerely yours,
    Aleksey

    Comment

    • Viewer
      Senior Member
      • Oct 2012
      • 131

      #3
      Originally posted by aib
      обратно он выключится, если за последние 5 минут данные были.

      Так-же проверьте интервал опроса - может, вы его 1 раз в час контролируете?
      Интервал опроса agent.ping 60 секунд.
      Сервер "якобы" недоступен остаётся надолго, сам тригер не возвращается в "ОК". Хотя графики рисуются и zabbix_get отдает 1 от agent.ping. Иногда помогает service zabbix_server restart.
      Очень похоже вот на этот тикет - https://support.zabbix.com/browse/ZBX-8095
      но у меня версия 2.2.5

      Comment

      • Zentarim
        Senior Member
        • Mar 2012
        • 526

        #4
        Странно, конечно.
        Не проверяли, может быть одно измерение "теряется"? Например из-за плохого или загруженного канала? Я не уверен, что может повлиять, однако проверить не мешает, так как "agent unavailable" может свидетельствовать не о том, что возвращено какое-то левое значение, а о том, что значение вообще не получено.

        Comment

        • Viewer
          Senior Member
          • Oct 2012
          • 131

          #5
          Originally posted by Zentarim
          Странно, конечно.
          Не проверяли, может быть одно измерение "теряется"? Например из-за плохого или загруженного канала?
          С каналом всё ок. Локалка.
          Нашёл в логах сервера множественные ошибки:
          Code:
           [Z3005] query failed: [1030] Got error 134 from storage engine [select clock,ns,value from history_uint where itemid=41173 and clock<=1418624114 and clock>1418620514 order by clock desc,ns desc limit 1]

          Comment

          • Viewer
            Senior Member
            • Oct 2012
            • 131

            #6
            В общем, ошибки в логах были от mysql, и это было основной причиной.
            Помог repair таблицы history_unit.

            Comment

            Working...