Ad Widget

Collapse

Проблема с некоторыми хостами после обно

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Prophet
    Junior Member
    • Nov 2014
    • 4

    #1

    Проблема с некоторыми хостами после обно

    Был у нас в компании заббикс 2.2 на убунте 12.04. Всё было настроено, работало. 1385 активных хостов. Не было печали и я решил обновить до 3.2. Обновлял последовательно - сначала убунту до 14.04, потом заббикс 2.2-2.4-3.0-3.2, обновление прошло нормально, всё хорошо. Почти.

    Несколько сетевых железок, совершенно ничего общего не имеющих, вдруг начали очень часто тригерить unreachable. На текущий момент один хост, к примеру, сработал 448 раз с начала суток. Если пингать его с машины, на которой заббикс - он действительно перестаёт отвечать время от времени. Но с других машин выпадают всего 2-3 пакета, в моменты когда он перестаёт отвечать заббиксу.

    Насколько я понимаю, в результате обновлений что-то изменилось в логике работы заббикса и он стал просто перегружать эти хосты запросами. Подскажите пожалуйста, что вообще можно смотреть? Куда копать?
  • sersad
    Senior Member
    • May 2009
    • 518

    #2
    Если пингать его с машины, на которой заббикс - он действительно перестаёт отвечать время от времени.
    Я бы смортел на проблемы с сетью и операционкой. Подозреваю что zabbix тут не причем.

    Comment

    • aib
      Senior Member
      • Jan 2014
      • 1615

      #3
      Проверьте, пожалуйста, как опрашиваются эти хосты.
      На долгом пути от версии 2.2 к текущей 3.*, ZABBIX пару раз менял способ опроса SNMP-устройств.
      Сначала ввели способ bulk-snmp, когда на устройство присылается пачка SNMP запросов и оно постепенно отправляет ответы.
      Потом, когда повалила куча рекламаций на "неотвечающие" устройства (как у вас), в очередной версии Zabbix добавили "галочку" в настройки SNMP интерфейса (на страничке описания устройства)
      Если галочка активна, то устройство получает запросы пачками
      Если сброшена - то запросы идут последовательно и CPU на устройстве получает достаточно времени, чтобы не только отвечать на SNMP, но и делать что-то еще. Например, отвечать на PING.
      Sincerely yours,
      Aleksey

      Comment

      • Prophet
        Junior Member
        • Nov 2014
        • 4

        #4
        Галочку снял, легче хостам не стало. На всякий случай снял эту галочку ещё со всех устройств включенных через то, что выпадает в анричабл, буду смотреть.
        Для эксперимента снял с наблюдения один из постоянно падающих хостов и пингаю его весь день с той машины, где заббикс. Ни одного потерянного пакета за последние 3 часа.

        Comment

        Working...