Ad Widget

Collapse

проблема с агентами

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • neo32
    Senior Member
    • Nov 2013
    • 149

    #1

    проблема с агентами

    господа, какая то простите меня хрень твориться с моим забиксом..
    в общем после того как обновил версию с 2.2.3 на 2.4.2, у меня начались жуткие штуковины, а именно:
    Работает он работает себе, вдруг раз и резко перестаёт пинговать агентов.. причём всех разом.. я подумал сперва вообще как увидел, что сетка легла, но нет, смотрю, сами хосты пингуются, чисто агенты анричабл..

    1) По началу он мне выдавао что ему мол поллеров не хватает, я ему повысил, триггер ушёл
    2) ругался что ему хаускиперов не хватает, так я ему памяти выделил в конфиге и базу в мускултюнере занютинговал (как приору), вроде бы тоже ушло
    3) ругался также на history syncer processes, но вроде как то после всех действий само образумилось..(а мб и нет, но триггер ен висит больше)

    В итоге всё равно, как не шаманил я, через определённый промежуток времени (примерно каждый час -два), отваливаются все агенты и всё там, хоть ты тресни((

    ЗЫ. Выяснил, что проблема вероятнее всего в хайскипере..

    наблюдал за графиком процесса хаускипера, когда он начинается, загрузка процесса хаускипера сразу фигачит под 100% и прёт так на протяжении всего времени, при этом срабатывает триггер через некоторое время, хаускипер процесс занят больше 75%..
    так длиться в течении примерно часа.. потом вот собственно отваливаются агенты..
    Last edited by neo32; 26-11-2014, 14:56.
  • oksidant
    Member
    • Jun 2012
    • 46

    #2
    Проблема скорее всего в том, у агентов стоит триггер, который при отсутствии данных больше 5 минут, срабатывает, что агент не доступен.

    Проверь свою таблицу хаускипера в базе
    select * from housekeeper;

    Также во время работы хаускипера смотри, какие запросы выполняются в базе
    show processlist;

    Также проверь настройки хаускипера в базе и в вебинтерфейсе.

    Comment

    • aib
      Senior Member
      • Jan 2014
      • 1615

      #3
      Не зря рекомендуют включать Housekeeping, только если вам точно его надо и вы знаете, что делаете.
      А на больших системах делать partitioning и выключать Housekeeping насовсем. Старые данные удалять вручную, раз в месяц - или когда кончится место.
      Sincerely yours,
      Aleksey

      Comment

      • neo32
        Senior Member
        • Nov 2013
        • 149

        #4
        Originally posted by oksidant
        Проблема скорее всего в том, у агентов стоит триггер, который при отсутствии данных больше 5 минут, срабатывает, что агент не доступен.

        Проверь свою таблицу хаускипера в базе
        select * from housekeeper;

        Также во время работы хаускипера смотри, какие запросы выполняются в базе
        show processlist;

        Также проверь настройки хаускипера в базе и в вебинтерфейсе.
        Спасибо за ответы
        В общем, по данному пункту
        Проверь свою таблицу хаускипера в базе
        select * from housekeeper;
        Вывалил мне больше различные значения с tablenam'ами в виде history, history_uint, history_str, history_log, trends и trends_uint.

        по этому пункту
        Также во время работы хаускипера смотри, какие запросы выполняются в базе
        show processlist;
        выдаёт различные звпросы к базе, могу привести что он мне высыпал, там много, есть NULL есть что то конкретное типа обновления записей или удаления оныхв частности вот увидел что он производит delete из таблицы history_uint

        по последнему пункту, хотелось бы уточнить, а как сравнить значения эти? в веб морде и в базе? в базе я вроде бы вручную никакую очистку не настраивал, в веб морде, хранить события не больше 7ми дней..

        Comment

        • oksidant
          Member
          • Jun 2012
          • 46

          #5
          select count(*) from housekeeper; - смотри, сколько записей. Если много, значит нужно чистить, но аккуратно и по чуть-чуть.

          Когда смотришь процесс лист в мускуле, обрати внимание, сколько длится удаление записей. Если долго, от этого и появляются тормоза, и т.д. и т.п. Просто заббикс не может ничего записать в базу.

          Если таблица InnoDB , то блокируется только строка. Если MyIsam, то блокируется целиком таблица.

          Дальше делаем выводы и пробуем уменьшить показатель в конфиге заббикс-сервера MaxHousekeeperDelete до минимальных значений и рестарт сервера.

          Через веб - там можно установить сначала очистку всего кроме истории, историю оставить на последок.

          Comment

          • neo32
            Senior Member
            • Nov 2013
            • 149

            #6
            Originally posted by oksidant
            select count(*) from housekeeper; - смотри, сколько записей. Если много, значит нужно чистить, но аккуратно и по чуть-чуть.

            Когда смотришь процесс лист в мускуле, обрати внимание, сколько длится удаление записей. Если долго, от этого и появляются тормоза, и т.д. и т.п. Просто заббикс не может ничего записать в базу.

            Если таблица InnoDB , то блокируется только строка. Если MyIsam, то блокируется целиком таблица.

            Дальше делаем выводы и пробуем уменьшить показатель в конфиге заббикс-сервера MaxHousekeeperDelete до минимальных значений и рестарт сервера.

            Через веб - там можно установить сначала очистку всего кроме истории, историю оставить на последок.
            Вы были правы, как ни крутил параметры, а именно уменьшение значения MaxHousekeeperDelete до стандартных 500 помогло, я выставлял 5000, видимо он не успевал всё это дело удалить и не мог ничего записать..
            База у меня InnoDB
            А вот тогда другой резонный вопрос - Как можно организовать работоспособность базы и заббикса, с большим чем 500 параметром MaxHousekeeperDelete ? просто хотелось бы чтобы он побольше удалял старых значений, а то база всё равно понемногу подрастает..
            Я конечно понимаю что надо просто сидеть и эксперементировать методом научного тыка, выяснить максимальное значение MaxHousekeeperDelete при котором не будет вешаться сервер его и оставить, НО ведь я думаю есть какие то параметры или в самом конфиге мускула или в конфиге zbxа, которые связаны или как то могут повлиять на стабильность работы при повышенном значении MaxHousekeeperDelete ? Может кто знает, подскажите пожалуйста.

            Comment

            • oksidant
              Member
              • Jun 2012
              • 46

              #7
              Дальше мне кажется, нужно тюнить уже сам мускуль. Быстрее работает база, быстрее удаляются объекты.

              Начать нужно с http://mysqltuner.com/

              Comment

              • neo32
                Senior Member
                • Nov 2013
                • 149

                #8
                Originally posted by oksidant
                Дальше мне кажется, нужно тюнить уже сам мускуль. Быстрее работает база, быстрее удаляются объекты.

                Начать нужно с http://mysqltuner.com/
                уже тюнил)

                Comment

                Working...