Ad Widget

Collapse

Теряются данные

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • McLeod095
    Member
    • Mar 2010
    • 40

    #1

    Теряются данные

    Добрый день!
    Надеюсь на помощь.
    Есть заббикс 2.0.6
    ListenPort=10051
    SourceIP=192.168.0.1
    LogFile=/var/log/zabbix/zabbix_server.log
    LogFileSize=0
    PidFile=/var/run/zabbix/zabbix_server.pid
    DBHost=localhost
    DBName=zabbix
    DBUser=zabbix
    DBPassword=password
    DBSocket=/var/lib/mysql/mysql.sock
    StartPollers=512
    StartPollersUnreachable=10
    StartPingers=40
    StartDiscoverers=10
    JavaGateway=localhost
    JavaGatewayPort=10052
    StartJavaPollers=10
    CacheSize=1G
    StartDBSyncers=50
    HistoryCacheSize=256M
    TrendCacheSize=256M
    HistoryTextCacheSize=512M
    Timeout=30
    AlertScriptsPath=/var/lib/zabbixsrv/alertscripts
    ExternalScripts=/var/lib/zabbixsrv/externalscripts

    Есть клиенты все второй версии
    конфиги у всех примерно одинаковые
    PidFile=/var/run/zabbix/zabbix_agentd.pid
    LogFile=/var/log/zabbix/zabbix_agentd.log
    LogFileSize=0
    DebugLevel=3
    LogRemoteCommands=1
    Server=192.168.0.1
    StartAgents=50
    ServerActive=192.168.0.1
    Hostname=Client
    Timeout=30
    Include=/etc/zabbix/params/

    это самый нагруженный клиент, поэтому у него много агентов запускается.
    Периодичекски возникает ситуация что перестают поступать данные. То есть в последних данных можно наблюдать последнее полученное значение к примеру 30 минут назад и более, зо тя частота опроса 5 минут и менее. Если пробовать получить данные с агента zabbix_get то все нормально отрабатывается, и за вменяемое время. Также опрос этих данных начинает висеть в очереди и так он может там провисеть очень долго.
    В прикрепленных файлах срикн графика загрузки сервера и скрин очереди, во всяком случае тех данных которые сейчас не отрабатываются.
    ЗЫ. И больше всего бесит что пара проверок уже год висит
    Attached Files
  • bga83
    Senior Member
    • Sep 2011
    • 268

    #2
    прежде всего я бы посоветовал настроить мониторинг загруженности самих процессов zabbix. У меня в подобной ситуации оказалось что ощущалась нехватка PollersUnreachable процессов.

    Comment

    • McLeod095
      Member
      • Mar 2010
      • 40

      #3
      Теряются данные

      Там сейчас никаких проблем нет. Все вроде норм.
      Вчера обнаружил что были ошибки подключения к БД. Но увеличение параметров в мускуле и перезагрузка сервера помоглда решить вопрос, за всю ночь с БД не было проблем. Но сейчас у меня пара тысяч данных просто отключено. На время тестирвоания убрал что бы глаза не мозололили
      Attached Files

      Comment

      • McLeod095
        Member
        • Mar 2010
        • 40

        #4
        First network error

        Ну вроде стало немного лучше.
        После подкручивания мускула, начал рьяно смотреть логи сервера. Заметил часто встречающиеся записи вида
        Zabbix agent item [Custom[MO]] on host [DB1-APP29] failed: first network error, wait for 15 seconds
        Zabbix agent item [Custom[MO]] on host [DB1-APP29] failed: another network error, wait for 15 seconds
        resuming Zabbix agent checks on host [DB1-APP29]: connection restored

        И это в основном на тех хостах на которых тенряются данные.
        Некоторые решил, увидев что там иногда долго идут проверки, но вот некоторые вроде всегда выполняются быстро, но иногда да и проскочит такая запись.
        И кстати еще очень часто данная ситуация проявляется на оборудовании опрагшиваемого по snmp в проверках LLD.

        Comment

        Working...