Ad Widget

Collapse

Zabbix proxy, большая очередь при Simple проверках (ICMP прове&#

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Fyntik
    Junior Member
    • Apr 2015
    • 12

    #1

    Zabbix proxy, большая очередь при Simple проверках (ICMP прове&#

    Добрый день.
    В начале опишу конфиг системы мониторинга (все сервера виртуальные):
    Frontend+zabbix server:
    4 x vCPU
    4 GB RAM
    20 GB HDD (RAID5 5xSAS 15k)

    Backend (mysql) server:
    4 x vCPU
    24 GB RAM
    600 GB HDD (RAID10 10xSAS 15k)

    Proxy servers (sqlite):
    4 x vCPU
    4 GB RAM
    20 GB HDD (RAID 4xSATA 7.2k)
    Proxy config:
    Code:
    ProxyMode=0
    LogFile=/var/log/zabbix/zabbix_proxy.log
    LogFileSize=10
    DebugLevel=3
    PidFile=/var/run/zabbix/zabbix_proxy.pid
    DBHost=localhost
    DBName=/usr/lib/zabbix/zabbix_proxy.db
    ProxyOfflineBuffer=24
    ConfigFrequency=600
    StartPollers=5
    StartPollersUnreachable=25
    StartPingers=300
    StartDiscoverers=1
    CacheSize=256M
    HistoryCacheSize=256M
    HistoryTextCacheSize=256M
    TrapperTimeout=300
    UnreachablePeriod=45
    UnavailableDelay=60
    UnreachableDelay=15
    ExternalScripts=/usr/lib/zabbix/externalscripts
    #TmpDir=/usr/lib/zabbix/tmp
    TmpDir=/tmp
    Подробные конфиги zabbix сервера и mysql базы не привожу, т.к. проблема, как мне кажется на стороне прокси сервера.

    Суть проблемы:
    прокси сервер до определенного времени мониторил порядка 1700 узлов по 3-м ICMP метрикам:
    Code:
    Name			Triggers Key  				Interval  	History 		Trends  		Type  
    ICMP Packet Loss	icmppingloss				60		180		365		Simple check
    ICMP Echo Reply		icmpping[,5,,,5000]			60		180		365		Simple check
    ICMP Delay		icmppingsec[,5,,,5000,avg]		60		180		365		Simple check
    При такой нагрузке VPS на проксе было в районе 100, а zabbix queue не превышала 1800. В zabbix сервер данные попадали без задержек и отставаний.

    Вчера на данный прокси вывели еще дополнительно 2700 узлов с теми же параметрами мониторинга (3 ICMP метрики).
    Статистика по прокси серверу:
    Code:
    Name**	Mode	Last seen (age)	Host count	Item count	Required performance (vps)	
    	Active	5s		4699		14165		235.86
    После такого увеличения zabbix proxy стал "не успевать" собирать необходимые данные, в результате чего появилась стабильная очередь по собираемым метрикам:
    Code:
    Proxy	5 seconds	10 seconds	30 seconds	1 minute	5 minutes	More than 10 minutes
    	923		3503		4882		2038		0		0
    И соответственно данные стали запаздывать от 1 до 4 минут:
    Code:
    Scheduled check		Delayed by	Host		Name
    07.01.2015 15:59	1m 56s		some host	ICMP Echo Reply
    07.01.2015 15:59	1m 56s		some host	ICMP Delay
    07.01.2015 16:00	1m 50s		some host	ICMP Delay
    07.01.2015 16:00	1m 50s		some host	ICMP Echo Reply
    07.01.2015 16:00	1m 50s		some host	ICMP Echo Reply
    07.01.2015 16:00	1m 50s		some host	ICMP Echo Reply
    07.01.2015 16:00	1m 50s		some host	ICMP Delay
    07.01.2015 16:00	1m 50s		some host	ICMP Delay
    07.01.2015 16:00	1m 50s		some host	ICMP Delay
    07.01.2015 16:00	1m 50s		some host	ICMP Delay
    07.01.2015 16:00	1m 50s		some host	ICMP Echo Reply
    07.01.2015 16:00	1m 50s		some host	ICMP Echo Reply
    07.01.2015 16:00	1m 50s		some host	ICMP Echo Reply
    07.01.2015 16:00	1m 50s		some host	ICMP Echo Reply
    07.01.2015 16:00	1m 50s		some host	ICMP Delay
    07.01.2015 16:00	1m 50s		some host	ICMP Delay
    07.01.2015 16:00	1m 45s		some host	ICMP Delay
    Selfmonitoring прокси показывает следующее:


    Видно что сильно скакнуа zabbix очереди и CPU system time.

    Увеличение StartPingers не дает никакого результата. Судя по мониторингу машинка не перегружена. Вероятно упирается в сам механизм пингования. Сталкивался кто нибудь с такой проблемой или может быть есть предположения в какую сторону копать для уменьшения очереди до приемлемых значений и устранения задержки сбора данных?
  • zmdpc
    Senior Member
    • Oct 2014
    • 484

    #2
    Не может быть такой громадной очереди. Мониторится немного меньше - но очередь бывает от 0 до 100 не больше. Приведите конфиг сервера.
    ПыСы: для такого количества 50-60 процессов пингеров достаточно (у меня запущено 17 шт). Тут смотрели рекомендации ?
    Last edited by zmdpc; 01-07-2015, 16:06.

    Comment

    • Fyntik
      Junior Member
      • Apr 2015
      • 12

      #3
      Zabbix сервер только обрабатывает данные с проксей, сам он мониторинг не производит.
      Zabbix server config:
      Code:
      ListenPort=10051
      LogFile=/var/log/zabbix/zabbix_server.log
      LogFileSize=10
      DebugLevel=3
      PidFile=/var/run/zabbix/zabbix_server.pid
      DBHost=
      DBName=
      DBUser=
      DBPassword=
      StartTrappers=20
      StartPingers=20
      StartDiscoverers=10
      StartHTTPPollers=4
      StartTimers=20
      SNMPTrapperFile=/var/log/snmptt/snmptt.log
      HousekeepingFrequency=1
      MaxHousekeeperDelete=0
      CacheSize=512M
      CacheUpdateFrequency=30
      StartDBSyncers=64
      HistoryCacheSize=128M
      TrendCacheSize=128M
      HistoryTextCacheSize=256M
      ValueCacheSize=256M
      Timeout=5
      TrapperTimeout=300
      UnavailableDelay=15
      AlertScriptsPath=/usr/lib/zabbix/alertscripts
      ExternalScripts=/usr/lib/zabbix/externalscripts
      LogSlowQueries=1000
      TmpDir=/usr/lib/zabbix/tmp
      StartProxyPollers=10
      ProxyConfigFrequency=600
      ProxyDataFrequency=2

      Comment

      • Fyntik
        Junior Member
        • Apr 2015
        • 12

        #4
        Originally posted by zmdpc
        ПыСы: для такого количества 50-60 процессов пингеров достаточно (у меня запущено 17 шт). Тут смотрели рекомендации ?
        https://www.zabbix.com/documentation...ormance_tuning
        С рекомендацией держать как можно меньше процессов (в том числе пингеров) знаком, но для распараллеливания нагрузки их можно и побольше держать.
        100 пингеров не хватало - они загружались на 100%, увеличили до 200 - % загруженности упал, но очередь осталась. С увеличением до 300 никаких отрицательных эффектов не обнаружили, но и очередь не уменьшилась...

        Comment

        Working...