Ad Widget

Collapse

Zabbix сервер сам стопариться

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • DmitryL
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • May 2016
    • 278

    #31
    Советую почитать документацию. Там действительно сконцентрировано только нужное и важное
    И ещё тут хорошая статья

    Comment

    • Fractal1990
      Senior Member
      • Mar 2016
      • 129

      #32
      Originally posted by Dmitryb
      Доброе утро!

      Zabbix использует только столько ресурсов сколько ему разрешено в конфиг файле. По дефалту параметры малы для больших инсталяцый
      В вашем графике в принципе всё нормально. Единственное можно немного увеличить HistoryCache
      Обратите внимание что график показывает % свободного места а не занятого.

      Можем ещё посмотреть что выдаст
      Code:
      ps aux | grep zabbix
      Code:
      root@zabbix-office-nsk:~# ps aux | grep zabbix
      zabbix     811  0.0  0.0  95196  3096 ?        S    11:42   0:00 /usr/sbin/zabbix_agentd
      zabbix     812  0.0  0.0  95196  3056 ?        S    11:42   0:00 /usr/sbin/zabbix_agentd: collector [idle 1 sec]
      zabbix     813  0.0  0.1  97388  6600 ?        S    11:42   0:00 /usr/sbin/zabbix_agentd: listener #1 [waiting for connection]
      zabbix     814  0.0  0.1  97388  6600 ?        S    11:42   0:00 /usr/sbin/zabbix_agentd: listener #2 [waiting for connection]
      zabbix     815  0.0  0.1  97388  6608 ?        S    11:42   0:00 /usr/sbin/zabbix_agentd: listener #3 [waiting for connection]
      zabbix     816  0.0  0.1  95196  4656 ?        S    11:42   0:00 /usr/sbin/zabbix_agentd: active checks #1 [idle 1 sec]
      zabbix     839  0.1  1.2 2100936 49828 ?       Sl   11:42   0:02 /usr/bin/java -server -Dlogback.configurationFile=/etc/zabbix/zabbix_java_gateway_logback.xml -classpath /usr/sbin/zabbix_java/lib:/usr/sbin/zabbix_java/lib/logback-classic-0.9.27.jar:/usr/sbin/zabbix_java/lib/logback-core-0.9.27.jar:/usr/sbin/zabbix_java/lib/android-json-4.3_r3.1.jar:/usr/sbin/zabbix_java/lib/slf4j-api-1.6.1.jar:/usr/sbin/zabbix_java/bin/zabbix-java-gateway-3.0.3.jar -Dzabbix.pidFile=/var/run/zabbix/zabbix_java_gateway.pid -Dzabbix.timeout=3 -Dsun.rmi.transport.tcp.responseTimeout=3000 com.zabbix.gateway.JavaGateway
      root      3753  0.0  0.0  17988  2192 pts/0    S+   12:04   0:00 grep --color=auto zabbix
      на сервере на данный момент 64 Гб памяти, CacheSize выставил равным 8 ГБ, это у нас как я понимаю что то наподобие файла подкачки?

      Comment

      • DmitryL
        Senior Member
        Zabbix Certified SpecialistZabbix Certified Professional
        • May 2016
        • 278

        #33
        CacheSize
        Размер кэша конфигурации, в байтах.
        Размер распределенной памяти для хранения данных узлов сети, элементов данных и триггеров.
        Максимальный предел был 2G до Zabbix 2.2.3.


        PS AUX похоже не с консоли сервера заббикс а с JMX или сервер не включен.

        Запомните, что выставлять все параметры по максимуму только потому что параметры физического сервера это позволяют ненужно. Это приведёт только к проблемам. Должен быть баланс

        Первое место где смотреть и анализировать это как раз те графики которые я вам показывал. Их там несколько.
        На них уже из шаблона настроены триггеры которые вам позволят вовремя узнать о присутствие проблемы.

        Comment

        • Fractal1990
          Senior Member
          • Mar 2016
          • 129

          #34
          Originally posted by Dmitryb
          CacheSize
          Размер кэша конфигурации, в байтах.
          Размер распределенной памяти для хранения данных узлов сети, элементов данных и триггеров.
          Максимальный предел был 2G до Zabbix 2.2.3.


          PS AUX похоже не с консоли сервера заббикс а с JMX или сервер не включен.

          Запомните, что выставлять все параметры по максимуму только потому что параметры физического сервера это позволяют ненужно. Это приведёт только к проблемам. Должен быть баланс


          Первое место где смотреть и анализировать это как раз те графики которые я вам показывал. Их там несколько.
          На них уже из шаблона настроены триггеры которые вам позволят вовремя узнать о присутствие проблемы.
          понял, на данный момент 300 устройств и 15000 элементов

          сделал так т.к. выдавались предупреждения тригеров


          Code:
          CacheSize=1G
          
          StartPingers=20
          
          StartPollers=20
          
          HistoryCacheSize=1G
          кстати а кэш хранится в каком месте?

          а то тригер по месту срабатывает и еще Disk I/O is overloaded on zabbix-office-nsk

          Code:
          root@zabbix-office-nsk:~# ps aux | grep zabbix                                                                                                                                                                    zabbix     810  0.0  0.0  95196  3040 ?        S    12:12   0:00 /usr/sbin/zabbix_agentd
          zabbix     811  0.0  0.0  95196  3000 ?        S    12:12   0:01 /usr/sbin/zabbix_agentd: collector [idle 1 sec]
          zabbix     812  0.0  0.1  97388  6676 ?        S    12:12   0:00 /usr/sbin/zabbix_agentd: listener #1 [waiting for connection]
          zabbix     813  0.0  0.1  97388  6668 ?        S    12:12   0:00 /usr/sbin/zabbix_agentd: listener #2 [waiting for connection]
          zabbix     814  0.0  0.1  97388  6668 ?        S    12:12   0:00 /usr/sbin/zabbix_agentd: listener #3 [waiting for connection]
          zabbix     815  0.0  0.0  95196  4668 ?        S    12:12   0:00 /usr/sbin/zabbix_agentd: active checks #1 [idle 1 sec]
          zabbix     838  0.1  0.8 2635888 50640 ?       Sl   12:12   0:06 /usr/bin/java -server -Dlogback.configurationFile=/etc/zabbix/zabbix_java_gateway_logback.xml -classpath /usr/sbin/zabbix_java/lib:/usr/sbin/zabbix_java/lib/logback-classic-0.9.27.jar:/usr/sbin/zabbix_java/lib/logback-core-0.9.27.jar:/usr/sbin/zabbix_java/lib/android-json-4.3_r3.1.jar:/usr/sbin/zabbix_java/lib/slf4j-api-1.6.1.jar:/usr/sbin/zabbix_java/bin/zabbix-java-gateway-3.0.3.jar -Dzabbix.pidFile=/var/run/zabbix/zabbix_java_gateway.pid -Dzabbix.timeout=3 -Dsun.rmi.transport.tcp.responseTimeout=3000 com.zabbix.gateway.JavaGateway
          zabbix   13441  0.0  0.2 2318932 15400 ?       S    13:25   0:00 /usr/sbin/zabbix_server
          zabbix   13445  0.0  0.1 2318932 11712 ?       S    13:25   0:00 /usr/sbin/zabbix_server: configuration syncer [synced configuration in 0.191805 sec, idle 60 sec]
          zabbix   13446  0.0  0.0 2318932 3536 ?        S    13:25   0:00 /usr/sbin/zabbix_server: db watchdog [synced alerts config in 0.000791 sec, idle 60 sec]
          zabbix   13447  0.4  0.3 2333348 20316 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #1 [got 64 values in 0.154177 sec, idle 1 sec]
          zabbix   13448  0.2  0.3 2333252 19936 ?       S    13:25   0:00 /usr/sbin/zabbix_server: poller #2 [got 0 values in 0.000004 sec, idle 1 sec]
          zabbix   13449  0.3  0.3 2333264 20012 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #3 [got 0 values in 0.000004 sec, getting values]
          zabbix   13450  0.4  0.3 2333540 20180 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #4 [got 161 values in 0.613384 sec, getting values]
          zabbix   13451  0.3  0.3 2333384 19960 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #5 [got 122 values in 0.168082 sec, idle 1 sec]
          zabbix   13452  0.2  0.3 2333356 19816 ?       S    13:25   0:00 /usr/sbin/zabbix_server: poller #6 [got 0 values in 0.000005 sec, getting values]
          zabbix   13453  0.4  0.3 2333644 20360 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #7 [got 0 values in 0.000005 sec, idle 1 sec]
          zabbix   13454  0.3  0.3 2333364 19996 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #8 [got 94 values in 0.125750 sec, idle 1 sec]
          zabbix   13455  0.3  0.3 2333364 19860 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #9 [got 0 values in 0.000005 sec, getting values]
          zabbix   13456  0.4  0.3 2333224 19964 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #10 [got 0 values in 0.000004 sec, idle 1 sec]
          zabbix   13457  0.4  0.3 2333352 19904 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #11 [got 237 values in 0.174133 sec, getting values]
          zabbix   13458  0.4  0.3 2333384 20136 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #12 [got 122 values in 0.169347 sec, idle 1 sec]
          zabbix   13459  0.5  0.3 2333760 20340 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #13 [got 123 values in 1.234511 sec, idle 1 sec]
          zabbix   13460  0.3  0.3 2333360 19904 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #14 [got 0 values in 0.000004 sec, idle 1 sec]
          zabbix   13461  0.2  0.3 2333348 19876 ?       S    13:25   0:00 /usr/sbin/zabbix_server: poller #15 [got 0 values in 0.000004 sec, getting values]
          zabbix   13462  0.3  0.3 2333356 19876 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #16 [got 122 values in 0.167473 sec, idle 1 sec]
          zabbix   13463  0.5  0.3 2333488 19928 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #17 [got 61 values in 0.100836 sec, idle 1 sec]
          zabbix   13464  0.5  0.3 2333368 19996 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #18 [got 0 values in 0.000005 sec, idle 1 sec]
          zabbix   13465  0.4  0.3 2333372 19924 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #19 [got 61 values in 0.082815 sec, idle 1 sec]
          zabbix   13466  0.3  0.3 2333424 20136 ?       S    13:25   0:01 /usr/sbin/zabbix_server: poller #20 [got 0 values in 0.000005 sec, idle 1 sec]
          zabbix   13467  0.0  0.2 2333032 13172 ?       S    13:25   0:00 /usr/sbin/zabbix_server: unreachable poller #1 [got 0 values in 0.000005 sec, getting values]
          zabbix   13468  0.0  0.0 2318932 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: trapper #1 [processed data in 0.000008 sec, waiting for connection]
          zabbix   13472  0.0  0.0 2318932 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: trapper #2 [processed data in 0.000009 sec, waiting for connection]
          zabbix   13473  0.0  0.0 2318932 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: trapper #3 [processed data in 0.000008 sec, waiting for connection]
          zabbix   13474  0.0  0.0 2318932 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: trapper #4 [processed data in 0.000008 sec, waiting for connection]
          zabbix   13475  0.0  0.0 2318932 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: trapper #5 [processed data in 0.000009 sec, waiting for connection]
          zabbix   13476  0.0  0.1 2321444 6504 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #1 [got 0 values in 0.000012 sec, idle 2 sec]
          zabbix   13477  0.0  0.1 2321444 6152 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #2 [got 0 values in 0.000003 sec, idle 3 sec]
          zabbix   13478  0.0  0.1 2321444 6352 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #3 [got 0 values in 0.000003 sec, idle 3 sec]
          zabbix   13479  0.0  0.1 2321444 6688 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #4 [got 0 values in 0.000011 sec, idle 2 sec]
          zabbix   13480  0.0  0.1 2321444 6520 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #5 [got 0 values in 0.000004 sec, idle 3 sec]
          zabbix   13487  0.0  0.1 2321444 6520 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #6 [got 0 values in 0.000008 sec, idle 2 sec]
          zabbix   13488  0.0  0.1 2321448 6344 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #7 [pinging hosts]
          zabbix   13489  0.0  0.1 2321444 6192 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #8 [got 0 values in 0.000003 sec, idle 3 sec]
          zabbix   13490  0.0  0.1 2321444 6320 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #9 [got 0 values in 0.000025 sec, idle 2 sec]
          zabbix   13491  0.0  0.1 2321444 6204 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #10 [got 0 values in 0.000003 sec, idle 3 sec]
          zabbix   13492  0.0  0.1 2321444 6292 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #11 [got 0 values in 0.000004 sec, idle 3 sec]
          zabbix   13493  0.0  0.1 2321444 6356 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #12 [got 0 values in 0.000003 sec, idle 3 sec]
          zabbix   13494  0.0  0.1 2321444 6284 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #13 [got 0 values in 0.000003 sec, idle 2 sec]
          zabbix   13495  0.0  0.1 2321444 6308 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #14 [got 0 values in 0.000003 sec, idle 3 sec]
          zabbix   13496  0.0  0.1 2321444 6220 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #15 [got 0 values in 0.000002 sec, idle 3 sec]
          zabbix   13497  0.0  0.1 2321444 6440 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #16 [got 0 values in 0.000003 sec, idle 3 sec]
          zabbix   13505  0.0  0.1 2321444 6168 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #17 [got 0 values in 0.000003 sec, idle 3 sec]
          zabbix   13506  0.0  0.1 2321444 6492 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #18 [got 0 values in 0.000004 sec, idle 3 sec]
          zabbix   13513  0.0  0.1 2321444 6144 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #19 [got 0 values in 0.000004 sec, idle 3 sec]
          zabbix   13514  0.0  0.1 2321444 6156 ?        S    13:25   0:00 /usr/sbin/zabbix_server: icmp pinger #20 [got 0 values in 0.000003 sec, idle 3 sec]
          zabbix   13515  0.0  0.0 2318932 3472 ?        S    13:25   0:00 /usr/sbin/zabbix_server: alerter [sent alerts: 0 success, 0 fail in 0.000374 sec, idle 30 sec]
          zabbix   13516  0.0  0.0 2318932 3536 ?        S    13:25   0:00 /usr/sbin/zabbix_server: housekeeper [startup idle for 30 minutes]
          zabbix   13518  0.0  0.0 2319068 5624 ?        S    13:25   0:00 /usr/sbin/zabbix_server: timer #1 [processed 3 triggers, 0 events in 0.000306 sec, 0 maintenances in 0.000000 sec, idle 30 sec]
          zabbix   13519  0.0  0.0 2318932 3536 ?        S    13:25   0:00 /usr/sbin/zabbix_server: http poller #1 [got 0 values in 0.000533 sec, idle 5 sec]
          zabbix   13520  0.0  0.1 2328128 8124 ?        S    13:25   0:00 /usr/sbin/zabbix_server: discoverer #1 [processed 0 rules in 0.000610 sec, idle 60 sec]
          zabbix   13522  0.1  0.7 2348952 44064 ?       S    13:25   0:00 /usr/sbin/zabbix_server: history syncer #1 [synced 0 items in 0.000006 sec, idle 1 sec]
          zabbix   13523  0.0  0.5 2340476 35436 ?       S    13:25   0:00 /usr/sbin/zabbix_server: history syncer #2 [synced 0 items in 0.000010 sec, idle 1 sec]
          zabbix   13524  0.0  0.6 2341828 36988 ?       S    13:25   0:00 /usr/sbin/zabbix_server: history syncer #3 [synced 57 items in 0.015627 sec, idle 1 sec]
          zabbix   13525  0.0  0.5 2339660 34708 ?       S    13:25   0:00 /usr/sbin/zabbix_server: history syncer #4 [synced 768 items in 0.256499 sec, idle 1 sec]
          zabbix   13532  0.0  0.0 2318932 5708 ?        S    13:25   0:00 /usr/sbin/zabbix_server: escalator #1 [processed 0 escalations in 0.000196 sec, idle 3 sec]
          zabbix   13533  0.0  0.0 2321452 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: java poller #1 [got 0 values in 0.000003 sec, idle 5 sec]
          zabbix   13534  0.0  0.0 2321452 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: java poller #2 [got 0 values in 0.000003 sec, idle 5 sec]
          zabbix   13535  0.0  0.0 2321452 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: java poller #3 [got 0 values in 0.000003 sec, idle 5 sec]
          zabbix   13536  0.0  0.0 2321452 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: java poller #4 [got 0 values in 0.000003 sec, idle 5 sec]
          zabbix   13537  0.0  0.0 2321452 5772 ?        S    13:25   0:00 /usr/sbin/zabbix_server: java poller #5 [got 0 values in 0.000004 sec, idle 5 sec]
          zabbix   13538  0.0  0.0 2318932 3536 ?        S    13:25   0:00 /usr/sbin/zabbix_server: snmp trapper [processed data in 0.000014 sec, idle 1 sec]
          zabbix   13539  0.0  0.0 2318932 5708 ?        S    13:25   0:00 /usr/sbin/zabbix_server: proxy poller #1 [exchanged data with 0 proxies in 0.000002 sec, idle 5 sec]
          zabbix   13540  0.0  0.0 2318932 3472 ?        S    13:25   0:00 /usr/sbin/zabbix_server: self-monitoring [processed data in 0.000005 sec, idle 1 sec]
          zabbix   14434  0.0  0.0   4448   688 ?        S    13:30   0:00 sh -c /usr/bin/fping -C3 2>&1 </tmp/zabbix_server_13488.pinger;/usr/bin/fping6 -C3 2>&1 </tmp/zabbix_server_13488.pinger;
          zabbix   14435  0.0  0.0   7988  1780 ?        S    13:30   0:00 /usr/bin/fping -C3
          root     14437  0.0  0.0  17988  2208 pts/0    R+   13:30   0:00 grep --color=auto zabbix
          root@zabbix-office-nsk:~#
          Code:
          root@zabbix-office-nsk:~# df
          Файл.система   1K-блоков Использовано  Доступно Использовано% Cмонтировано в
          udev             3041592            4   3041588            1% /dev
          tmpfs             611180          400    610780            1% /run
          /dev/dm-0      300975752    125149672 163256468           44% /
          none                   4            0         4            0% /sys/fs/cgroup
          none                5120            0      5120            0% /run/lock
          none             3055896            0   3055896            0% /run/shm
          none              102400            0    102400            0% /run/user
          /dev/sda1         240972       198256     30275           87% /boot
          root@zabbix-office-nsk:~#

          Comment

          • Fractal1990
            Senior Member
            • Mar 2016
            • 129

            #35
            Блин все равно какая то фигня, вроде задал в файле и ребутнул сначала все упало и далее снова загружено
            Last edited by Fractal1990; 07-07-2016, 07:19.

            Comment

            • DmitryL
              Senior Member
              Zabbix Certified SpecialistZabbix Certified Professional
              • May 2016
              • 278

              #36
              Housekeeper это нормально. Процесс чистит таблицы истории и трендов БД.
              По дефалту он запускается раз в час. Это вообще отдельная тема

              Poller_unreachable - Количество экземпляров пре-форков поллеров для недоступных узлов сети (включая IPMI и Java).

              Опять же можно посмотреть график по нему. Возможно нужно добавить их в конфиге.
              И еще, вижу что вы добавили за много некоторые поллеры.

              Смотрите графики и PS AUX
              Не есть хорошо что из 20 поллеров реально заняты делом только ~5

              Comment

              • Fractal1990
                Senior Member
                • Mar 2016
                • 129

                #37
                Originally posted by Dmitryb
                Housekeeper это нормально. Процесс чистит таблицы истории и трендов БД.
                По дефалту он запускается раз в час. Это вообще отдельная тема

                Poller_unreachable - Количество экземпляров пре-форков поллеров для недоступных узлов сети (включая IPMI и Java).

                Опять же можно посмотреть график по нему. Возможно нужно добавить их в конфиге.
                И еще, вижу что вы добавили за много некоторые поллеры.

                Смотрите графики и PS AUX
                Не есть хорошо что из 20 поллеров реально заняты делом только ~5
                StartPingers=40
                StartPollers=40

                на графиках нагрузка спала, ps выдает что по 40 то и того понемногу заняты, уже более менее походу

                Comment

                • DmitryL
                  Senior Member
                  Zabbix Certified SpecialistZabbix Certified Professional
                  • May 2016
                  • 278

                  #38
                  У вас так много icmp проверок? Я думаю 40 многовато.

                  Попытайтесь вникнуть в задачу каждого параметра, и насколько вы его используете.
                  Их не так уж и много

                  Допустим после анализа стало ясно что вам нужно 40 поллеров.
                  Результат с 45 поллерами будет хуже чем с 40. А если превысить нужное количество в два раза - будет совсем не хорошо

                  Действительно стоит почитать хоть документацию на эти темы. Они вам ещё пригодятся.

                  Comment

                  • Fractal1990
                    Senior Member
                    • Mar 2016
                    • 129

                    #39
                    Originally posted by dmitryb
                    У вас так много icmp проверок? Я думаю 40 многовато.

                    Попытайтесь вникнуть в задачу каждого параметра, и насколько вы его используете.
                    Их не так уж и много

                    Допустим после анализа стало ясно что вам нужно 40 поллеров.
                    Результат с 45 поллерами будет хуже чем с 40. А если превысить нужное количество в два раза - будет совсем не хорошо

                    Действительно стоит почитать хоть документацию на эти темы. Они вам ещё пригодятся.
                    хм, т.е. предлагаете снизить и по мере нагрузки добавлять? просто планируется внести около 1500 устройств постепенно, еще интересно то что память загружена на 16 ГБ практически, на неё данные процессы влияют? хаускипер работает по графику минут по 40 и далее минут 30 затишье. Сейчас начну углубленно изучать данные процессы

                    Comment

                    • Fractal1990
                      Senior Member
                      • Mar 2016
                      • 129

                      #40
                      Originally posted by Dmitryb
                      Housekeeper это нормально. Процесс чистит таблицы истории и трендов БД.
                      По дефалту он запускается раз в час. Это вообще отдельная тема

                      Poller_unreachable - Количество экземпляров пре-форков поллеров для недоступных узлов сети (включая IPMI и Java).

                      Опять же можно посмотреть график по нему. Возможно нужно добавить их в конфиге.
                      И еще, вижу что вы добавили за много некоторые поллеры.

                      Смотрите графики и PS AUX
                      Не есть хорошо что из 20 поллеров реально заняты делом только ~5
                      уже час 100 процентов Housekeeper, плюс к пределу поднимается Zabbix history syncer processes more than 75% busy

                      плюсом не понятно отчего Disk I/O is overloaded

                      Comment

                      • DmitryL
                        Senior Member
                        Zabbix Certified SpecialistZabbix Certified Professional
                        • May 2016
                        • 278

                        #41
                        Какой размер у вашей БД?
                        Какой период храните history и trends данные?
                        Какую БД используете?

                        Comment

                        • Fractal1990
                          Senior Member
                          • Mar 2016
                          • 129

                          #42
                          Originally posted by Dmitryb
                          Какой размер у вашей БД?
                          Какой период храните history и trends данные?
                          Какую БД используете?
                          mysql

                          Какой период храните history и trends данные? все по 365 дней

                          Comment

                          • DmitryL
                            Senior Member
                            Zabbix Certified SpecialistZabbix Certified Professional
                            • May 2016
                            • 278

                            #43
                            365 дней это слишком много...
                            Оптимально ~10 дней.
                            Только не ставьте сейчяс override na 10 дней - тогда и так загруженный хаускипер будет удалять всю историю старше 10ти дней.

                            Советую сильно опдумать возможность перейти на Table Partitioning вместо housekeeper. Чем больше у вас будет рости база данных, тем больше и дольше будет мучится housekeeper.

                            Есть даже готовые примеры. Нужно только по шагам выполнять
                            Join the friendly and open Zabbix community on our forums and social media platforms.

                            Comment

                            • Fractal1990
                              Senior Member
                              • Mar 2016
                              • 129

                              #44
                              Originally posted by dmitryb
                              365 дней это слишком много...
                              Оптимально ~10 дней.
                              Только не ставьте сейчяс override na 10 дней - тогда и так загруженный хаускипер будет удалять всю историю старше 10ти дней.

                              Советую сильно опдумать возможность перейти на table partitioning вместо housekeeper. Чем больше у вас будет рости база данных, тем больше и дольше будет мучится housekeeper.

                              Есть даже готовые примеры. Нужно только по шагам выполнять
                              http://zabbix.org/wiki/docs/howto/mysql_partitioning
                              условие хранить минимум полгода, желательно год...

                              Comment

                              • DmitryL
                                Senior Member
                                Zabbix Certified SpecialistZabbix Certified Professional
                                • May 2016
                                • 278

                                #45
                                А тренды за этот период не устраивают?
                                Хранение динамики изменений

                                Динамика изменений является встроенным механизмом обработки данных истории, где для каждого часа хранятся значения минимума, максимума и усредненное значение, а также общее количество значений за этот час.


                                В любом случае, если вы храните данные такой глубины.
                                Советаю отказываться от хаускипера и переходить на partitioning.

                                Хаускипер не плох на малых бд. Но в больших инсталляциях ето не лучший способ чистить историю.

                                Comment

                                Working...