Ad Widget

Collapse

Элементы данных более 800 zabbix тормозит

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Kazakh
    Junior Member
    • Feb 2013
    • 13

    #1

    Элементы данных более 800 zabbix тормозит

    Доброго времени суток!
    При количестве элементов данных превышающих 800 zabbix начинает тормозить количество узлов 57.: отклик медленный перестает отрисовывать графики.
    Может какие параметры подправить в php.ini или zabbix_server.conf (на даный момент параметры по умолчанию), кто-нибудь сталкивался с такой проблемой?
  • Sergeylo
    Member
    • Feb 2011
    • 40

    #2
    "Начинает тормозить" - очень плохая и размытая формулировка.
    Если "тормозит" - значит, упирается в аппаратные ресурсы. Это либо процессор, либо, скорее всего, жёсткий диск (довольно массивная база данных).
    Вообще, стоило бы для начала провести хоть минимальную диагностику - включить slow_query_log и посмотреть на шаблонные графики Zabbix internal process busy / Zabbix server perfomance.
    Проблема, вероятно, не в конфигурации php или zabbix.
    800 "ежеминутных" элементов данных - довольно мало.

    Comment

    • Kazakh
      Junior Member
      • Feb 2013
      • 13

      #3
      Да посмотрел стандартные отчеты zabbix увеличил объем ОЗУ вроде зависания сервера перестали. Спасибо!

      Comment

      • igoreha311
        Member
        • Sep 2011
        • 99

        #4
        Не стал создавать новую тему.
        Проблема в следующем: очень медленно грузятся все странницы zabbix в момент, когда запускается housekeeper. Какие-нибудь идеи есть?

        Comment

        • igoreha311
          Member
          • Sep 2011
          • 99

          #5
          ЦПУ практически не напрягается. Памяти достаточно.

          Comment

          • igoreha311
            Member
            • Sep 2011
            • 99

            #6


            Количество узлов сети (под наблюдением/без наблюдения/шаблоны) - 1742 (1684 / 11 / 47)
            Количество элементов данных (активных/деактивированых/не поддерживаются) - 285942 (20604 / 261949 / 3389)
            Количество триггеров (активированных/деактивированных)[проблема/неизвестно/ок] - 13068 (7258 / 5810 [81 / 0 / 7177])

            Comment

            • igoreha311
              Member
              • Sep 2011
              • 99

              #7
              Часть конфигурации zabbix-сервера:
              HousekeepingFrequency=8
              CacheSize=128M
              StartDBSyncers=50
              HistoryCacheSize=128M
              TrendCacheSize=128M
              HistoryTextCacheSize=128M
              Пробовал различные значения, но толку нет.
              Партиционирования ДБ нет.

              Linux nm-zabbix 2.6.32-5-amd64 #1 SMP Sun Sep 23 10:07:46 UTC 2012 x86_64 GNU/Linux

              Debian GNU/Linux 6.0 \n \l

              mysql Ver 14.14 Distrib 5.1.63, for debian-linux-gnu (x86_64) using readline 6.1



              Больше одного изображения в посте не дает сделать, вот и пришлось несколько написать.
              Last edited by igoreha311; 22-05-2013, 17:01.

              Comment

              • Sergeylo
                Member
                • Feb 2011
                • 40

                #8
                Медленный диск и/или неоптимизированная БД.
                По оптимизации БД талмуды пишут, а вот дисочек / фс я бы проверил.
                Рекомендую поставить HousekeepingFrequency=1 и понаблюдать.

                Comment

                • Sergeylo
                  Member
                  • Feb 2011
                  • 40

                  #9
                  Стоп-стоп-стоп, что я вижу? 193 значения в секунду - настоящее испытание для диска, "бытовой" нормально тянет вдвое меньшие значения.
                  Настоятельно рекомендую понизить интенсивность опроса, отказаться от шаблонов, где это возможно, оптимизировать (убавить интервалы, выкинуть мусор) шаблоны.

                  Comment

                  • Zerocool56
                    Member
                    • Mar 2013
                    • 68

                    #10
                    Эммм, простите, 140килозапросов медленных в БД?

                    Здесь явно что-то не так ...

                    Настройки мускуля какие?

                    Параметры дисковой подсистемы какие?

                    Comment

                    • magomed
                      Member
                      • May 2013
                      • 31

                      #11
                      Доброе утро.. нестал разводить тему т.к. у меня тоже приблизительно такая же проблема.. стоит железо с (intel xeon 5640 X 2, ОЗУ 24 gb, hdd - 2 tb raid 10) ось - centos 6.3 zabbix 2.0.6, у меня около 4 тыс узлов. при открытии мелких карт проблем невозникало.. но есть общая карта.. при ее обновлении очень долго открывается.. почти полтора минуты.. как можно решить эту проблему?

                      Comment

                      • Jimson
                        Senior Member
                        • Jan 2008
                        • 1327

                        #12
                        так картинка-карта это один объект, он создается одним процессом http сервера, иначе говоря в один тред

                        Comment

                        • magomed
                          Member
                          • May 2013
                          • 31

                          #13
                          Originally posted by Jimson
                          так картинка-карта это один объект, он создается одним процессом http сервера, иначе говоря в один тред
                          покопаля маленько.. нашел проблему.. при открытии основной карты сервер делал запросы на таблицу мускула eventsid что в свою очередь занимала 144 секунды.. потом нашел в настройках что история событий стоит 365 дней.. поменял на 90.. жду результатов

                          Comment

                          • igoreha311
                            Member
                            • Sep 2011
                            • 99

                            #14
                            Originally posted by zerocool56
                            Эммм, простите, 140килозапросов медленных в БД?

                            Здесь явно что-то не так ...

                            Настройки мускуля какие?

                            Параметры дисковой подсистемы какие?
                            Вообще, всё крутится на виртуалке.

                            hdparm -i /dev/sda1

                            /dev/sda1:
                            Sg_io: Bad/missing sense data, sb[]: 70 00 05 00 00 00 00 0a 00 00 00 00 20 00 00 c0 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00

                            compactflash ata device
                            model number: \;t/&dtg&;tlt; dlcsa=sq&ou;tq&ou;tg&;ta&
                            serial number: Lcsa=sq&ou;tq&ou;tg&
                            firmware revision: 3 я6&│tl
                            media serial num: ;tl&;tatlb elcsa=sq&ou;tq&ou;tg&;tl&;trt
                            media manufacturer: C alss&=uqto&;uqto&;
                            transport: 0x6c26; revision: 0x3b74
                            standards:
                            Used: Unknown (minor revision code 0x7369)
                            supported: 14 13 10 5
                            likely used: 14
                            configuration:
                            Logical max current
                            cylinders 29804 0
                            heads 29743 0
                            sectors/track 9787 0
                            --
                            lba user addressable sectors: 1634493216
                            lba48 user addressable sectors:3979279247233805925
                            logical/physical sector size: 512 bytes
                            device size with m = 1024*1024: 1943007444938381 mbytes
                            device size with m = 1000*1000: 8249126475657 mbytes (8249126475 gb)
                            cache/buffer size = unknown
                            nominal media rotation rate: 28966
                            capabilities:
                            Lba, iordy(may be)(cannot be disabled)
                            queue depth: 13
                            standby timer values: Spec'd by standard
                            r/w multiple sector transfer: Max = 109 current = ?
                            Advanced power management level: 113
                            recommended acoustic management value: 107, current value: 99
                            dma: Mdma0 *mdma1 *mdma2 mdma3 mdma4 *mdma5 *udma1 udma3 *udma4 *udma5 *udma6 (?)
                            pio: Unknown
                            commands/features:
                            Enabled supported:
                            * smart feature set
                            * write cache
                            * look-ahead
                            device_reset command
                            * read_buffer command
                            * nop cmd
                            * cfa feature set
                            * advanced power management feature set
                            * power-up in standby feature set
                            * set_features required to spinup after power up
                            set_max security extension
                            * 48-bit address feature set
                            * flush_cache_ext
                            * unknown 76[0]
                            * gen1 signaling speed (1.5gb/s)
                            * unknown 76[4]
                            * unknown 76[5]
                            * unknown 76[6]
                            * native command queueing (ncq)
                            * host-initiated interface power management
                            * ncq priority information
                            * unknown 76[13]
                            * unknown 76[14]
                            * unknown 78[0]
                            in-order data delivery
                            * asynchronous notification (eg. Media change)
                            * software settings preservation
                            unknown 78[8]
                            * unknown 78[10]
                            * unknown 78[12]
                            * unknown 78[13]
                            * unknown 78[14]
                            * smart command transport (sct) feature set
                            * sct long sector access (ac1)
                            * sct lba segment access (ac2)
                            * sct data tables (ac5)
                            unknown 206[6]
                            unknown 206[10]
                            unknown 206[12] (vendor specific)
                            unknown 206[13] (vendor specific)
                            unknown 206[14] (vendor specific)
                            * reserved 69[0]
                            * reserved 69[1]
                            * reserved 69[3]
                            * reserved 69[4]
                            * set max setpassword/unlock dma commands
                            * write buffer dma command
                            * long physical sector diagnostics
                            key management (cprm) feature set
                            removable media status notification feature set supported
                            security:
                            Master password revision code = 29807
                            not supported
                            not enabled
                            locked
                            not frozen
                            not expired: Security count
                            supported: Enhanced erase
                            hw reset results:
                            Cblid- above vih
                            device num = 0 determined by the jumper
                            integrity word not set (found 0x3b74, expected 0x82a5)
                            cat /proc/meminfo
                            memtotal: 12333240 kb
                            memfree: 281952 kb
                            buffers: 150288 kb
                            cached: 7203384 kb
                            swapcached: 1228 kb
                            active: 7576868 kb
                            inactive: 2952268 kb
                            active(anon): 2910944 kb
                            inactive(anon): 490012 kb
                            active(file): 4665924 kb
                            inactive(file): 2462256 kb
                            unevictable: 0 kb
                            mlocked: 0 kb
                            swaptotal: 5758968 kb
                            swapfree: 5747756 kb
                            dirty: 216 kb
                            writeback: 1164 kb
                            anonpages: 3173884 kb
                            mapped: 254752 kb
                            shmem: 225492 kb
                            slab: 354536 kb
                            sreclaimable: 249808 kb
                            sunreclaim: 104728 kb
                            kernelstack: 31192 kb
                            pagetables: 1004360 kb
                            nfs_unstable: 0 kb
                            bounce: 0 kb
                            writebacktmp: 0 kb
                            commitlimit: 11925588 kb
                            committed_as: 7851012 kb
                            vmalloctotal: 34359738367 kb
                            vmallocused: 308236 kb
                            vmallocchunk: 34359423084 kb
                            hardwarecorrupted: 0 kb
                            hugepages_total: 0
                            hugepages_free: 0
                            hugepages_rsvd: 0
                            hugepages_surp: 0
                            hugepagesize: 2048 kb
                            directmap4k: 10240 kb
                            directmap2m: 12572672 kb

                            cat /proc/cpuinfo

                            processor : 0
                            vendor_id : Genuineintel
                            cpu family : 6
                            model : 26
                            model name : Intel(r) xeon(r) cpu x5660 @ 2.80ghz
                            stepping : 4
                            cpu mhz : 2800.099
                            cache size : 12288 kb
                            physical id : 0
                            siblings : 2
                            core id : 0
                            cpu cores : 2
                            apicid : 0
                            initial apicid : 0
                            fpu : Yes
                            fpu_exception : Yes
                            cpuid level : 11
                            wp : Yes
                            flags : Fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc aperfmperf pni ssse3 cx16 sse4_1 sse4_2 popcnt hypervisor lahf_lm ida arat
                            bogomips : 5600.19
                            clflush size : 64
                            cache_alignment : 64
                            address sizes : 40 bits physical, 48 bits virtual
                            power management:

                            ......

                            Processor : 7
                            vendor_id : Genuineintel
                            cpu family : 6
                            model : 26
                            model name : Intel(r) xeon(r) cpu x5660 @ 2.80ghz
                            stepping : 4
                            cpu mhz : 2800.099
                            cache size : 12288 kb
                            physical id : 3
                            siblings : 2
                            core id : 1
                            cpu cores : 2
                            apicid : 7
                            initial apicid : 7
                            fpu : Yes
                            fpu_exception : Yes
                            cpuid level : 11
                            wp : Yes
                            flags : Fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht syscall nx rdtscp lm constant_tsc arch_perfmon pebs bts rep_good xtopology tsc_reliable nonstop_tsc aperfmperf pni ssse3 cx16 sse4_1 sse4_2 popcnt hypervisor lahf_lm ida arat
                            bogomips : 5600.19
                            clflush size : 64
                            cache_alignment : 64
                            address sizes : 40 bits physical, 48 bits virtual
                            power management:
                            Настройки мускула не трогал, только максимальное количество подключений.

                            Comment

                            • Sergeylo
                              Member
                              • Feb 2011
                              • 40

                              #15
                              Не стоит хранить БД на виртуальном носителе - лишняя прослойка почти всегда даёт ощутимое замедление. Стоит отдавать машине физический раздел / диск. Оптимально - отдать raid-массив, монопольно.
                              Каков сейчас размер БД?

                              Comment

                              Working...