Ad Widget

Collapse

Tunning Zabbix klienta

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Rudlafik
    Senior Member
    • Nov 2018
    • 144

    #1

    Tunning Zabbix klienta

    Ahoj,

    mám klienty v jední lokalitě v DC. na jedné VM Win sbírám i 1500 metrik avšak stává se mi, že od určitého počtu kontrolovaných hodnot nastávají "díry" v kontinuitě měřených/sbíraných dat. Jak diagnostikovat kde je problém? Nebo jak vytunit ZBX agenta? Jdu cestou, že na jednu VM mašinu udělám 3 klony a rozdělím TMP trochu to pomohlo, ale 100% to není. Prubnul jsem změnu portů nepomohlo. Je to divný protože ZBX server leží ve stejné lokalitě na stejném VMWare clusteru s identickým HW. Jedná se o hodně vytížený klientský server a potřebuju na něm sbírat hafo hodnot ale nějak to nedává. Přitom CPU i RAM je OK. Dedikovat síťovku jen pro monitoring? ZBX server je v pohodě u jiných VM k výpadkům v datové řadě nedochází.
    Děkuji za postřehy
    R​
  • hermanekt
    Member
    Zabbix Certified Trainer
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2019
    • 59

    #2
    Zdravim,

    zalezi zda mate agent 1 nebo 2 a jake checky delate passive nebo aktiv

    Zabbix agent 1 ma pro pasivni checky: StartAgents​ parametr v default je 3

    Zabbix agent 1 se pro aktivni checky moc tunit neda, max tim co tam volate (Dela to seriove!)

    Obecne doporucuji agent 2

    Zabbix agent 2

    Je tam moznost v konfiguraku si povolit StatusPort​, je to html kde vidite co se pouziva. Tam se pak da tunit limit pluginu.

    ### Option: StatusPort
    # Agent will listen on this port for HTTP status requests.
    #
    # Mandatory: no
    # Range: 1024-32767
    # Default:
    # StatusPort=​

    Plus navic ma vlastni timeout pro kazdy plugin a paralerizaci pro aktivni checky.

    Pokud pouzivate nejake vlastni klice urcite doporucuji kontrolu jak co dlouho trva a optimalizaci.

    Tom

    Comment

    • Rudlafik
      Senior Member
      • Nov 2018
      • 144

      #3
      Dík za tip, prubnu status port. Používám jen 2. Právě přemýšlím nad těmi AC. Pluginy tu nasazeny nemáme. Paralelizace jsem se domníval je u 2 standard nebo se to ladí klíči Buffer? Nebo ; v ServerActive?

      Comment


      • hermanekt
        hermanekt commented
        Editing a comment
        Zdravim,

        pokud mate Agenty 2 tak mate i pluginy, je tam vse delane jako plugin. Uvidite pres tu status page, kde je i videt, ktery je aktivni v ramci kontrol. Tam asi budete nekde chytat limit na pocet (da se zvednout).

        Viz: https://www.zabbix.com/documentation...oncepts/agent2

        Pripadne prikaz zabbix_agent2 -R metrics Vam vypise aktualni stav

        Priklad:
        [UserParameter]
        active: true
        capacity: 0/100
        check on start: 0
        tasks: 0
        ...

        Nebo
        [Cpu]
        active: true
        capacity: 0/100
        check on start: 0
        tasks: 1
        system.cpu.discovery: List of detected CPUs/CPU cores, used for low-level discovery.
        system.cpu.num: Number of CPUs.
        system.cpu.util: CPU utilisation percentage.

        Tom
    • Rudlafik
      Senior Member
      • Nov 2018
      • 144

      #4
      Bomba! už jsem to prubnul na testu No.1 Ještě dotaz lze nějak sledovat statistiku Pasivního klienta na kolik žádostí serveru v určitém časovém intervalu neodpověděl? (server nedostal od agenta hodnoty)

      Comment

      • hermanekt
        Member
        Zabbix Certified Trainer
        Zabbix Certified SpecialistZabbix Certified Professional
        • Aug 2019
        • 59

        #5
        Originally posted by Rudlafik
        Bomba! už jsem to prubnul na testu No.1 Ještě dotaz lze nějak sledovat statistiku Pasivního klienta na kolik žádostí serveru v určitém časovém intervalu neodpověděl? (server nedostal od agenta hodnoty)
        Prvni co me napada je vytahovat si ty statistiky pres http agenta a pak parzovat.

        Idealne asi lld s javasript preprocesingem a nad tim stejnym master itemem (HTTP) si pak delat itemy pres to lld.

        Comment

        • Rudlafik
          Senior Member
          • Nov 2018
          • 144

          #6
          Děkuji. Ano to by šlo. A budu to tak určitě dělat. Ale mě se spíše jednalo o toto viz obrázek. Jak zjistit, že se hodnoty ztrácí. Vytvořit u každého klienta kontrolu na Foreach functions? Sečíst nějak "no response" u každého klienta a pak třeba zjistit, že na nějakém vmware hostu je problémových klientů více než jinde. Mám pocit, že bez ručního klikání a koukání na sebrané výsledky a analýzů zda se vrací dané hodnoty v termínu či zda je tam díra nemám automatizační prostředek pro získání statistiky na klientu tj. prostředek, jak zjistit jak moc mi klient nestíhá předat data na server. Z Vámi popsaného statusu zjistím, že je třeba modul CPU na 100/100. Asi nějak ručně upravím hodnotu na 0/300 (Plugins.CPU.System.Capacity=300) a vložím do konfiguráku. Ale jak sebrat hodnotu ze serveru informaci, že v poslední hodině klient nedodal v naplanované kontrole např. 3741 hodnot. Jak zjistit na kterých klientech dochází k výpadkum a nendodání dat. Nějaký SQL dotaz do DB??? Nevím jak to uchopit. Nevypadá to hezky když ukazuji vedoucímu vývoje data z monitoringu, která chce zobrazit a jsou tam díry a v daném požadovaném čase tam není hodnota. Rád bych přešel z náhodnho objevování, že agent nedodává data na kontrolovanou statistiku konkrétních čísel. Status je vlastně nepřímá technika, jak se dostat k přetíženému klientu, ale co když to nebude přetížením, ale něčím jiným. Pak status bude OK a já nepříjdu na to, že se agent "zakuckává". Ale ještě jednou mnohokrát děkuji za radu s tuněním klienta skrze status. Koukal jsem i na to jak psát moduly v GO, ale vše postupně :-)
          Attached Files

          Comment

          • Rudlafik
            Senior Member
            • Nov 2018
            • 144

            #7
            Tak bohužel po testu jsem se dostal k potvrzení že více jak 100 nenastavíte. Můžete jít pouze dolů Plugins.WindowsPerfMon.System.Capacity=101 bohužel hodnota se vrátila na 100 Plugins.WindowsPerfMon.System.Capacity=98 hodnota capacity: se změnila na 98. Takže tady očividně výkon ladit nemohu.

            Comment

            • hermanekt
              Member
              Zabbix Certified Trainer
              Zabbix Certified SpecialistZabbix Certified Professional
              • Aug 2019
              • 59

              #8
              Ahoj,

              dlouho jsem se neozval ale mam dobrou zpravu: https://git.zabbix.com/projects/ZBX/.../7271/overview ( set maximal Zabbix agent 2 plugin capacity to 1000 and default capacity to 100)

              Tak snad pomuze. Ted uz jen pockat az bude balicek, nebo si to zkompilovat.
              Tom

              Comment

              Working...