Ad Widget

Collapse

Мониторинг лог файла

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • H1r0Sh1mA
    Junior Member
    • Nov 2014
    • 12

    #1

    Мониторинг лог файла

    Коллеги, добрый день.

    Мониторю лог файл, в который пердаются коды ошибок.

    На интересующие меня коды созданы вычисляемые элементы (calculated items), которые считают кол-во вхождений кодов за минуту.
    Пример того , как считается кол-во пришедших кодов "101" за минуту:

    Code:
    count("log[/file.log,\"^(\S+) (\S+) (\S+) (\S+) \[(.*?)\] \\"(\S+)\s?(\S+)?\s?(\S+)?\\" (\S+) (\S+) \\"(\S+)\\" \\"(.*?)\\"\",,,skip,\9]",60,101)
    Данные приходят, графики рисуются, триггеры срабатывают как надо, однако заметил нюанс:

    Раз в час график отображает нулевые значения в течении 10 минут (такого быть не может). В это время и в Latest Data по вычисляемы элементам считаются нулевые значения. Через 10 минут счетчики выравниваются и данные снова начинают корректно вычисляться.
    В момент, когда приходят нулевые значения проверил логи агента и увидел, что корректные значения передаются таки на сервер, проблема явно в функции подсчета count.

    Лог файл наполняется постоянно и достаточно интенсивно. Active Item опрашивается каждые 5 секунд. В конфиге агента MaxLinesPerSecond=200.

    В БД заббикса видно:
    Code:
    itemid | clock | value | ns
    --------+------------+-------+-----------
    85454 | 1602066674 | 0 | 346957393
    85454 | 1602066734 | 0 | 287870239
    85454 | 1602066794 | 0 | 713884470
    85454 | 1602066854 | 0 | 520716609
    85454 | 1602066914 | 0 | 129478567
    85454 | 1602066974 | 0 | 757004467
    85454 | 1602067034 | 0 | 620146401
    85454 | 1602067094 | 0 | 242919047
    85454 | 1602067154 | 0 | 788841425
    85454 | 1602067214 | 0 | 480879462
    85454 | 1602067274 | 0 | 457705724
    85454 | 1602067334 | 0 | 603196641
    85454 | 1602067394 | 0 | 143603428
    85454 | 1602067454 | 139 | 584340879
    85454 | 1602067514 | 897 | 17228898
    85454 | 1602067574 | 726 | 169231576
    85454 | 1602067634 | 695 | 3911063
    85454 | 1602067694 | 682 | 344972047
    85454 | 1602067754 | 593 | 362954336
    85454 | 1602067814 | 379 | 612890908
    где value - колл-во пересчитанных кодов.

    Пример графика:
    Click image for larger version  Name:	screen-logs.png Views:	0 Size:	36.2 KB ID:	410477
    Last edited by H1r0Sh1mA; 08-10-2020, 23:43.
  • MrGoodCat
    Junior Member
    • Oct 2020
    • 8

    #2
    Начну с глупых вопросов: а сервер в обслуживании без сбора данных по периодам не стоит, случаем?)

    Comment

    • Semiadmin
      Senior Member
      • Oct 2014
      • 1625

      #3
      Странная картина. Единственное, что могу предположить - и так неслабо нагруженный такой обработкой логов сервер в начале часа, когда возникает дополнительная нагрузка на БД (расчет трендов), не справляется со своими задачами. Например, не пишет вовремя в БД данные, прилетающие от активных агентов. Может, использовать log.count и заставить поработать агентов? Обычно к подобным трюкам с вычисляемыми прибегают при мониторинге логов винды, но для Linux давно существует штатный функционал.

      Comment

      • H1r0Sh1mA
        Junior Member
        • Nov 2014
        • 12

        #4
        Начну с глупых вопросов: а сервер в обслуживании без сбора данных по периодам не стоит, случаем?)
        нет , не стоит :-)

        Comment

        Working...