Ad Widget

Collapse

Zabbix 4.4 Zabbix agent on myserver is unreachable for 5 minutes

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • pstbin
    Junior Member
    • Dec 2019
    • 20

    #1

    Zabbix 4.4 Zabbix agent on myserver is unreachable for 5 minutes

    Добры день.
    Периодически получаю сообщения о том, что агент недоступен в течении пяти минут, хотя с агентом проблем нет, он работает исправно, так по крайней мере сообщает сам zabbix, если смотреть в latest data. Там агент сообщает о том, что он доступен и передаёт данные, в тоже время, когда приходят письма на почту о том, что он якобы недоступен. Таймауты проверял, стоят по дефолту, у агента 3с, у сервера и прокси 4с. В логах агентов, на тех серверах, где якобы проблема, никаких сообщений нет. Есть ещё одна странность, выглядит она следующим образом: "Problem started: at 06:32:13 on 2019.12.27.
    Problem name: Zabbix agent on myserver is unreachable for 5 minutes
    Host: myserver
    Severity: Average
    Original event ID: 23873868
    " - это сообщение об ошибке, а вот сообщение о том, что проблема решена.
    "Problem has been resolved: at 06:27:55 on 2019.12.27.
    Problem name: Zabbix agent on myserver is unreachable for 5 minutes
    Host: myserver.
    Severity: Average.
    Original event ID: 23873868
    ".
    Обратите внимание на время - проблема была решена раньше ,чем возникла, как это?
    Можно было конечно грешить на эксченьдж, но если я действительно останавливаю агента руками, то в сообщениях всё верно, именно так, как настроено, т.е., если нет данных в течении 5 минут, то приходит сообщение о том, что нет данных за последние пять минут. Запускаешь его руками и через минуту, как и настроен опрос, приходит сообщение о том, что проблема решена. А если смотреть на вебморде в журнал действий, то там время событий, совсем другое проблема возникла "27.12.2019 06:32:19", была решена "27.12.2019 06:32:19", опять же ерунда получается.
    Другие события, не касающиеся агента, отрабатывают без ошибок.
    Подскажите куда смотреть.
    ЗЫ: Я в zabbix совсем зелёный, так что если нужны какие-то логи, конфиги и т.д., подскажите что и откуда дать, я всё предоставлю.
    Спасибо.
  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3404

    #2
    1) убедиться, что время в сети синхронизировано: по крайней мере, нет разбегания в несколько минут между машиной, на которой крутится Zabbix-сервер, и остальными машинами, где установлены агенты.
    2) в случае агентов под Windows убедиться, что они более-менее современные: в старых версиях была проблема с тем, что отдаваемое агентом время постепенно начинало отставать от таймера, которым пользуется операционка. Краткосрочно проблема решалась рестартом агента, кардинально - его обновлением (как минимум, до версии 4.0.4).
    3) используется ли в вашей конфигурации Zabbix-прокси?

    Comment

    • pstbin
      Junior Member
      • Dec 2019
      • 20

      #3
      1) Синхронизацией времени рулит контроллер домена, я перепроверил самостоятельно, время одинаковое;
      2) Версия агента на виндовом сервере, с которого я как раз и сдёр ошибку - 4.4.1, на линуксовых 4.4.4;
      3) Да, прокси используется.

      Comment

      • Kos
        Senior Member
        Zabbix Certified SpecialistZabbix Certified Professional
        • Aug 2015
        • 3404

        #4
        Originally posted by pstbin
        3) Да, прокси используется.
        В таком случае нужно убедиться в том, что синхронизация данных между Zabbix-прокси и Zabbix-сервером происходит заведомо чаще, чем раз в пять минут. По идеологии Zabbix-прокси самостоятельно общается с агентами, а затем собранные данные периодически пересылает на Zabbix-сервер "пачками". Настраивается, вроде бы, чуть по-разному в зависимости от режима работы прокси (активный или пассивный), сейчас точно не помню; но факт - что прокси не обязан пересылать все данные сразу же, а может их на какое-то время у себя буферизировать. Вот это время и нужно перепроверить в настройках (и сделать синхронизацию, скажем, раз в минуту).

        Comment

        • pstbin
          Junior Member
          • Dec 2019
          • 20

          #5
          Originally posted by Kos
          Вот это время и нужно перепроверить в настройках (и сделать синхронизацию, скажем, раз в минуту).
          А можно пожалуйста поподробнее где это можно настроить?
          В настройках прокси, на веморде, можно настроить только: "имя; режим "актив/пассив"; IP-адрес; DNS-имя; выбрать способ подключения "IP/DNS"; указать порт. В дополнительной вкладе "Шифрование", можно выбрать только вид шифрования соответственно.

          Comment

          • Kos
            Senior Member
            Zabbix Certified SpecialistZabbix Certified Professional
            • Aug 2015
            • 3404

            #6
            Да, на стороне Zabbix-сервера можно через веб-интерфейс увидеть, по сути, только режим (активный/пассивный) (должно совпадать с настройками на самом прокси).
            А вот со стороны прокси-сервера всё лежит в конфиг-файле (обычно с именем zabbix_proxy.conf).
            Интересующий в данном случае параметр для активного прокси - DataSenderFrequency. Вот что происходит с пассивным прокси, к сожалению, не помню. А нет, нашёл: для пассивных прокси это определяется на стороне сервера параметром в кофиг-файле Zabbix-сервера (обычно: zabbix_server.conf), имя параметра: ProxyDataFrequency.

            Comment

            • pstbin
              Junior Member
              • Dec 2019
              • 20

              #7
              ### Option: ProxyDataFrequency
              #<----->How often Zabbix Server requests history data from a Zabbix Proxy in seconds.
              #<----->This parameter is used only for proxies in the passive mode.
              #
              # Mandatory: no
              # Range: 1-3600
              # Default:
              # ProxyDataFrequency=1

              Всё стоит по умолчанию, что нужно добавить?
              По-идее это же 1 секунда

              Comment

              • pstbin
                Junior Member
                • Dec 2019
                • 20

                #8
                Вот, кстати, свежее поступление:
                "Problem started: at 14:53:11 on 2019.12.27.
                Problem name: Zabbix agent on
                myserver is unreachable for 5 minutes
                Host:
                myserver.
                Severity: Average
                Original event ID: 24056247
                "

                "Problem has been resolved: at 14:48:55 on 2019.12.27.
                Problem name: Zabbix agent on
                myserver is unreachable for 5 minutes
                Host:
                myserver.
                Severity: Average.
                Original event ID: 24056247
                "

                Причём только с одного виндового сервера. Линуховые молчат.

                Включил расширенный лог агента, думал может он что-то прояснит. Вот выборка за указанное время:
                "2780:20191227:144850.947 End of collect_perfstat()
                2780:20191227:144851.952 In collect_perfstat()
                2780:20191227:144851.953 End of collect_perfstat()
                2780:20191227:144852.957 In collect_perfstat()
                2780:20191227:144852.959 End of collect_perfstat()
                2780:20191227:144853.968 In collect_perfstat()
                2780:20191227:144853.970 End of collect_perfstat()
                2780:20191227:144854.976 In collect_perfstat()
                2780:20191227:144854.978 End of collect_perfstat()
                2780:20191227:144855.993 In collect_perfstat()
                2780:20191227:144855.994 End of collect_perfstat()
                2780:20191227:144857.007 In collect_perfstat()
                2780:20191227:144857.009 End of collect_perfstat()
                2780:20191227:144858.017 In collect_perfstat()
                2780:20191227:144858.018 End of collect_perfstat()
                2788:20191227:144858.886 Requested [agent.ping]
                2788:20191227:144858.887 Sending back [1]
                2780:20191227:144859.024 In collect_perfstat()
                2780:20191227:144859.026 End of collect_perfstat()
                2780:20191227:144900.034 In collect_perfstat()
                2780:20191227:144900.036 End of collect_perfstat()
                2780:20191227:144901.038 In collect_perfstat()
                2780:20191227:144901.039 End of collect_perfstat()
                2780:20191227:144902.053 In collect_perfstat()
                2780:20191227:144902.055 End of collect_perfstat()
                2780:20191227:144903.057 In collect_perfstat()
                2780:20191227:144903.058 End of collect_perfstat()
                2780:20191227:144904.072 In collect_perfstat()
                2780:20191227:144904.074 End of collect_perfstat()
                2780:20191227:144905.084 In collect_perfstat()
                2780:20191227:144905.085 End of collect_perfstat()
                2780:20191227:144906.097 In collect_perfstat()
                2780:20191227:144906.099 End of collect_perfstat()
                2780:20191227:144907.112 In collect_perfstat()
                2780:20191227:144907.114 End of collect_perfstat()
                2780:20191227:144908.119 In collect_perfstat()
                2780:20191227:144908.120 End of collect_perfstat()
                2780:20191227:144909.134 In collect_perfstat()
                2780:20191227:144909.136 End of collect_perfstat()
                2780:20191227:144910.152 In collect_perfstat()
                2780:20191227:144910.154 End of collect_perfstat()
                2780:20191227:144911.160 In collect_perfstat()
                2780:20191227:144911.162 End of collect_perfstat()
                2780:20191227:144912.176 In collect_perfstat()
                2780:20191227:144912.178 End of collect_perfstat()
                2780:20191227:144913.184 In collect_perfstat()
                2780:20191227:144913.185 End of collect_perfstat()
                2780:20191227:144914.197 In collect_perfstat()
                2780:20191227:144914.198 End of collect_perfstat()
                2780:20191227:144915.209 In collect_perfstat()
                2780:20191227:144915.210 End of collect_perfstat()
                2780:20191227:144916.225 In collect_perfstat()
                2780:20191227:144916.226 End of collect_perfstat()
                2780:20191227:144917.230 In collect_perfstat()
                2780:20191227:144917.231 End of collect_perfstat()
                2780:20191227:144918.233 In collect_perfstat()
                2780:20191227:144918.235 End of collect_perfstat()
                2780:20191227:144919.243 In collect_perfstat()
                2780:20191227:144919.244 End of collect_perfstat()
                2780:20191227:144920.251 In collect_perfstat()
                2780:20191227:144920.253 End of collect_perfstat()
                2780:20191227:144921.263 In collect_perfstat()
                2780:20191227:144921.265 End of collect_perfstat()
                2780:20191227:144922.278 In collect_perfstat()
                2780:20191227:144922.280 End of collect_perfstat()
                2780:20191227:144923.287 In collect_perfstat()
                2780:20191227:144923.288 End of collect_perfstat()
                2780:20191227:144924.295 In collect_perfstat()
                2780:20191227:144924.296 End of collect_perfstat()
                2780:20191227:144925.311 In collect_perfstat()
                2780:20191227:144925.313 End of collect_perfstat()
                2780:20191227:144926.321 In collect_perfstat()
                2780:20191227:144926.322 End of collect_perfstat()
                2780:20191227:144927.326 In collect_perfstat()
                2780:20191227:144927.328 End of collect_perfstat()
                2780:20191227:144928.343 In collect_perfstat()
                2780:20191227:144928.345 End of collect_perfstat()
                2780:20191227:144929.361 In collect_perfstat()
                2780:20191227:144929.363 End of collect_perfstat()
                2780:20191227:144930.365 In collect_perfstat()
                2780:20191227:144930.367 End of collect_perfstat()
                2780:20191227:144931.371 In collect_perfstat()
                2780:20191227:144931.373 End of collect_perfstat()
                2780:20191227:144932.374 In collect_perfstat()
                2780:20191227:144932.376 End of collect_perfstat()
                2780:20191227:144933.380 In collect_perfstat()
                2780:20191227:144933.382 End of collect_perfstat()
                2780:20191227:144934.387 In collect_perfstat()
                2780:20191227:144934.388 End of collect_perfstat()
                2780:20191227:144935.401 In collect_perfstat()
                2780:20191227:144935.403 End of collect_perfstat()
                2780:20191227:144936.416 In collect_perfstat()
                2780:20191227:144936.418 End of collect_perfstat()
                2780:20191227:144937.430 In collect_perfstat()
                2780:20191227:144937.432 End of collect_perfstat()
                2780:20191227:144938.446 In collect_perfstat()
                2780:20191227:144938.447 End of collect_perfstat()
                2780:20191227:144939.451 In collect_perfstat()
                2780:20191227:144939.453 End of collect_perfstat()
                2780:20191227:144940.468 In collect_perfstat()
                2780:20191227:144940.470 End of collect_perfstat()
                2780:20191227:144941.480 In collect_perfstat()
                2780:20191227:144941.482 End of collect_perfstat()
                2780:20191227:144942.498 In collect_perfstat()
                2780:20191227:144942.500 End of collect_perfstat()
                2780:20191227:144943.514 In collect_perfstat()
                2780:20191227:144943.516 End of collect_perfstat()
                2780:20191227:144944.522 In collect_perfstat()
                2780:20191227:144944.524 End of collect_perfstat()
                2780:20191227:144945.528 In collect_perfstat()
                2780:20191227:144945.530 End of collect_perfstat()
                2780:20191227:144946.535 In collect_perfstat()
                2780:20191227:144946.537 End of collect_perfstat()
                2780:20191227:144947.551 In collect_perfstat()
                2780:20191227:144947.553 End of collect_perfstat()
                2780:20191227:144948.557 In collect_perfstat()
                2780:20191227:144948.559 End of collect_perfstat()
                2780:20191227:144949.573 In collect_perfstat()
                2780:20191227:144949.574 End of collect_perfstat()
                2780:20191227:144950.582 In collect_perfstat()
                2780:20191227:144950.584 End of collect_perfstat()
                2780:20191227:144951.593 In collect_perfstat()
                2780:20191227:144951.594 End of collect_perfstat()
                2780:20191227:144952.606 In collect_perfstat()
                2780:20191227:144952.608 End of collect_perfstat()
                2780:20191227:144953.615 In collect_perfstat()
                2780:20191227:144953.617 End of collect_perfstat()
                2780:20191227:144954.625 In collect_perfstat()
                2780:20191227:144954.627 End of collect_perfstat()
                2780:20191227:144955.639 In collect_perfstat()
                2780:20191227:144955.641 End of collect_perfstat()
                2780:20191227:144956.643 In collect_perfstat()
                2780:20191227:144956.645 End of collect_perfstat()
                2780:20191227:144957.660 In collect_perfstat()
                2780:20191227:144957.662 End of collect_perfstat()
                2780:20191227:144958.671 In collect_perfstat()
                2780:20191227:144958.673 End of collect_perfstat()
                2792:20191227:144959.251 Requested [agent.ping]
                2792:20191227:144959.252 Sending back [1]
                2780:20191227:144959.680 In collect_perfstat()
                2780:20191227:144959.682 End of collect_perfstat()
                2780:20191227:145000.684 In collect_perfstat()
                2780:20191227:145000.685 End of collect_perfstat()
                2780:20191227:145001.700 In collect_perfstat()
                2780:20191227:145001.701 End of collect_perfstat()
                2780:20191227:145002.715 In collect_perfstat()
                2780:20191227:145002.717 End of collect_perfstat()
                2780:20191227:145003.720 In collect_perfstat()
                2780:20191227:145003.722 End of collect_perfstat()
                2780:20191227:145004.730 In collect_perfstat()
                2780:20191227:145004.731 End of collect_perfstat()
                2780:20191227:145005.733 In collect_perfstat()
                2780:20191227:145005.735 End of collect_perfstat()
                2780:20191227:145006.741 In collect_perfstat()
                2780:20191227:145006.743 End of collect_perfstat()
                2780:20191227:145007.758 In collect_perfstat()
                2780:20191227:145007.762 End of collect_perfstat()
                2780:20191227:145008.766 In collect_perfstat()
                2780:20191227:145008.767 End of collect_perfstat()
                2780:20191227:145009.782 In collect_perfstat()
                2780:20191227:145009.783 End of collect_perfstat()
                2780:20191227:145010.799 In collect_perfstat()
                2780:20191227:145010.801 End of collect_perfstat()
                2780:20191227:145011.815 In collect_perfstat()
                2780:20191227:145011.817 End of collect_perfstat()
                2780:20191227:145012.831 In collect_perfstat()
                2780:20191227:145012.832 End of collect_perfstat()
                2780:20191227:145013.848 In collect_perfstat()
                2780:20191227:145013.849 End of collect_perfstat()
                2780:20191227:145014.861 In collect_perfstat()
                2780:20191227:145014.862 End of collect_perfstat()
                2780:20191227:145015.871 In collect_perfstat()
                2780:20191227:145015.873 End of collect_perfstat()
                2780:20191227:145016.889 In collect_perfstat()
                2780:20191227:145016.890 End of collect_perfstat()
                2780:20191227:145017.902 In collect_perfstat()
                2780:20191227:145017.904 End of collect_perfstat()
                2780:20191227:145018.910 In collect_perfstat()
                2780:20191227:145018.912 End of collect_perfstat()
                2780:20191227:145019.913 In collect_perfstat()
                2780:20191227:145019.915 End of collect_perfstat()
                2780:20191227:145020.923 In collect_perfstat()
                2780:20191227:145020.925 End of collect_perfstat()
                2780:20191227:145021.929 In collect_perfstat()
                2780:20191227:145021.931 End of collect_perfstat()
                2780:20191227:145022.942 In collect_perfstat()
                2780:20191227:145022.944 End of collect_perfstat()
                2780:20191227:145023.954 In collect_perfstat()
                2780:20191227:145023.955 End of collect_perfstat()
                2780:20191227:145024.959 In collect_perfstat()
                2780:20191227:145024.961 End of collect_perfstat()
                2780:20191227:145025.977 In collect_perfstat()
                2780:20191227:145025.978 End of collect_perfstat()
                2780:20191227:145026.995 In collect_perfstat()
                2780:20191227:145026.996 End of collect_perfstat()
                2780:20191227:145028.001 In collect_perfstat()
                2780:20191227:145028.003 End of collect_perfstat()
                2780:20191227:145029.010 In collect_perfstat()
                2780:20191227:145029.012 End of collect_perfstat()
                2780:20191227:145030.024 In collect_perfstat()
                2780:20191227:145030.025 End of collect_perfstat()
                2780:20191227:145031.027 In collect_perfstat()
                2780:20191227:145031.029 End of collect_perfstat()
                2780:20191227:145032.033 In collect_perfstat()
                2780:20191227:145032.035 End of collect_perfstat()
                2780:20191227:145033.044 In collect_perfstat()
                2780:20191227:145033.045 End of collect_perfstat()
                2780:20191227:145034.048 In collect_perfstat()
                2780:20191227:145034.050 End of collect_perfstat()
                2780:20191227:145035.061 In collect_perfstat()
                2780:20191227:145035.063 End of collect_perfstat()
                2780:20191227:145036.078 In collect_perfstat()
                2780:20191227:145036.079 End of collect_perfstat()
                2780:20191227:145037.081 In collect_perfstat()
                2780:20191227:145037.083 End of collect_perfstat()
                2780:20191227:145038.086 In collect_perfstat()
                2780:20191227:145038.088 End of collect_perfstat()
                2780:20191227:145039.090 In collect_perfstat()
                2780:20191227:145039.092 End of collect_perfstat()
                2780:20191227:145040.103 In collect_perfstat()
                2780:20191227:145040.105 End of collect_perfstat()
                2780:20191227:145041.105 In collect_perfstat()
                2780:20191227:145041.107 End of collect_perfstat()
                2780:20191227:145042.123 In collect_perfstat()
                2780:20191227:145042.124 End of collect_perfstat()
                2780:20191227:145043.138 In collect_perfstat()
                2780:20191227:145043.140 End of collect_perfstat()
                2780:20191227:145044.154 In collect_perfstat()
                2780:20191227:145044.155 End of collect_perfstat()
                2780:20191227:145045.162 In collect_perfstat()
                2780:20191227:145045.164 End of collect_perfstat()
                2780:20191227:145046.177 In collect_perfstat()
                2780:20191227:145046.179 End of collect_perfstat()
                2780:20191227:145047.193 In collect_perfstat()
                2780:20191227:145047.194 End of collect_perfstat()
                2780:20191227:145048.208 In collect_perfstat()
                2780:20191227:145048.210 End of collect_perfstat()
                2780:20191227:145049.224 In collect_perfstat()
                2780:20191227:145049.226 End of collect_perfstat()
                2780:20191227:145050.240 In collect_perfstat()
                2780:20191227:145050.241 End of collect_perfstat()
                2780:20191227:145051.243 In collect_perfstat()
                2780:20191227:145051.245 End of collect_perfstat()
                2780:20191227:145052.259 In collect_perfstat()
                2780:20191227:145052.261 End of collect_perfstat()
                2780:20191227:145053.274 In collect_perfstat()
                2780:20191227:145053.276 End of collect_perfstat()
                2780:20191227:145054.290 In collect_perfstat()
                2780:20191227:145054.292 End of collect_perfstat()
                2780:20191227:145055.306 In collect_perfstat()
                2780:20191227:145055.307 End of collect_perfstat()
                2780:20191227:145056.321 In collect_perfstat()
                2780:20191227:145056.323 End of collect_perfstat()
                2780:20191227:145057.337 In collect_perfstat()
                2780:20191227:145057.339 End of collect_perfstat()
                2780:20191227:145058.353 In collect_perfstat()
                2780:20191227:145058.355 End of collect_perfstat()
                2784:20191227:145058.702 Requested [agent.ping]
                2784:20191227:145058.703 Sending back [1]
                2780:20191227:145059.368 In collect_perfstat()
                2780:20191227:145059.370 End of collect_perfstat()
                2780:20191227:145100.384 In collect_perfstat()
                2780:20191227:145100.386 End of collect_perfstat()
                2780:20191227:145101.399 In collect_perfstat()
                2780:20191227:145101.401 End of collect_perfstat()
                2780:20191227:145102.417 In collect_perfstat()
                2780:20191227:145102.419 End of collect_perfstat()
                2780:20191227:145103.431 In collect_perfstat()
                2780:20191227:145103.433 End of collect_perfstat()
                2780:20191227:145104.446 In collect_perfstat()
                2780:20191227:145104.448 End of collect_perfstat()
                2780:20191227:145105.462 In collect_perfstat()
                2780:20191227:145105.464 End of collect_perfstat()
                2780:20191227:145106.478 In collect_perfstat()
                2780:20191227:145106.480 End of collect_perfstat()
                2780:20191227:145107.493 In collect_perfstat()
                2780:20191227:145107.495 End of collect_perfstat()
                2780:20191227:145108.501 In collect_perfstat()
                2780:20191227:145108.503 End of collect_perfstat()
                2780:20191227:145109.508 In collect_perfstat()
                2780:20191227:145109.510 End of collect_perfstat()
                2780:20191227:145110.523 In collect_perfstat()
                2780:20191227:145110.525 End of collect_perfstat()
                2780:20191227:145111.539 In collect_perfstat()
                2780:20191227:145111.540 End of collect_perfstat()
                2780:20191227:145112.554 In collect_perfstat()
                2780:20191227:145112.556 End of collect_perfstat()
                2780:20191227:145113.571 In collect_perfstat()
                2780:20191227:145113.572 End of collect_perfstat()
                2780:20191227:145114.586 In collect_perfstat()
                2780:20191227:145114.587 End of collect_perfstat()
                2780:20191227:145115.601 In collect_perfstat()
                2780:20191227:145115.603 End of collect_perfstat()
                2780:20191227:145116.617 In collect_perfstat()
                2780:20191227:145116.619 End of collect_perfstat()
                2780:20191227:145117.633 In collect_perfstat()
                2780:20191227:145117.634 End of collect_perfstat()
                2780:20191227:145118.637 In collect_perfstat()
                2780:20191227:145118.639 End of collect_perfstat()
                2780:20191227:145119.653 In collect_perfstat()
                2780:20191227:145119.654 End of collect_perfstat()
                2780:20191227:145120.662 In collect_perfstat()
                2780:20191227:145120.664 End of collect_perfstat()
                2780:20191227:145121.671 In collect_perfstat()
                2780:20191227:145121.673 End of collect_perfstat()
                2780:20191227:145122.687 In collect_perfstat()
                2780:20191227:145122.688 End of collect_perfstat()
                2780:20191227:145123.690 In collect_perfstat()
                2780:20191227:145123.692 End of collect_perfstat()
                2780:20191227:145124.699 In collect_perfstat()
                2780:20191227:145124.701 End of collect_perfstat()
                2780:20191227:145125.705 In collect_perfstat()
                2780:20191227:145125.706 End of collect_perfstat()
                2780:20191227:145126.717 In collect_perfstat()
                2780:20191227:145126.718 End of collect_perfstat()
                2780:20191227:145127.727 In collect_perfstat()
                2780:20191227:145127.728 End of collect_perfstat()
                2780:20191227:145128.735 In collect_perfstat()
                2780:20191227:145128.736 End of collect_perfstat()
                2780:20191227:145129.750 In collect_perfstat()
                2780:20191227:145129.752 End of collect_perfstat()
                2780:20191227:145130.766 In collect_perfstat()
                2780:20191227:145130.768 End of collect_perfstat()
                2780:20191227:145131.781 In collect_perfstat()
                2780:20191227:145131.782 End of collect_perfstat()
                2780:20191227:145132.793 In collect_perfstat()
                2780:20191227:145132.794 End of collect_perfstat()
                2780:20191227:145133.800 In collect_perfstat()
                2780:20191227:145133.802 End of collect_perfstat()
                2780:20191227:145134.817 In collect_perfstat()
                2780:20191227:145134.819 End of collect_perfstat()
                2780:20191227:145135.826 In collect_perfstat()
                2780:20191227:145135.827 End of collect_perfstat()
                2780:20191227:145136.841 In collect_perfstat()
                2780:20191227:145136.843 End of collect_perfstat()
                2780:20191227:145137.858 In collect_perfstat()
                2780:20191227:145137.859 End of collect_perfstat()
                2780:20191227:145138.873 In collect_perfstat()
                2780:20191227:145138.875 End of collect_perfstat()
                2780:20191227:145139.876 In collect_perfstat()
                2780:20191227:145139.877 End of collect_perfstat()
                2780:20191227:145140.892 In collect_perfstat()
                2780:20191227:145140.893 End of collect_perfstat()
                2780:20191227:145141.900 In collect_perfstat()
                2780:20191227:145141.901 End of collect_perfstat()
                2780:20191227:145142.907 In collect_perfstat()
                2780:20191227:145142.909 End of collect_perfstat()
                2780:20191227:145143.913 In collect_perfstat()
                2780:20191227:145143.914 End of collect_perfstat()
                2780:20191227:145144.921 In collect_perfstat()
                2780:20191227:145144.922 End of collect_perfstat()
                2780:20191227:145145.937 In collect_perfstat()
                2780:20191227:145145.939 End of collect_perfstat()
                2780:20191227:145146.947 In collect_perfstat()
                2780:20191227:145146.948 End of collect_perfstat()
                2780:20191227:145147.956 In collect_perfstat()
                2780:20191227:145147.958 End of collect_perfstat()
                2780:20191227:145148.973 In collect_perfstat()
                2780:20191227:145148.974 End of collect_perfstat()
                2780:20191227:145149.988 In collect_perfstat()
                2780:20191227:145149.990 End of collect_perfstat()
                2780:20191227:145150.997 In collect_perfstat()
                2780:20191227:145150.998 End of collect_perfstat()
                2780:20191227:145152.014 In collect_perfstat()
                2780:20191227:145152.015 End of collect_perfstat()
                2780:20191227:145153.021 In collect_perfstat()
                2780:20191227:145153.022 End of collect_perfstat()
                2780:20191227:145154.036 In collect_perfstat()
                2780:20191227:145154.038 End of collect_perfstat()
                2780:20191227:145155.052 In collect_perfstat()
                2780:20191227:145155.054 End of collect_perfstat()
                2780:20191227:145156.058 In collect_perfstat()
                2780:20191227:145156.059 End of collect_perfstat()
                2780:20191227:145157.074 In collect_perfstat()
                2780:20191227:145157.076 End of collect_perfstat()
                2780:20191227:145158.090 In collect_perfstat()
                2780:20191227:145158.091 End of collect_perfstat()
                2788:20191227:145158.540 Requested [agent.ping]
                2788:20191227:145158.541 Sending back [1]
                2780:20191227:145159.103 In collect_perfstat()
                2780:20191227:145159.105 End of collect_perfstat()
                2780:20191227:145200.110 In collect_perfstat()
                2780:20191227:145200.112 End of collect_perfstat()
                2780:20191227:145201.115 In collect_perfstat()
                2780:20191227:145201.117 End of collect_perfstat()
                2780:20191227:145202.121 In collect_perfstat()
                2780:20191227:145202.122 End of collect_perfstat()
                2780:20191227:145203.133 In collect_perfstat()
                2780:20191227:145203.135 End of collect_perfstat()
                2780:20191227:145204.139 In collect_perfstat()
                2780:20191227:145204.140 End of collect_perfstat()
                2780:20191227:145205.154 In collect_perfstat()
                2780:20191227:145205.156 End of collect_perfstat()
                2780:20191227:145206.165 In collect_perfstat()
                2780:20191227:145206.167 End of collect_perfstat()
                2780:20191227:145207.181 In collect_perfstat()
                2780:20191227:145207.183 End of collect_perfstat()
                2780:20191227:145208.185 In collect_perfstat()
                2780:20191227:145208.187 End of collect_perfstat()
                2780:20191227:145209.190 In collect_perfstat()
                2780:20191227:145209.192 End of collect_perfstat()
                2780:20191227:145210.206 In collect_perfstat()
                2780:20191227:145210.207 End of collect_perfstat()
                2780:20191227:145211.213 In collect_perfstat()
                2780:20191227:145211.215 End of collect_perfstat()
                2780:20191227:145212.223 In collect_perfstat()
                2780:20191227:145212.224 End of collect_perfstat()
                2780:20191227:145213.227 In collect_perfstat()
                2780:20191227:145213.229 End of collect_perfstat()
                2780:20191227:145214.243 In collect_perfstat()
                2780:20191227:145214.245 End of collect_perfstat()
                2780:20191227:145215.261 In collect_perfstat()
                2780:20191227:145215.263 End of collect_perfstat()
                2780:20191227:145216.266 In collect_perfstat()
                2780:20191227:145216.267 End of collect_perfstat()
                2780:20191227:145217.275 In collect_perfstat()
                2780:20191227:145217.277 End of collect_perfstat()
                2780:20191227:145218.283 In collect_perfstat()
                2780:20191227:145218.285 End of collect_perfstat()
                2780:20191227:145219.300 In collect_perfstat()
                2780:20191227:145219.302 End of collect_perfstat()
                2780:20191227:145220.312 In collect_perfstat()
                2780:20191227:145220.314 End of collect_perfstat()
                2780:20191227:145221.328 In collect_perfstat()
                2780:20191227:145221.329 End of collect_perfstat()
                2780:20191227:145222.334 In collect_perfstat()
                2780:20191227:145222.336 End of collect_perfstat()
                2780:20191227:145223.346 In collect_perfstat()
                2780:20191227:145223.348 End of collect_perfstat()
                2780:20191227:145224.349 In collect_perfstat()
                2780:20191227:145224.350 End of collect_perfstat()
                2780:20191227:145225.364 In collect_perfstat()
                2780:20191227:145225.367 End of collect_perfstat()
                2780:20191227:145226.380 In collect_perfstat()
                2780:20191227:145226.382 End of collect_perfstat()
                2780:20191227:145227.383 In collect_perfstat()
                2780:20191227:145227.385 End of collect_perfstat()
                2780:20191227:145228.396 In collect_perfstat()
                2780:20191227:145228.397 End of collect_perfstat()
                2780:20191227:145229.401 In collect_perfstat()
                2780:20191227:145229.403 End of collect_perfstat()
                2780:20191227:145230.414 In collect_perfstat()
                2780:20191227:145230.415 End of collect_perfstat()
                2780:20191227:145231.426 In collect_perfstat()
                2780:20191227:145231.428 End of collect_perfstat()
                2780:20191227:145232.433 In collect_perfstat()
                2780:20191227:145232.434 End of collect_perfstat()
                2780:20191227:145233.449 In collect_perfstat()
                2780:20191227:145233.451 End of collect_perfstat()
                2780:20191227:145234.466 In collect_perfstat()
                2780:20191227:145234.468 End of collect_perfstat()
                2780:20191227:145235.481 In collect_perfstat()
                2780:20191227:145235.483 End of collect_perfstat()
                2780:20191227:145236.497 In collect_perfstat()
                2780:20191227:145236.499 End of collect_perfstat()
                2780:20191227:145237.514 In collect_perfstat()
                2780:20191227:145237.516 End of collect_perfstat()
                2780:20191227:145238.527 In collect_perfstat()
                2780:20191227:145238.529 End of collect_perfstat()
                2780:20191227:145239.541 In collect_perfstat()
                2780:20191227:145239.543 End of collect_perfstat()
                2780:20191227:145240.558 In collect_perfstat()
                2780:20191227:145240.559 End of collect_perfstat()
                2780:20191227:145241.561 In collect_perfstat()
                2780:20191227:145241.562 End of collect_perfstat()
                2780:20191227:145242.572 In collect_perfstat()
                2780:20191227:145242.574 End of collect_perfstat()
                2780:20191227:145243.589 In collect_perfstat()
                2780:20191227:145243.591 End of collect_perfstat()
                2780:20191227:145244.606 In collect_perfstat()
                2780:20191227:145244.608 End of collect_perfstat()
                2780:20191227:145245.621 In collect_perfstat()
                2780:20191227:145245.623 End of collect_perfstat()
                2780:20191227:145246.631 In collect_perfstat()
                2780:20191227:145246.632 End of collect_perfstat()
                2780:20191227:145247.646 In collect_perfstat()
                2780:20191227:145247.648 End of collect_perfstat()
                2780:20191227:145248.649 In collect_perfstat()
                2780:20191227:145248.651 End of collect_perfstat()
                2780:20191227:145249.653 In collect_perfstat()
                2780:20191227:145249.654 End of collect_perfstat()
                2780:20191227:145250.659 In collect_perfstat()
                2780:20191227:145250.661 End of collect_perfstat()
                2780:20191227:145251.675 In collect_perfstat()
                2780:20191227:145251.676 End of collect_perfstat()
                2780:20191227:145252.686 In collect_perfstat()
                2780:20191227:145252.687 End of collect_perfstat()
                2780:20191227:145253.702 In collect_perfstat()
                2780:20191227:145253.704 End of collect_perfstat()
                2780:20191227:145254.718 In collect_perfstat()
                2780:20191227:145254.720 End of collect_perfstat()
                2780:20191227:145255.734 In collect_perfstat()
                2780:20191227:145255.736 End of collect_perfstat()
                2780:20191227:145256.742 In collect_perfstat()
                2780:20191227:145256.744 End of collect_perfstat()
                2780:20191227:145257.755 In collect_perfstat()
                2780:20191227:145257.756 End of collect_perfstat()
                2780:20191227:145258.762 In collect_perfstat()
                2780:20191227:145258.763 End of collect_perfstat()
                2792:20191227:145258.899 Requested [agent.ping]
                2792:20191227:145258.899 Sending back [1]
                2780:20191227:145259.768 In collect_perfstat()
                2780:20191227:145259.770 End of collect_perfstat()
                2780:20191227:145300.778 In collect_perfstat()
                2780:20191227:145300.780 End of collect_perfstat()
                2780:20191227:145301.793 In collect_perfstat()
                2780:20191227:145301.795 End of collect_perfstat()
                2780:20191227:145302.804 In collect_perfstat()
                2780:20191227:145302.806 End of collect_perfstat()
                2780:20191227:145303.820 In collect_perfstat()
                2780:20191227:145303.822 End of collect_perfstat()
                2780:20191227:145304.838 In collect_perfstat()
                2780:20191227:145304.839 End of collect_perfstat()
                2780:20191227:145305.855 In collect_perfstat()
                2780:20191227:145305.857 End of collect_perfstat()
                2780:20191227:145306.871 In collect_perfstat()
                2780:20191227:145306.873 End of collect_perfstat()
                2780:20191227:145307.875 In collect_perfstat()
                2780:20191227:145307.877 End of collect_perfstat()
                2780:20191227:145308.881 In collect_perfstat()
                2780:20191227:145308.883 End of collect_perfstat()
                2780:20191227:145309.897 In collect_perfstat()
                2780:20191227:145309.899 End of collect_perfstat()
                2780:20191227:145310.900 In collect_perfstat()
                2780:20191227:145310.902 End of collect_perfstat()
                2780:20191227:145311.916 In collect_perfstat()
                2780:20191227:145311.918 End of collect_perfstat()
                2780:20191227:145312.922 In collect_perfstat()
                2780:20191227:145312.924 End of collect_perfstat()
                2780:20191227:145313.940 In collect_perfstat()
                2780:20191227:145313.942 End of collect_perfstat()
                2780:20191227:145314.958 In collect_perfstat()
                2780:20191227:145314.960 End of collect_perfstat()
                2780:20191227:145315.974 In collect_perfstat()
                2780:20191227:145315.976 End of collect_perfstat()
                2780:20191227:145316.990 In collect_perfstat()
                2780:20191227:145316.992 End of collect_perfstat()
                2780:20191227:145318.006 In collect_perfstat()
                2780:20191227:145318.007 End of collect_perfstat()
                2780:20191227:145319.020 In collect_perfstat()
                2780:20191227:145319.022 End of collect_perfstat()
                2780:20191227:145320.028 In collect_perfstat()
                2780:20191227:145320.029 End of collect_perfstat()
                2780:20191227:145321.036 In collect_perfstat()
                2780:20191227:145321.038 End of collect_perfstat()
                2780:20191227:145322.051 In collect_perfstat()
                2780:20191227:145322.053 End of collect_perfstat()
                2780:20191227:145323.059 In collect_perfstat()
                2780:20191227:145323.060 End of collect_perfstat()
                2780:20191227:145324.074 In collect_perfstat()
                2780:20191227:145324.076 End of collect_perfstat()
                2780:20191227:145325.079 In collect_perfstat()
                2780:20191227:145325.081 End of collect_perfstat()"
                Last edited by pstbin; 27-12-2019, 15:01.

                Comment

                • pstbin
                  Junior Member
                  • Dec 2019
                  • 20

                  #9
                  А вот в логе сервера, я нашёл следующее: "1351:20191227:144855.325 sending configuration data to proxy "zabproxy7" at "zabproxy7", datalen 331193" - это как раз соответствует времени "решения проблемы", а "zabproxy7" - это именно тот прокси, который обрабатывает сервер, о котором я пишу.

                  Comment

                  • Kos
                    Senior Member
                    Zabbix Certified SpecialistZabbix Certified Professional
                    • Aug 2015
                    • 3404

                    #10
                    Ну, в логе агента видно только то, что за указанные почти 5 минут он ни с кем не общался, за исключением ответов на запросы метрики agent.ping, которые он спокойно отдавал обратно с интервалом раз в минуту. Немного смущает, что я не вижу записей о том, откуда именно приходят запросы (мне казалось, что IP-адрес тоже указывался в логе), но, возможно, я неправильно помню, либо в новых версиях агента что-то в этом отношении поменялось.

                    Подозреваю, что триггер "Zabbix agent on myserver is unreachable for 5 minutes" срабатывает на непоступление данных именно по этой метрике. Если так, то надо смотреть логи прокси (возможно, повысить уровень логов на нём), чтобы смотреть, когда и как эти данные пересылаются дальше на Zabbix-сервер.

                    Я правильно понял, что прокси ведь работает в пассивном режиме?

                    Comment

                    • Kos
                      Senior Member
                      Zabbix Certified SpecialistZabbix Certified Professional
                      • Aug 2015
                      • 3404

                      #11
                      Originally posted by pstbin
                      А вот в логе сервера, я нашёл следующее: "1351:20191227:144855.325 sending configuration data to proxy "zabproxy7" at "zabproxy7", datalen 331193" - это как раз соответствует времени "решения проблемы", а "zabproxy7" - это именно тот прокси, который обрабатывает сервер, о котором я пишу.
                      Нет, это обмен конфигурационными данными (что и как прокси должен мониторить), который выполняется значительно реже (обычно раз в час).
                      Вроде, не должно быть связано с исходной проблемой, если только какие-то параметры мониторинга не менялись в течение последнего часа.

                      Comment

                      • pstbin
                        Junior Member
                        • Dec 2019
                        • 20

                        #12
                        Originally posted by Kos
                        Я правильно понял, что прокси ведь работает в пассивном режиме?
                        Да, всё верно. В пассивном режиме.

                        А где смотреть прокси лог, в стандартной папке логов "/var/log/zabbix", только лог агента, сервера и java_gateway, но дата и время изменений, подходящие, только на сервер логе

                        Comment

                        • Kos
                          Senior Member
                          Zabbix Certified SpecialistZabbix Certified Professional
                          • Aug 2015
                          • 3404

                          #13
                          Originally posted by pstbin
                          А где смотреть прокси лог, в стандартной папке логов "/var/log/zabbix", только лог агента, сервера и java_gateway, но дата и время изменений, подходящие, только на сервер логе
                          На том компьютере, где запущен Zabbix-прокси. Сначала найти конфиг проксика, а в нём посмотреть ссылки на местоположение лога. Но обычно более-менее стандартно: либо в /tmp, либо где-то в /var/log или /var/log/zabbix.

                          Comment

                          • pstbin
                            Junior Member
                            • Dec 2019
                            • 20

                            #14
                            Вот лог с прокси:
                            "..........................
                            3087:20191227:062545.049 received configuration data from server at "10.20.8.5", datalen 331193
                            3088:20191227:062754.425 received configuration data from server at "10.20.8.5", datalen 331193
                            3088:20191227:063215.439 received configuration data from server at "10.20.8.5", datalen 331193
                            3086:20191227:063425.053 received configuration data from server at "10.20.8.5", datalen 331193
                            3086:20191227:063641.594 received configuration data from server at "10.20.8.5", datalen 331193
                            ...................."
                            IP-адрес, который указан в логе - это адрес сервера. Время, когда якобы "упал" агент из моего первого сообщения.

                            А вот выборка из лога касательно виндового сервера:
                            ".......................
                            3079:20191227:110559.459 Zabbix agent item "agent.ping" on host "myserver" failed: first network error, wait for 15 seconds
                            3083:20191227:110614.192 Zabbix agent item "agent.ping" on host "myserver" failed: another network error, wait for 15 seconds

                            3088:20191227:110626.192 received configuration data from server at "10.20.8.5", datalen 331193
                            3083:20191227:110629.201 resuming Zabbix agent checks on host "myserver": connection restored
                            3087:20191227:110835.681 received configuration data from server at "10.20.8.5", datalen 331193
                            3064:20191227:111034.443 executing housekeeper
                            3064:20191227:111034.524 housekeeper [deleted 68933 records in 0.077300 sec, idle for 1 hour(s)]
                            3085:20191227:111044.879 received configuration data from server at "10.20.8.5", datalen 331193
                            3088:20191227:111254.301 received configuration data from server at "10.20.8.5", datalen 331193
                            3087:20191227:111503.822 received configuration data from server at "10.20.8.5", datalen 331193
                            3087:20191227:111714.257 received configuration data from server at "10.20.8.5", datalen 331193
                            ......................"
                            Но в это время никаких сообщений не было о "падении"
                            А вот время второго "падения", о котором сообщила почта
                            "..................
                            3088:20191227:143555.656 received configuration data from server at "10.20.8.5", datalen 331193
                            3084:20191227:143805.878 received configuration data from server at "10.20.8.5", datalen 331193
                            3087:20191227:144014.840 received configuration data from server at "10.20.8.5", datalen 331193
                            3084:20191227:144224.637 received configuration data from server at "10.20.8.5", datalen 331193
                            3086:20191227:144433.969 received configuration data from server at "10.20.8.5", datalen 331193
                            3085:20191227:144642.400 received configuration data from server at "10.20.8.5", datalen 331193
                            3084:20191227:144852.563 received configuration data from server at "10.20.8.5", datalen 331193
                            3084:20191227:145311.136 received configuration data from server at "10.20.8.5", datalen 331193
                            3088:20191227:145520.995 received configuration data from server at "10.20.8.5", datalen 331193
                            ...................."

                            И вот время последнего на текущий момент "падения"
                            "..................
                            3085:20191227:154044.185 received configuration data from server at "10.20.8.5", datalen 331193
                            3085:20191227:154254.305 received configuration data from server at "10.20.8.5", datalen 331193
                            3087:20191227:154711.360 received configuration data from server at "10.20.8.5", datalen 331193
                            3086:20191227:154920.631 received configuration data from server at "10.20.8.5", datalen 331193
                            3086:20191227:155130.238 received configuration data from server at "10.20.8.5", datalen 331193
                            3088:20191227:155340.273 received configuration data from server at "10.20.8.5", datalen 331193
                            3086:20191227:155549.563 received configuration data from server at "10.20.8.5", datalen 331193
                            3085:20191227:155759.210 received configuration data from server at "10.20.8.5", datalen 331193
                            3088:20191227:160009.099 received configuration data from server at "10.20.8.5", datalen 331193
                            3087:20191227:160218.397 received configuration data from server at "10.20.8.5", datalen 331193
                            3084:20191227:160427.723 received configuration data from server at "10.20.8.5", datalen 331193
                            3086:20191227:160637.308 received configuration data from server at "10.20.8.5", datalen 331193
                            3086:20191227:160847.503 received configuration data from server at "10.20.8.5", datalen 331193
                            3064:20191227:161036.401 executing housekeeper
                            3064:20191227:161036.487 housekeeper [deleted 69013 records in 0.080134 sec, idle for 1 hour(s)]
                            3086:20191227:161056.399 received configuration data from server at "10.20.8.5", datalen 331193
                            3084:20191227:161306.057 received configuration data from server at "10.20.8.5", datalen 331193
                            3088:20191227:161514.695 received configuration data from server at "10.20.8.5", datalen 331193
                            3085:20191227:161724.291 received configuration data from server at "10.20.8.5", datalen 331193
                            3088:20191227:161934.235 received configuration data from server at "10.20.8.5", datalen 331193
                            3087:20191227:162143.476 received configuration data from server at "10.20.8.5", datalen 331193
                            3085:20191227:162353.294 received configuration data from server at "10.20.8.5", datalen 331193
                            3087:20191227:162602.813 received configuration data from server at "10.20.8.5", datalen 331193
                            КОНЕЦ ЛОГА"

                            Comment

                            • Kos
                              Senior Member
                              Zabbix Certified SpecialistZabbix Certified Professional
                              • Aug 2015
                              • 3404

                              #15
                              Насколько я понимаю, "received configuration data from server..." - это синхронизация с Zabbix-сервером именно конфигурационной информации (кого и как надо мониторить через данный Zabbix-прокси). Немного смущает интервал: около 2 минут 10 секунд (по умолчанию - час), причём иногда разница между соседними записями составляет более 4 минут.
                              Ну ладно, в этом отношении другого криминала я не вижу.

                              А вот запись "Zabbix agent item "agent.ping" on host "myserver" failed..." уже настораживает. Если верить логу на стороне агента, что в это время всё было ОК (запрос получил и на него ответил), то неясно, почему этот ответ не был получен проксиком. Впрочем, даже после двух неуспешных запросов на третий (через 30 секунд от первого) уже ответ был получен, так что триггер на 5-минутное отсутствие данных не должен был бы срабатывать.

                              Хочется видеть более подробно, как Zabbix-прокси обменивается данными с Zabbix-сервером - с какими интервалами реально пересылаются собранные данные. Не знаю, можно ли это увидеть в логах, повысив уровень логирования ещё больше. Если соединение нешифрованное, то можно пытаться ловить трафик каким-нибудь tcpdump-ом и разглядывать его потом Wireshark-ом.

                              А на агенте, с которым возникают проблемы, случайно не несколько IP-адресов? Если несколько - то имеет смысл явно в конфиге агента прописать параметр ListenIP, чтобы он случайно не отвечал не с того адреса.

                              Comment

                              Working...