Ad Widget

Collapse

ошибка ZBX_TCP_WRITE() timed out

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • Edmundo
    Junior Member
    • Oct 2022
    • 1

    #1

    ошибка ZBX_TCP_WRITE() timed out


    Всем привет!

    Поднял сервер мониторинга (версия 6.0.0), поставил агент на один сервер и сразу ошибка. Логах сервера такие записи:
    Code:
    На сервере
    56768:20221017:123938.561 Sending [perf_counter_en["\Processor(_Total)\% Privileged Time"]]
    56768:20221017:123938.561 End of get_value_agent():NETWORK_ERROR
    56768:20221017:123938.561 Item [SRV.headoffice.local:perf_counter_en["\Processor(_Total)\% Privileged Time"]] error: Get value from agent failed: ZBX_TCP_WRITE() timed out
    56768:20221017:123938.561 End of get_value():NETWORK_ERROR
    56768:20221017:123938.561 In zbx_deactivate_item_interface() interfaceid:20 itemid:43593 type:0
    56768:20221017:123938.561 Zabbix agent item "perf_counter_en["\Processor(_Total)\% Privileged Time"]" on host "SRV.headoffice.local" failed: first network error, wait for 15 seconds
    56768:20221017:123938.561 zbx_deactivate_item_interface() errors_from:1665999578 available:1​
    Очень смущает, что решение было принято мгновенно, без выдерживания таймаута
    На агенте судя по логу проблем нет: запрос принят и ответ отправлен.
    Code:
    На агенте
    2022/10/17 12:39:38.577352 received passive check request: 'perf_counter_en["\Processor(_Total)\% Privileged Time"]' from '10.1.1.189'
    2022/10/17 12:39:38.583742 [1] processing update request (1 requests)
    2022/10/17 12:39:38.589850 [1] adding new request for key: 'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    2022/10/17 12:39:38.598235 [1] created direct exporter task for plugin 'WindowsPerfMon' itemid:0 key 'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    2022/10/17 12:39:38.604099 executing direct exporter task for key 'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    2022/10/17 12:39:38.610368 parsed performance counter \Processor\% Privileged Time
    2022/10/17 12:39:38.616383 executed direct exporter task for key 'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    2022/10/17 12:39:38.622036 sending passive check response: '0.097573' to '10.1.1.189'​
    Через 15 секунд
    Code:
    На сервере
    56774:20221017:123953.707 End of zbx_ipc_async_socket_recv():0
    56774:20221017:123953.707 zbx_setproctitle() title:'unreachable poller #1 [got 0 values in 0.000065 sec, getting values]'
    56774:20221017:123953.707 In get_values()
    56774:20221017:123953.707 In DCconfig_get_poller_items() poller_type:1
    56774:20221017:123953.707 End of DCconfig_get_poller_items():1
    56774:20221017:123953.707 In substitute_key_macros_impl() data:'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    56774:20221017:123953.707 End of substitute_key_macros_impl():SUCCEED data:'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    56774:20221017:123953.707 In substitute_simple_macros_impl() data:'10050'
    56774:20221017:123953.707 In get_value() key:'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    56774:20221017:123953.707 In get_value_agent() host:'SRV.headoffice.local' addr:'SRV.headoffice.local' key:'perf_counter_en["\Processor(_Total)\% Privileged Time"]' conn:'unencrypted'
    56774:20221017:123953.710 Sending [perf_counter_en["\Processor(_Total)\% Privileged Time"]]
    56774:20221017:123953.743 get value from agent result: '0.097637'
    56774:20221017:123953.743 End of get_value_agent():SUCCEED
    56774:20221017:123953.743 End of get_value():SUCCEED
    56774:20221017:123953.743 In zbx_activate_item_interface() interfaceid:20 itemid:43593 type:0
    56774:20221017:123953.743 resuming Zabbix agent checks on host "SRV.headoffice.local": connection restored​
    Code:
    На агенте
    2022/10/17 12:39:53.723172 received passive check request: 'perf_counter_en["\Processor(_Total)\% Privileged Time"]' from '10.1.1.189'
    2022/10/17 12:39:53.727752 [1] processing update request (1 requests)
    2022/10/17 12:39:53.731728 [1] adding new request for key: 'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    2022/10/17 12:39:53.735133 [1] created direct exporter task for plugin 'WindowsPerfMon' itemid:0 key 'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    2022/10/17 12:39:53.739140 executing direct exporter task for key 'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    2022/10/17 12:39:53.743103 parsed performance counter \Processor\% Privileged Time
    2022/10/17 12:39:53.746575 executed direct exporter task for key 'perf_counter_en["\Processor(_Total)\% Privileged Time"]'
    2022/10/17 12:39:53.751155 sending passive check response: '0.097637' to '10.1.1.189'
    Ошибка появляется не сразу, а через несколько минут работы. Подскажите, что ему не нравится? В чем может быть проблема?
  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3404

    #2
    Сервер и агент - в одной сети? Не может ли быть каких-то экзотических случаев (обычно при наличии между ними NAT-а, фаервола, либо при наличии двух сетевушек на агенте), когда сервер получает от агента ответ с другого IP, нежели тот, на который был послан запрос?

    Comment

    Working...