Ad Widget

Collapse

После установки 1.8.4 версии агент не опрашив&

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • step_slim
    Member
    • Jul 2010
    • 84

    #1

    После установки 1.8.4 версии агент не опрашив&

    Доброго времени суток
    До этого ставил zabbix на OpenSuse 11.2, версия zabbix была 1.8.2. Но в Suse были периодические проблемы с базой данных, но не суть дела. Запустил на виртуалке Slackware 13.1 поставил zabbix 1.8.4 залепетал волшебно, без лишних преувеличений. И вот дошло время до переноса на рабочий сервер, ставлю по накатанному...
    И вот суть проблема, после установки агент через вэб интерфейс сообщает, что у меня не запущены процессы: Http (apache), mail (pop3)... Ну и так далее по списку. Но я ведь в данный момент сижу сервере через вэб интерфейс. В этом и странность А через 10 минут сообщает:
    Server Zabbix server is unreachable
    Причём так показывает 20 минут, потом опять подхватывается и выкидывает кучу процессов, что они не запущены и опять отваливается. Сравнивал конфиги с виртуальной машиной, они идентичны, сравнивал настройки, то же одинаковы, пробовал гуглить этот вид ошибки, но не нашёл ничего подходящего...

    з.ы. Пытаюсь запустить Обнаружение, говорит, что активна, но ничего не находит, то есть не бегает по сети. Настройки все стоят, диапазон адресов задан.
    В какую сторону копать?
  • dima_dm
    Senior Member
    • Dec 2009
    • 2697

    #2
    проверить работу zabbix_agentd достаточно легко
    С Zabbix Server
    zabbix_get -s IP -k agent.version
    1.8.2

    Если zabbix_agentd работает, попробуйте проверить процессы
    С Zabbix Server
    zabbix_get -s IP -k proc.num[httpd]
    и т.д.
    Это могут быть фичи безопасности OS, которые не дают пользователю zabbix (под которым работает zabbix_agentd) видить процессы других пользователей. Проверьте это.
    На машине с zabbix_agentd
    #su - zabbix
    $ps -ax
    Last edited by dima_dm; 18-05-2011, 10:28.

    Comment

    • step_slim
      Member
      • Jul 2010
      • 84

      #3
      У меня немного не такой синтаксис команд, примерно вот так:
      Code:
      # zabbix_get -s IP -V
      Zabbix Get v1.8.4 (revision 16604) (4 January 2011)
      Compilation time: May 16 2011 15:21:00
      zabbix_get -s IP -k proc.num[http]
      Эта команда ничего не возвращает
      А вот
      Code:
      # ps -ax
      Показывает вот это:
      Code:
       3254 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agentd.version
       3321 ?        S      0:01 /usr/sbin/httpd -k start
       3456 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agentd.version
       3468 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agent.version
       3469 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agent.ver
       3478 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agent
       3497 ?        S      0:00 /usr/sbin/httpd -k start
       3532 ?        S      0:00 /usr/sbin/httpd -k start
       3535 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k proc.num
       3537 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k proc.num[http]
       3551 ?        S      0:00 /usr/sbin/httpd -k start
       3552 pts/0    R+     0:00 ps -ax
      Что касается zabbix. Стало ещё запутанней, так как я не ставил ни каких браудмеров и фаерволов, даже IPtables стоит в дефолте с разрешением на всё.

      Comment

      • Kenny
        Member
        • Apr 2009
        • 50

        #4
        а ps -a что говорит?
        может демон веба к примеру называется подругому?

        даже -ax показывает что httpd а zabbix_get просит http

        Comment

        • dima_dm
          Senior Member
          • Dec 2009
          • 2697

          #5
          Originally posted by step_slim
          А вот
          Code:
          # ps -ax
          Показывает вот это:
          Code:
           3254 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agentd.version
           3321 ?        S      0:01 /usr/sbin/httpd -k start
           3456 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agentd.version
           3468 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agent.version
           3469 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agent.ver
           3478 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k agent
           3497 ?        S      0:00 /usr/sbin/httpd -k start
           3532 ?        S      0:00 /usr/sbin/httpd -k start
           3535 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k proc.num
           3537 pts/0    T      0:00 zabbix_get -s 10.32.70.69 -k proc.num[http]
           3551 ?        S      0:00 /usr/sbin/httpd -k start
           3552 pts/0    R+     0:00 ps -ax
          А почему ps -ax запущена от root, а не от пользователя zabbix?

          Вы разницу видите между
          zabbix_get -s IP -k agent.version
          Т.е. версию zabbix_agentd на удалённой машине
          и то, что ввели Вы
          zabbix_get -s IP -V
          Т.е. версию утилиты zabbix_get на локальной машине.
          Last edited by dima_dm; 18-05-2011, 15:49.

          Comment

          • step_slim
            Member
            • Jul 2010
            • 84

            #6
            dima_dm
            А почему ps -ax запущена от root, а не от пользователя zabbix?
            Потому что, пользователю zabbix запрещена локальная авторизация (такая аннотация шла в инструкции по установки), но пользователя и группу ему я создал:
            Code:
            The suggested UID and GID is 228, but you can change this as needed:
            
              # groupadd -g 228 zabbix
              # useradd -u 228 -g zabbix -d /dev/null -s /bin/false zabbix
            Поэтому я не могу залогинется под ним, но сам процесс zabbix`a живёт от этого пользователя, но стартует от root.
            Вы разницу видите между
            zabbix_get -s IP -k agent.version
            Т.е. версию zabbix_agentd на удалённой машине
            Конечно вижу, только я не мониторю zabbix`ом удалённые машины, он у меня для мониторинга сетевого оборудования и периферии.
            Я не могу понять, почему он отваливается через 2 минуты и тупо ничего не делает, просто висит, не обновляет ничего. После перезапуска он подхватывается и 2 минуты находит ошибки у себя, потом слетает. В логах агента пишет:
            Zabbix_server not found
            в логах сервера:
            Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]


            Kenny
            а ps -a что говорит?
            PID TTY TIME CMD
            20691 pts/0 00:00:00 zabbix_get
            20697 pts/0 00:00:00 zabbix_get
            21152 pts/0 00:00:00 ps
            может демон веба к примеру называется подругому?
            Согласен, но это не проблема, проблема в том, что отваливается через 2 минуты после старта....

            Если не трудно, посмотрите у себя, у кого как, кто использует zabbix на Linux, вот эту команду:
            netstat -pntl
            у меня вывод таков:
            Proto Recv-Q Send-Q Local Address Foreign Address State PID/Program name
            tcp 0 0 0.0.0.0:10050 0.0.0.0:* LISTEN 21061/zabbix_agentd
            tcp 0 0 0.0.0.0:10051 0.0.0.0:* LISTEN 21081/zabbix_server
            Last edited by step_slim; 19-05-2011, 15:28.

            Comment

            • dima_dm
              Senior Member
              • Dec 2009
              • 2697

              #7
              Originally posted by step_slim
              dima_dm
              Конечно вижу, только я не мониторю zabbix`ом удалённые машины, он у меня для мониторинга сетевого оборудования и периферии.
              Я не могу понять, почему он отваливается через 2 минуты и тупо ничего не делает, просто висит, не обновляет ничего. После перезапуска он подхватывается и 2 минуты находит ошибки у себя, потом слетает. В логах агента пишет:
              На самом деле разницы особой нет, по сети или локальную машину. Главное, для корректного тестирования, чтобы вызовы проходили по сети на Zabbix_agent
              т.е.
              zabbix_get -s localhost -k agent.version
              Версию Zabbix_agent пробовали менять?
              http://www.zabbix.com/download.php
              http://www.zabbix.com/download2.php

              Comment

              • step_slim
                Member
                • Jul 2010
                • 84

                #8
                dima_dm
                Code:
                root@zabbix_server:~# zabbix_get -s localhost -k agent.version
                zabbix_get [24359]: Get value error: ZBX_TCP_READ() failed [Connection reset by peer]
                То же самое что и в логах.
                Версию Zabbix_agent пробовали менять?
                А что разве можно использовать другие версии, отличные от версий сервера? У Меня версия сервера и агента- 1.8.4, установленная из репазитория slackbuild. *Репазиторий*. Могу в принципе собрать вручную агент скачав исходник, но что мне это даст? Да и какой опционально использовать, тут то же вопрос?

                Немного поправлю, 2 часа мониторил логи и пришёл к выводу, что агент работает правильно и не отваливается, как я писал выше, отваливается сам сервер, точнее перестаёт принимать информацию с агента. Вот чего наловил:
                Лог агента:
                tail -f /var/log/zabbix/zabbix_agentd.log
                25662:20110520:114231.633 End of send_buffer():SUCCEED
                25662:20110520:114231.633 Sleeping for 1 seconds
                25662:20110520:114232.633 In send_buffer() host:'10.32.70.69' port:10051 values:0/100
                25662:20110520:114232.633 End of send_buffer():SUCCEED
                25662:20110520:114232.633 Sleeping for 1 seconds
                25662:20110520:114233.633 In send_buffer() host:'10.32.70.69' port:10051 values:0/100
                25662:20110520:114233.633 End of send_buffer():SUCCEED
                25662:20110520:114233.633 Sleeping for 1 seconds
                25662:20110520:114234.633 In send_buffer() host:'10.32.70.69' port:10051 values:0/100
                25662:20110520:114234.634 End of send_buffer():SUCCEED
                25662:20110520:114234.634 Sleeping for 1 seconds
                И вот лог сервера на тот же момент времени:
                25687:20110520:113504.615 Zabbix Host [Zabbix server]: another network error, wait for 15 seconds
                25686:20110520:113505.615 Item [Zabbix serverroc.num[inetd]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
                25686:20110520:113505.616 Zabbix Host [Zabbix server]: another network error, wait for 15 seconds
                25688:20110520:113550.490 Item [Zabbix server:vfs.fs.size[/opt,pfree]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
                25688:20110520:113550.553 Disabling Zabbix host [Zabbix server]
                25688:20110520:113720.554 Item [Zabbix server:net.tcp.service[nntp]] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
                25688:20110520:113850.556 Item [Zabbix server:kernel.maxfiles] error: Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
                Может, что в файлах конфигурации подправить?
                Last edited by step_slim; 20-05-2011, 09:38.

                Comment

                • dima_dm
                  Senior Member
                  • Dec 2009
                  • 2697

                  #9
                  Да, можно использовать любые версии zabbix_agent
                  Здесь написано про совместимость версий
                  http://www.zabbix.com/documentation/...on_and_upgrade
                  У вас zabbix_agent работает в активном или пассивном режиме?
                  Стрелкой показано направление открытия TCP соединения.
                  Zabbix Agent
                  server:TCP 10050 <- Zabbix_Server

                  Zabbix Agent (active)
                  server -> Zabbix_Server:TCP 10051

                  Покажите конфигурационный файл Zabbix Agent.
                  Проверьте, что у вас нет проблем с Firewall (iptables) и SELinux и другими фичами безопасности OS, которые у вас активированы.
                  Last edited by dima_dm; 20-05-2011, 11:28.

                  Comment

                  • step_slim
                    Member
                    • Jul 2010
                    • 84

                    #10
                    dima_dm
                    У вас zabbix_agent работает в активном или пассивном режиме?
                    А как это проверить? Никогда не сталкивался с подобным действием, просто ставил всё по умолчанию и всё. Но если верить вот этой букве инструкции
                    Для работы активного режима, необходимо чтобы параметр Hostname в файле конфигурации zabbix_agentd.conf соответствовал названию узла в веб-интерфейсе системы.
                    То после изменения имени хоста, на имя самого сервера, то zabbix сразу после старта уходит в ошибку о недоступности.
                    Покажите конфигурационный файл Zabbix Agent.
                    У меня нет такого файла, у меня файл конфигурации agentd.conf, вот:
                    Code:
                    # This is a config file for Zabbix Agent (Unix)
                    # To get more information about Zabbix, visit http://www.zabbix.com
                    
                    ############ GENERAL PARAMETERS #################
                    
                    ### Option: PidFile
                    #	Name of PID file.
                    #
                    # Mandatory: no
                    # Default:
                    PidFile=/var/run/zabbix/zabbix_agentd.pid
                    
                    ### Option: LogFile
                    #	Name of log file.
                    #	If not set, syslog is used.
                    #
                    # Mandatory: no
                    # Default:
                    # LogFile=
                    
                    LogFile=/var/log/zabbix/zabbix_agentd.log
                    
                    ### Option: LogFileSize
                    #	Maximum size of log file in MB.
                    #	0 - disable automatic log rotation.
                    #
                    # Mandatory: no
                    # Range: 0-1024
                    # Default:
                    # LogFileSize=1
                    
                    ### Option: DebugLevel
                    #	Specifies debug level
                    #	0 - no debug
                    #	1 - critical information
                    #	2 - error information
                    #	3 - warnings
                    #	4 - for debugging (produces lots of information)
                    #
                    # Mandatory: no
                    # Range: 0-4
                    # Default:
                    # DebugLevel=3
                    
                    DebugLevel=4
                    
                    ### Option: SourceIP
                    #	Source IP address for outgoing connections.
                    #
                    # Mandatory: no
                    # Default:
                    # SourceIP=
                    
                    ### Option: EnableRemoteCommands
                    #	Whether remote commands from Zabbix server are allowed.
                    #	0 - not allowed
                    #	1 - allowed
                    #
                    # Mandatory: no
                    # Default:
                    # EnableRemoteCommands=0
                    
                    ### Option: LogRemoteCommands
                    #	Enable logging of executed shell commands as warnings.
                    #	0 - disabled
                    #	1 - enabled
                    #
                    # Mandatory: no
                    # Default:
                    # LogRemoteCommands=0
                    
                    ##### Passive checks related
                    
                    ### Option: Server
                    #	List of comma delimited IP addresses (or hostnames) of Zabbix servers.
                    #	No spaces allowed. First entry is used for receiving list of and sending active checks.
                    #	If IPv6 support is enabled then '127.0.0.1', '::127.0.0.1', '::ffff:127.0.0.1' are treated equally.
                    #
                    # Mandatory: yes
                    # Default:
                    # Server=
                    
                    Server=10.32.70.69,127.0.0.1 (2 IP адреса я добавил только сегодня)
                    
                    ### Option: Hostname
                    #	Unique, case sensitive hostname.
                    #	Required for active checks and must match hostname as configured on the server.
                    #	System hostname is used if undefined.
                    #
                    # Default:
                    # Hostname=system.hostname
                    
                    Hostname=Zabbix server
                    
                    ### Option: ListenPort
                    #	Agent will listen on this port for connections from the server.
                    #
                    # Mandatory: no
                    # Range: 1024-32767
                    # Default:
                    # ListenPort=10050
                    
                    ListenPort=10050
                    
                    ### Option: ListenIP
                    #	List of comma delimited IP addresses that the agent should listen on.
                    #
                    # Mandatory: no
                    # Default:
                    # ListenIP=0.0.0.0
                    
                    ### Option: DisablePassive
                    #	Disable passive checks. The agent will not listen on any TCP port.
                    #	Only active checks will be processed.
                    #	0 - do not disable
                    #	1 - disable
                    #
                    # Mandatory: no
                    # Default:
                    # DisablePassive=0
                    
                    ##### Active checks related
                    
                    ### Option: DisableActive
                    #	Disable active checks. The agent will work in passive mode listening for server.
                    #
                    # Mandatory: no
                    # Default:
                    # DisableActive=0
                    
                    ### Option: ServerPort
                    #	Server port for retrieving list of and sending active checks.
                    #
                    # Mandatory: no
                    # Default:
                    # ServerPort=10051
                    
                    ServerPort=10051
                    
                    ### Option: RefreshActiveChecks
                    #	How often list of active checks is refreshed, in seconds.
                    #
                    # Mandatory: no
                    # Range: 60-3600
                    # Default:
                    # RefreshActiveChecks=120
                    
                    ### Option: BufferSend
                    #	Do not keep data longer than N seconds in buffer.
                    #
                    # Mandatory: no
                    # Range: 1-3600
                    # Default:
                    # BufferSend=5
                    
                    ### Option: BufferSize
                    #	Maximum number of values in a memory buffer. The agent will send
                    #	all collected data to Zabbix Server or Proxy if the buffer is full.
                    #
                    # Mandatory: no
                    # Range: 2-65535
                    # Default:
                    # BufferSize=100
                    
                    ### Option: MaxLinesPerSecond
                    #	Maximum number of new lines the agent will send per second to Zabbix Server
                    #	or Proxy processing 'log' and 'logrt' active checks.
                    #	The provided value will be overridden by the parameter 'maxlines',
                    #	provided in 'log' or 'logrt' item keys.
                    #
                    # Mandatory: no
                    # Range: 1-1000
                    # Default:
                    # MaxLinesPerSecond=100
                    
                    ### Option: AllowRoot
                    #	Allow the agent to run as 'root'. If disabled and the agent is started by 'root', the agent
                    #       will try to switch to user 'zabbix' instead. Has no effect if started under a regular user.
                    #	0 - do not allow
                    #	1 - allow
                    #
                    # Mandatory: no
                    # Default:
                    # AllowRoot=0
                    
                    ############ ADVANCED PARAMETERS #################
                    
                    ### Option: StartAgents
                    #	Number of pre-forked instances of zabbix_agentd that process passive checks.
                    #
                    # Mandatory: no
                    # Range: 1-16
                    # Default:
                    # StartAgents=3
                    
                    ### Option: Timeout
                    #	Spend no more than Timeout seconds on processing
                    #
                    # Mandatory: no
                    # Range: 1-30
                    # Default:
                    # Timeout=3
                    Timeout=30
                    
                    ### Option: Include
                    #	You may include individual files or all files in a directory in the configuration file.
                    #
                    # Mandatory: no
                    # Default:
                    # Include=
                    
                    # Include=/etc/zabbix/zabbix_agentd.userparams.conf
                    # Include=/etc/zabbix/zabbix_agentd/
                    
                    ####### USER-DEFINED MONITORED PARAMETERS #######
                    
                    ### Option: UnsafeUserParameters
                    #	Allow all characters to be passed in arguments to user-defined parameters.
                    #	0 - do not allow
                    #	1 - allow
                    #
                    # Mandatory: no
                    # Range: 0-1
                    # Default:
                    # UnsafeUserParameters=0
                    
                    ### Option: UserParameter
                    #	User-defined parameter to monitor. There can be several user-defined parameters.
                    #	Format: UserParameter=<key>,<shell command>
                    #	Note that shell command must not return empty string or EOL only.
                    #	See 'zabbix_agentd' directory for examples.
                    #
                    # Mandatory: no
                    # Default:
                    # UserParameter=
                    Проверьте, что у вас нет проблем с Firewall (iptables)
                    Проверял и неоднократно:
                    iptables -L
                    Chain INPUT (policy ACCEPT)
                    target prot opt source destination
                    ACCEPT tcp -- anywhere anywhere tcp dpt:zabbix_agen td
                    ACCEPT udp -- anywhere anywhere udp dpt:zabbix_agen td
                    ACCEPT tcp -- anywhere anywhere tcp dpt:zabbix_trap per
                    ACCEPT udp -- anywhere anywhere udp dpt:zabbix_trap per

                    Chain FORWARD (policy ACCEPT)
                    target prot opt source destination

                    Chain OUTPUT (policy ACCEPT)
                    target prot opt source destination
                    ACCEPT tcp -- anywhere anywhere tcp dpt:zabbix_agen td
                    ACCEPT udp -- anywhere anywhere udp dpt:zabbix_agen td
                    ACCEPT tcp -- anywhere anywhere tcp dpt:zabbix_trap per
                    ACCEPT udp -- anywhere anywhere udp dpt:zabbix_trap per
                    Last edited by step_slim; 20-05-2011, 12:42.

                    Comment

                    • step_slim
                      Member
                      • Jul 2010
                      • 84

                      #11
                      UP!
                      Сменил версию агента, результат остался тот же. Вот что в логах сервера:
                      Code:
                      1906:20110523:152046.562 Item [Zabbix server:net.if.in[lo,bytes]] error: Get value from agent failed: Cannot connect to [127.0.0.1:10050] [Connection refused]
                        1906:20110523:152146.564 Item [Zabbix server:agent.ping] error: Got empty string from [127.0.0.1]. Assuming that agent dropped connection because of access permissions
                        1906:20110523:152246.566 Item [Zabbix server:proc.num[inetd]] error: Got empty string from [127.0.0.1]. Assuming that agent dropped connection because of access permissions
                        1906:20110523:152346.568 Item [Zabbix server:net.tcp.service[smtp]] error: Got empty string from [127.0.0.1]. Assuming that agent dropped connection because of access permissions
                      Ну а агент как и ранее всё удачно:
                      Code:
                       1962:20110523:152348.694 End of send_buffer():SUCCEED
                        1962:20110523:152348.694 Sleeping for 1 second(s)
                        1956:20110523:152348.781 In update_cpustats()
                        1956:20110523:152348.781 End of update_cpustats()
                        1962:20110523:152349.694 In send_buffer() host:'10.32.70.69' port:10051 values:0/100

                      Comment

                      • step_slim
                        Member
                        • Jul 2010
                        • 84

                        #12
                        Закрываем тему

                        Решил проблему, причём методом "на угад"
                        Поменял значение в файле agentd.conf
                        Code:
                        ### Option: AllowRoot
                        AllowRoot=1
                        И всё заработало. Точно не знаю в чём причина, но видать был потаённый смысл

                        Comment

                        Working...