Ad Widget

Collapse

Почему не добавляются правила обнаружения для анализа свободного места на centos?

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • squidw
    Junior Member
    • Oct 2017
    • 9

    #1

    Почему не добавляются правила обнаружения для анализа свободного места на centos?

    Здравствуйте.
    Сервер:
    за NAT, пробросы есть
    Zabbix server 3.0.20
    Ранее был до меня добавлен узел сети myexternalsite.com с веб-сценарием, в котором отслеживается состояние сайта down/up. К нему я уже позже добавил стандартный шаблон с той лишь разницей что агент активный "Template OS Linux_Active" с интерфейсом myexernalsite.com:10050. По этому шаблону и проблема получить данные.

    Клиент:
    CentOS Linux release 7.5.1804 (Core)
    zabbix agent 3.0.20
    вывод iptables -L:
    Code:
    Chain INPUT (policy DROP)
    target prot opt source destination
    ACCEPT tcp -- anywhere anywhere tcp dpt:10804
    ACCEPT tcp -- anywhere anywhere tcp dpt:10803
    ACCEPT tcp -- anywhere anywhere tcp dpt:10802
    ACCEPT tcp -- anywhere anywhere tcp dpt:10801
    ACCEPT tcp -- anywhere anywhere tcp dpt:gap
    ACCEPT tcp -- anywhere anywhere tcp dpt:ftp
    ACCEPT all -- anywhere anywhere
    ACCEPT icmp -- anywhere anywhere icmp echo-reply
    ACCEPT icmp -- anywhere anywhere icmp destination-unreachable
    ACCEPT icmp -- anywhere anywhere icmp time-exceeded
    ACCEPT icmp -- anywhere anywhere icmp echo-request
    ACCEPT all -- anywhere anywhere state RELATED,ESTABLISHED
    DROP all -- anywhere anywhere state INVALID
    DROP tcp -- anywhere anywhere tcp flags:FIN,SYN,RST,PSH,ACK,URG/NONE
    DROP tcp -- anywhere anywhere tcp flags:!FIN,SYN,RST,ACK/SYN state NEW
    ACCEPT tcp -- anywhere anywhere tcp dpt:ssh
    ACCEPT udp -- anywhere anywhere udp spt:domain dpts:1024:65535
    ACCEPT tcp -- anywhere anywhere tcp dpt:http
    ACCEPT tcp -- anywhere anywhere tcp dpt:https
    
    Chain FORWARD (policy DROP)
    target prot opt source destination
    ACCEPT all -- anywhere anywhere state RELATED,ESTABLISHED
    DROP all -- anywhere anywhere state INVALID
    
    Chain OUTPUT (policy DROP)
    target prot opt source destination
    ACCEPT tcp -- anywhere anywhere tcp dpt:zabbix-agent
    ACCEPT tcp -- anywhere anywhere tcp dpt:zabbix-trapper
    ACCEPT all -- anywhere anywhere
    ACCEPT icmp -- anywhere anywhere icmp echo-request
    ACCEPT all -- anywhere anywhere state RELATED,ESTABLISHED
    DROP tcp -- anywhere anywhere tcp flags:!FIN,SYN,RST,ACK/SYN state NEW
    ACCEPT udp -- anywhere anywhere udp spts:1024:65535 dpt:domain
    ACCEPT tcp -- anywhere anywhere tcp dpt:http
    ACCEPT tcp -- anywhere anywhere tcp dpt:https
    ACCEPT tcp -- anywhere gateway.myexernalsite.com
    Вывод getenforce:
    Code:
    Permissive
    Вывод sestatus:
    Code:
    SELinux status:                 enabled
    SELinuxfs mount:                /sys/fs/selinux
    SELinux root directory:         /etc/selinux
    Loaded policy name:             targeted
    Current mode:                   permissive
    Mode from config file:          permissive
    Policy MLS status:              enabled
    Policy deny_unknown status:     allowed
    Max kernel policy version:      31
    Конфиг агента:
    Code:
    PidFile=/var/run/zabbix/zabbix_agentd.pid
    LogFile=/var/log/zabbix/zabbix_agentd.log
    LogFileSize=10
    Server=myzabbixserver.com
    Hostname=myexernalsite.com
    Include=/etc/zabbix/zabbix_agentd.d
    /

    Проблема в том что на сервере в "последние данные" данные есть, но нет параметра сколько свободно места на диске, его же нет в триггерах. Насколько понял не отрабатывает для данного узла сети "Правила Обнаружения". В самом узле сети статус агента горит красным с текстом: Get value from agent failed: cannot connect to [[myexernalsite.com]:10050]: [4] Interrupted system call.
    При попытке с клиента
    Code:
    telnet myzabbixserver.com 10050
    :
    Code:
    Trying myzabbixserver.com...
    telnet: connect to address myzabbixserver.com: Connection timed out
    При попытке с клиента
    Code:
    telnet 127.0.0.1 10050
    :
    Code:
    Trying 127.0.0.1...
    Connected to 127.0.0.1.
    Escape character is '^]'.
    Connection closed by foreign host.




  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3404

    #2
    1) в конфиге агента не включен активный режим вообще (параметр "ServerActive=");
    2) в активном режиме клиент устанавливает соединение на сервер на порт 10051 (10050 - это порт на самом агенте).

    Comment

    • squidw
      Junior Member
      • Oct 2017
      • 9

      #3
      Originally posted by Kos
      1) в конфиге агента не включен активный режим вообще (параметр "ServerActive=");
      2) в активном режиме клиент устанавливает соединение на сервер на порт 10051 (10050 - это порт на самом агенте).
      Не заметил, видимо скопировал криво, ServerActive параметр есть, указан, вот еще раз конфиг агента:
      Code:
      PidFile=/var/run/zabbix/zabbix_agentd.pid
      LogFile=/var/log/zabbix/zabbix_agentd.log
      LogFileSize=10
      Server=myzabbixserver.com
      ServerActive=myzabbixserver.com:10051
      Hostname=myexernalsite.com
      Include=/etc/zabbix/zabbix_agentd.d/

      Comment

      • Kos
        Senior Member
        Zabbix Certified SpecialistZabbix Certified Professional
        • Aug 2015
        • 3404

        #4
        В самом узле сети статус агента горит красным с текстом: Get value from agent failed: cannot connect to [[myexernalsite.com]:10050]: [4] Interrupted system call.
        Эта ошибка говорит о том, что обнаружение работает (или работало на момент ошибки) не в активном, а в пассивном режиме. Сервер пытался обратиться к агенту на порт 10050 и не смог получить ответ. Вы же утверждали, что дискаверинг в вашем шаблоне должен работать в активном режиме. Проверяйте свои настройки (см. скриншот для примера).Click image for larger version

Name:	2019-05-15_01.PNG
Views:	395
Size:	47.5 KB
ID:	378950

        Comment

        • squidw
          Junior Member
          • Oct 2017
          • 9

          #5
          Originally posted by Kos
          Эта ошибка говорит о том, что обнаружение работает (или работало на момент ошибки) не в активном, а в пассивном режиме. Сервер пытался обратиться к агенту на порт 10050 и не смог получить ответ. Вы же утверждали, что дискаверинг в вашем шаблоне должен работать в активном режиме. Проверяйте свои настройки (см. скриншот для примера).Click image for larger version

Name:	2019-05-15_01.PNG
Views:	395
Size:	47.5 KB
ID:	378950
          Я менял в стандартных "элементах данных" в шаблоне тип на активный агент, но в "правилах обнаружения" как раз не менял. В обнаружении проставил с пассивного на активный агент, зашли данные и триггеры появились. Спасибо.

          Comment

          • squidw
            Junior Member
            • Oct 2017
            • 9

            #6
            Originally posted by squidw

            Я менял в стандартных "элементах данных" в шаблоне тип на активный агент, но в "правилах обнаружения" как раз не менял. В обнаружении проставил с пассивного на активный агент, зашли данные и триггеры появились. Спасибо.
            Хм кажется преждевременно обрадовался. Для проверки "Отсоединил и очистил" шаблон в узле сети. Добавил его повторно и после этого ни последние данные ни триггеры для файловой системы не зашли по правилам обнаружения. По крайней мере перестала беспокоить ошибка Get value from agent failed: cannot connect to [[myexernalsite.com]:10050]: [4] Interrupted system call. в узле агента.

            Comment

            • squidw
              Junior Member
              • Oct 2017
              • 9

              #7
              Originally posted by squidw

              Хм кажется преждевременно обрадовался. Для проверки "Отсоединил и очистил" шаблон в узле сети. Добавил его повторно и после этого ни последние данные ни триггеры для файловой системы не зашли по правилам обнаружения. По крайней мере перестала беспокоить ошибка Get value from agent failed: cannot connect to [[myexernalsite.com]:10050]: [4] Interrupted system call. в узле агента.
              Зашли, видимо система очень долго обрабатывает правила обнаружения в отличии от стандартных элементов данных. Единственное но, меня смущает напротив некоторых стандартных триггеров поле ИНФО ошибка вида:
              Code:
               Cannot evaluate function "myexernalsite.com:
              Данная ошибка происходит на триггерах:
              Template OS Linux_Active: /etc/passwd has been changed on {HOST.NAME}
              Template OS Linux_Active: Host information was changed on {HOST.NAME}
              Template App Zabbix Agent_Active: Host name of zabbix_agentd was changed on {HOST.NAME}
              Template OS Linux_Active: Hostname was changed on {HOST.NAME}
              Template App Zabbix Agent_Active: Version of zabbix_agent(d) was changed on {HOST.NAME}

              Comment

              • Kos
                Senior Member
                Zabbix Certified SpecialistZabbix Certified Professional
                • Aug 2015
                • 3404

                #8
                Ну подождите немного, пока правило обнаружения отработает. Какой там для него интервал обновления выставлен? Вряд ли несколько минут, обычно час. Вот час и подождите.

                Comment

                • Kos
                  Senior Member
                  Zabbix Certified SpecialistZabbix Certified Professional
                  • Aug 2015
                  • 3404

                  #9
                  меня смущает напротив некоторых стандартных триггеров поле ИНФО ошибка вида:
                  К сожалению, в цитате оказалось обрезанным имя конкретной триггерной функции. Но, исходя из представленных имён триггеров, могу предположить, что там используется функция diff(), сравнивающая последнее значение с предыдущим. Соответственно, для её работы нужно, чтобы было с чем сравнивать, т.е. в истории должно быть не только последнее значение, но и предпоследнее. После очистки истории там пусто. Подождите немного, придёт второе значение по каждому айтему - триггеры "выздоровеют".

                  Comment

                  Working...