Ad Widget

Collapse

Первая установка Zabbix + PostgreSQL (проблема с запуском Zabbix Agent) на Debian 10

Collapse
X
 
  • Time
  • Show
Clear All
new posts
  • m.ganichkin
    Junior Member
    • Jul 2019
    • 19

    #1

    Первая установка Zabbix + PostgreSQL (проблема с запуском Zabbix Agent) на Debian 10

    Устанавливал заббикс по сходству с этим видеороликом: https://www.youtube.com/watch?v=EEgmhJ_H7tA
    Но были некторые сложности в связи с разницей от видео( Debian 10 и PostgreSQL 11) - немного об этом расписал здесь:


    Итого, не получается запустить Zabbix Agent:
    systemctl start zabbix-agent
    Job for zabbix-agent.service failed because the control process exited with error code.
    See "systemctl status zabbix-agent.service" and "journalctl -xe" for details.

    systemctl status zabbix-agent.service
    zabbix-agent.service - Zabbix Agent
    Loaded: loaded (/lib/systemd/system/zabbix-agent.service; enabled; vendor preset: enabled)
    Active: activating (auto-restart) (Result: exit-code) since Fri 2019-07-26 19:56:32 +09; 9s ago
    Process: 15553 ExecStart=/usr/sbin/zabbix_agentd -c $CONFFILE (code=exited, status=1/FAILURE)

    При этом логов нет, PidFile не создается (/var/run/zabbix/zabbix_agentd.pid), заббикс пишет о проблеме соответственно:
    Zabbix agent on Zabbix server is unreachable for 5 minutes.

    Переустановку агента под чистую пробовал, не помогает.

    Основные настройки из конфига агента:
    PidFile=/var/run/zabbix/zabbix_agentd.pid
    LogFile=/var/log/zabbix/zabbix_agentd.log
    LogFileSize=512
    DebugLevel=3
    EnableRemoteCommands=1
    Server=192.168.*.* - ip сервера в сети(агент и сервер - все на одной машинке на Debian 10)
    ListenIP=192.168.*.* - ip сервера в сети
    ServerActive=127.0.0.1
    Hostname=name pc
    Include=/etc/zabbix/zabbix_agentd.d/*.conf
    TLSAccept=psk


    Помогите пожалуйста, идеи закончились


  • Kos
    Senior Member
    Zabbix Certified SpecialistZabbix Certified Professional
    • Aug 2015
    • 3404

    #2
    Смотреть причину падения в логе агента.
    Если лог агента не создаётся - разбираться, почему. Например, нет такой папки (/var/log/zabbix/), или же она недоступна на запись пользователю zabbix.
    В конце концов, можно попытаться запустить агента вручную с командной строки (/usr/sbin/zabbix_agentd -c /путь/zabbix_agentd.conf) и смотреть при этом, что выдаётся в stdout/stderr.

    Кроме того, в конфиге агента явно некорректно задан параметр "ServerActive=", но падать из-за этого он не должен.
    А вот "ListenIP=", указывающий на чужой адрес (сервера, а не агента), вполне может приводить к падениям.

    Comment

    • m.ganichkin
      Junior Member
      • Jul 2019
      • 19

      #3
      Рад Вашему оперативному ответу) Увы только сегодня появилась возможность проверить...

      /var/log/zabbix/ - есть, логи самого заббикса работают корректно, пользователю заббикс соответственно доступна, иначе он не мог бы делать записи заббикса.
      /usr/sbin/zabbix_agentd -c /путь/zabbix_agentd.conf - при попытке запуска(подставил свой путь к конфигу и вставил в терминал от root'а) вышла ошибка:
      /usr/sbin/zabbix_agentd -c /etc/zabbix/zabbix_agentd.conf
      zabbix_agentd [15769]: ERROR: parameter "TLSAccept" value requires "TLSPSKFile", but it is not defined
      stdout/stderr - не понял где искать и что смотреть(я с линуксом только учусь общаться, пока методом копипаста из гугла в терминал)

      ListenIP= ip одной и той же машинки, пробовал 127.0.0.1 - без изменений.
      ServerActive= честно говоря по мануалам видел, как локалхост указывали.. но после Ваших слов попробовал на ip поменять...

      Пока сдвигов нет. SOS!

      Comment

      • ArteomParfen91@gmail.com
        Member
        • Jul 2018
        • 47

        #4
        может попробовать sudo systemctl zabbix-agent

        Comment

        • m.ganichkin
          Junior Member
          • Jul 2019
          • 19

          #5
          Originally posted by [email protected]
          может попробовать sudo systemctl zabbix-agent
          А в ответ:
          Unknown operation zabbix-agent.

          При этом он установлен о.О

          В оправдание:
          apt install zabbix-agent
          Чтение списков пакетов… Готово
          Построение дерева зависимостей
          Чтение информации о состоянии… Готово
          Уже установлен пакет zabbix-agent самой новой версии (1:4.2.4-2+buster).
          Обновлено 0 пакетов, установлено 0 новых пакетов, для удаления отмечено 0 пакетов, и 0 пакетов не обновлено.

          "Я сошла с ума, я сошла с ума..." =)

          Comment


          • ArteomParfen91@gmail.com
            [email protected] commented
            Editing a comment
            все верно, т.к. я ошибся.
            sudo systemctl start zabbix-agent
        • m.ganichkin
          Junior Member
          • Jul 2019
          • 19

          #6
          Про попытку старта я в первом сообщении сразу написал. С этим как раз проблемка.

          Comment

          • Evgeniy
            Senior Member
            • May 2012
            • 157

            #7
            А дедуктивный метод пробовали применить? Например, соотнести сообщение об ошибке:
            Code:
            zabbix_agentd [15769]: ERROR: parameter "TLSAccept" value requires "TLSPSKFile", but it is not defined
            C
            Основные настройки из конфига агента:
            .
            TLSAccept=psk

            Comment


            • m.ganichkin
              m.ganichkin commented
              Editing a comment
              Спасибо, сделал пока без шифрования:
              TLSAccept=unencrypted
              Запускается

              Но теперь пишет в статусе:
              Zabbix Agent
              Loaded: loaded (/lib/systemd/system/zabbix-agent.service; enabled; vendor preset: enabled)
              Active: active (running) since Tue 2019-07-30 08:36:09 +09; 27s ago
              Process: 2162 ExecStart=/usr/sbin/zabbix_agentd -c $CONFFILE (code=exited, status=0/SUCCESS)
              Main PID: 2164 (zabbix_agentd)
              Tasks: 6 (limit: 4648)
              Memory: 4.3M
              CGroup: /system.slice/zabbix-agent.service
              ├─2164 /usr/sbin/zabbix_agentd -c /etc/zabbix/zabbix_agentd.conf
              ├─2166 /usr/sbin/zabbix_agentd: collector [idle 1 sec]
              ├─2167 /usr/sbin/zabbix_agentd: listener #1 [waiting for connection]
              ├─2168 /usr/sbin/zabbix_agentd: listener #2 [waiting for connection]
              ├─2169 /usr/sbin/zabbix_agentd: listener #3 [waiting for connection]
              └─2170 /usr/sbin/zabbix_agentd: active checks #1 [idle 1 sec]

              июл 30 08:36:09 debian-pc systemd[1]: Starting Zabbix Agent...
              июл 30 08:36:09 debian-pc systemd[1]: zabbix-agent.service: Can't open PID file /run/zabbix/zabbix_agentd.pid (yet?) after start
              июл 30 08:36:09 debian-pc systemd[1]: Started Zabbix Agent.
              (pid файл начал создаваться) права у zabbix пользователя есть, иначе сам заббикс сервер ругался бы и вряд ли стартовал бы да и pid у сервера тоже есть и на него не ругается.
              ----
              В заббиксе проблема пока не ушла...
              Last edited by m.ganichkin; 30-07-2019, 03:49.
          • m.ganichkin
            Junior Member
            • Jul 2019
            • 19

            #8
            На самом деле нигде не могу найти информацию про pid файл, т.е. что в нем, зачем и с чем его едят...

            Comment

            • DSV12
              Senior Member
              Zabbix Certified Specialist
              • Nov 2018
              • 156

              #9
              Originally posted by m.ganichkin
              На самом деле нигде не могу найти информацию про pid файл, т.е. что в нем, зачем и с чем его едят...
              Определение pid-файла: числовой идентификатор процесса. Н-р:
              Code:
              # cat /var/run/zabbix/zabbix_agentd.pid
              9677
              # ps ax | grep zabbix
               9677 ?        S      0:00 /usr/sbin/zabbix_agentd -c /etc/zabbix/zabbix_agentd.conf
              ...
              Last edited by DSV12; 30-07-2019, 06:21.

              Comment


              • m.ganichkin
                m.ganichkin commented
                Editing a comment
                Правильно ли я понял, что без идентификатора он не может работать? Может ли это сказываться на то что сервер продолжает ругаться на отсутствие связи с агентом?
            • m.ganichkin
              Junior Member
              • Jul 2019
              • 19

              #10
              После перезагрузки PID файла не оказалось(только от сервера).
              Есть идеи?

              Comment

              • Kos
                Senior Member
                Zabbix Certified SpecialistZabbix Certified Professional
                • Aug 2015
                • 3404

                #11
                Originally posted by m.ganichkin
                После перезагрузки PID файла не оказалось(только от сервера).
                Есть идеи?
                PID-файл создаётся при запуске агента и удаляется при его останове. И судя по вот этому:
                июл 30 08:36:09 debian-pc systemd[1]: Starting Zabbix Agent...
                июл 30 08:36:09 debian-pc systemd[1]: zabbix-agent.service: Can't open PID file /run/zabbix/zabbix_agentd.pid (yet?) after start
                июл 30 08:36:09 debian-pc systemd[1]: Started Zabbix Agent.
                - с PID-файлом у вас всё в порядке. Можете сами убедиться, что после старта агента файл /run/zabbix/zabbix_agentd.pid присутствует и содержит Process ID родительского процесса агента Zabbix. См. пример DSV12 чуть выше.

                В чём именно проблема сейчас? Настраивайте спокойно сначала конфиг агента, дальше - уже через веб-интерфейс.
                Если у вас Zabbix-агент и Zabbix-сервер расположены на разных машинах, то в конфиге агента параметры "Server" и "ServerActive" - это ссылки на Zabbix-сервер, а "ListenIP" - адрес самого агента. ListenIP можно и не указывать, он обязателен только для случая, когда на машине есть несколько IP и вы хотите, чтобы агент слушал только на одном из них. Однако, если там указать 127.0.0.1, то логично, что слушать он будет только свой loopback-интерфейс, а по сети (со стороны сервера) вы до него не достучитесь.

                Comment


                • m.ganichkin
                  m.ganichkin commented
                  Editing a comment
                  Спасибо, Ваши подробные разъяснения радуют)) По проблемам:

                  - Как раз покоя и не дает тот факт, что pid файла при запущенном агенте нет и в процессах через htop его не видно, хотя статус пишет, что все хорошо, тут либо я чего-то не понимаю, либо что-то не так.. На всякий случай статус агента:
                  ● zabbix-agent.service - Zabbix Agent
                  Loaded: loaded (/lib/systemd/system/zabbix-agent.service; enabled; vendor preset: enabled)
                  Active: activating (start) since Tue 2019-07-30 16:19:49 +09; 24s ago
                  Process: 4820 ExecStart=/usr/sbin/zabbix_agentd -c $CONFFILE (code=exited, status=0/SUCCESS)
                  Tasks: 0 (limit: 4648)
                  Memory: 544.0K
                  CGroup: /system.slice/zabbix-agent.service
                  (вот тут смущает, что пишет "Active: activating", когда у сервера "Active: active (running)")

                  - Как я изначально писал - сервер и агент на одной машинке, ip прописывал соответственно, сейчас перепроверю все(на всякий случай в очередной раз). ListenIP - указываю, т.к. на 10-м Дебиане какая-то хитрость происходит с ip, ибо network manager отключил и удалил, но в интерфейсов статику ставит и от куда-то еще подтягивает настройку включая DHCP + ipv6(дополнительно к статике в interfaces), но я эту тему тут не поднимаю, хочу позже разобраться, сейчас просто горят сроки по самому старту заббикса с агентом, как всегда - времени мало).
              • m.ganichkin
                Junior Member
                • Jul 2019
                • 19

                #12
                Урра, в итоге запустился и сервер и агент с успешным статусом, но не пойму почему заббикс все равно ругается на отсутствие связи с агентом. Вообще, до настройки через оболочку - агент должен нормально общаться с сервером? Уже просто не знаю, что думать.. когда неделями в одном тупике ковыряешься - начинается шизофрения...

                Comment

                • DSV12
                  Senior Member
                  Zabbix Certified Specialist
                  • Nov 2018
                  • 156

                  #13
                  Originally posted by m.ganichkin
                  Урра, в итоге запустился и сервер и агент с успешным статусом, но не пойму почему заббикс все равно ругается на отсутствие связи с агентом.
                  Потому что в конфиге агента у вас неправильные настройки сетевитости.
                  Server=192.168.*.* - ip сервера в сети(агент и сервер - все на одной машинке на Debian 10)
                  ListenIP=192.168.*.* - ip сервера в сети
                  ServerActive=127.0.0.1
                  Т.к. у вас "агент и сервер - все на одной машинке", должно быть так:
                  Code:
                  Server=127.0.0.1,::1
                  ServerActive=127.0.0.1
                  # ListenIP=0.0.0.0 - закомментируйте, т.к. gпо умолчанию агент слушает на всех интерфейсах, и (комментарий в конфиге) - "First IP address is sent to Zabbix server if connecting to it to retrieve list of active checks.").
                  Hostname=name pc <- имя здесь должно точно соответствовать "Имя узла сети" в настройках в "Узлах сети". По умолчанию zabbix при установке делает "для себя" имя "Zabbix server".

                  Comment

                  • m.ganichkin
                    Junior Member
                    • Jul 2019
                    • 19

                    #14
                    Originally posted by DSV12
                    Потому что в конфиге агента у вас неправильные настройки сетевитости.

                    Т.к. у вас "агент и сервер - все на одной машинке", должно быть так:
                    Code:
                    Server=127.0.0.1,::1
                    ServerActive=127.0.0.1
                    # ListenIP=0.0.0.0 - закомментируйте, т.к. gпо умолчанию агент слушает на всех интерфейсах, и (комментарий в конфиге) - "First IP address is sent to Zabbix server if connecting to it to retrieve list of active checks.").
                    Hostname=name pc <- имя здесь должно точно соответствовать "Имя узла сети" в настройках в "Узлах сети". По умолчанию zabbix при установке делает "для себя" имя "Zabbix server".
                    Низкий Вам поклон и всем, кто помогал - наконец-то статус проблемы приобрел состояние "РЕШЕНО". I'm very very happy! Вы просто гиганский булыжник психологического нервоза с меня сняли xD

                    P.S. Возможно кому-то пригодится: заметил до последней правки поста, что зачастую перезапуск zabbix сервера, агента и postgre - не всегда приводил к корректному результату примененных изменений, зачастую корректный "эффект" изенений применялся после полной перезагрузки машинки, подозреваю, что это связано с множеством вспомогательных служб заббикса, которые как-то сказываются на итоге, надеюсь со временем смогу это подробно объяснить технически...

                    Comment

                    Working...