3 SNMP агент
Обзор
Вы можете использовать мониторинг SNMP на таких устройствах, как принтеры, сетевые коммутаторы, маршрутизаторы или ИБП, которые обычно поддерживают SNMP и на которых было бы непрактично пытаться разворачивать полноценные операционные системы и агенты Zabbix.
Чтобы иметь возможность получать данные, предоставляемые SNMP-агентами на этих устройствах, сервер Zabbix должен быть предварительно настроен с поддержкой SNMP путем указания флага --with-net-snmp.
Также рекомендуется установить файлы MIB, чтобы значения элементов данных отображались в правильном формате.
Без файлов MIB могут возникать проблемы с форматированием, например отображение значений в HEX вместо UTF-8 или наоборот.
Проверки SNMP выполняются только по протоколу UDP.
Демоны сервера Zabbix и прокси записывают в журнал строки, подобные следующей, если получают некорректный ответ SNMP:
SNMP response from host "gateway" does not contain all of the requested variable bindings
Хотя они не охватывают все проблемные случаи, они полезны для выявления отдельных SNMP-устройств, для которых следует отключить комбинированные запросы.
Сервер Zabbix/прокси будет повторять попытки до 5 раз для элементов данных SNMP walk и get.
Механизм повторных попыток не применяется к ошибкам разрешения DNS.
Для устаревших проверок SNMP (одно число OID или строка) сервер Zabbix/прокси повторит попытку как минимум один раз после неудачного запроса: либо с помощью механизма повторных попыток библиотеки SNMP, либо с помощью внутреннего механизма комбинированной обработки.
При мониторинге устройств SNMPv3 убедитесь, что msgAuthoritativeEngineID (также известный как snmpEngineID или "Engine ID") никогда не используется совместно двумя устройствами. Согласно RFC 2571 (раздел 3.1.1.1), он должен быть уникальным для каждого устройства.
RFC3414 требует, чтобы устройства SNMPv3 сохраняли свои engineBoots. Некоторые устройства этого не делают, в результате чего их сообщения SNMP после перезапуска отбрасываются как устаревшие. В такой ситуации необходимо вручную очистить кэш SNMP на сервере/прокси (с помощью -R snmp_cache_reload) или перезапустить сервер/прокси.
Zabbix кэширует сопоставления SNMPv3 EngineID → IP и повторно использует кэшированные EngineID для последующих проверок вместо отправки probe каждый раз, уменьшая сетевой трафик. Если EngineID не может быть использован повторно, будет выполнена повторная попытка с probe для обнаружения нового EngineID.
Настройка мониторинга SNMP
Чтобы начать мониторинг устройства через SNMP, необходимо выполнить следующие шаги:
Шаг 1
Определите SNMP-строку (или OID) элемента данных, который вы хотите отслеживать.
Чтобы получить список SNMP-строк, используйте команду snmpwalk (часть программного обеспечения net-snmp, которое должно быть установлено в составе установки Zabbix) или аналогичный инструмент:
snmpwalk -v 2c -c public <host IP> .
Поскольку '2c' здесь обозначает версию SNMP, вы также можете заменить ее на '1', чтобы указать SNMP версии 1 на устройстве.
В результате вы должны получить список SNMP-строк и их последних значений. Если этого не происходит, возможно, что SNMP 'community' отличается от стандартного 'public'; в таком случае вам нужно выяснить, какое значение используется.
Затем вы можете просмотреть список, пока не найдете строку, которую хотите отслеживать, например,
если вы хотите отслеживать входящие байты на вашем коммутаторе на порту 3, вам следует использовать строку IF-MIB::ifHCInOctets.3 из этой строки:
IF-MIB::ifHCInOctets.3 = Counter64: 3409739121
Теперь вы можете использовать команду snmpget, чтобы узнать числовой OID для 'IF-MIB::ifHCInOctets.3':
snmpget -v 2c -c public -On <host IP> IF-MIB::ifHCInOctets.3
Обратите внимание, что последнее число в строке — это номер порта, который вы хотите отслеживать. См. также: Динамические индексы.
Это должно дать вам что-то вроде следующего:
.1.3.6.1.2.1.31.1.1.1.6.3 = Counter64: 3472126941
И снова, последнее число в OID — это номер порта.
Некоторые из наиболее часто используемых SNMP OID автоматически преобразуются в числовое представление в Zabbix.
В последнем примере выше тип значения — "Counter64", что внутренне соответствует типу ASN_COUNTER64. Полный список поддерживаемых типов: ASN_COUNTER, ASN_COUNTER64, ASN_UINTEGER, ASN_UNSIGNED64, ASN_INTEGER, ASN_INTEGER64, ASN_FLOAT, ASN_DOUBLE, ASN_TIMETICKS, ASN_GAUGE, ASN_IPADDRESS, ASN_OCTET_STR и ASN_OBJECT_ID. Эти типы приблизительно соответствуют "Counter32", "Counter64", "UInteger32", "INTEGER", "Float", "Double", "Timeticks", "Gauge32", "IpAddress", "OCTET STRING", "OBJECT IDENTIFIER" в выводе snmpget, но также могут отображаться как "STRING", "Hex-STRING", "OID" и другие, в зависимости от наличия display hint.
Шаг 2
Создайте узел сети, соответствующий устройству.

Добавьте SNMP-интерфейс для узла сети:
- Введите IP-адрес/DNS-имя и номер порта.
- Выберите версию SNMP в раскрывающемся списке.
- Добавьте учетные данные интерфейса в зависимости от выбранной версии SNMP:
- Для SNMPv1, v2 требуется только community (обычно 'public').
- Для SNMPv3 требуются более специфичные параметры (см. ниже).
- Укажите максимальное значение повторов (по умолчанию: 10) для нативных SNMP bulk-запросов (GetBulkRequest-PDU); только для элементов данных
discovery[]иwalk[]в SNMPv2 и v3. Обратите внимание, что слишком большое значение может привести к тайм-ауту проверки SNMP-агента. - Отметьте флажок Использовать объединенные запросы, чтобы разрешить объединенную обработку SNMP-запросов (не относится к нативным SNMP bulk-запросам "walk" и "get").
| Параметр SNMPv3 | Описание |
|---|---|
| Context name | Введите имя контекста для идентификации элемента в SNMP-подсети. Пользовательские макросы в этом поле подставляются. |
| Security name | Введите имя безопасности. Пользовательские макросы в этом поле подставляются. |
| Security level | Выберите уровень безопасности: noAuthNoPriv - не используются ни протокол аутентификации, ни протокол конфиденциальности AuthNoPriv - используется протокол аутентификации, протокол конфиденциальности не используется AuthPriv - используются и протокол аутентификации, и протокол конфиденциальности |
| Authentication protocol | Выберите протокол аутентификации - MD5, SHA1; с net-snmp 5.8 и новее - SHA224, SHA256, SHA384 или SHA512. |
| Authentication passphrase | Введите парольную фразу аутентификации. Пользовательские макросы в этом поле подставляются. |
| Privacy protocol | Выберите протокол конфиденциальности - DES, AES128, AES192, AES256, AES192C (Cisco) или AES256C (Cisco). См. примечания о поддержке протокола конфиденциальности |
| Privacy passphrase | Введите парольную фразу конфиденциальности. Пользовательские макросы в этом поле подставляются. |
В случае неверных учетных данных SNMPv3 (security name, authentication protocol/passphrase, privacy protocol):
- Zabbix получает ERROR от net-snmp, за исключением неверной Privacy passphrase, в этом случае Zabbix получает ошибку TIMEOUT от net-snmp.
- Доступность SNMP-интерфейса изменится на красный цвет (недоступен).
Изменения в Authentication protocol, Authentication passphrase, Privacy protocol или Privacy passphrase, внесенные без изменения Security name, обычно применяются автоматически при обновлении соответствующего SNMPv3-интерфейса в Zabbix. Если также изменяется Security name, все параметры будут обновлены немедленно.
Вы можете использовать один из предоставленных SNMP-шаблонов, который автоматически добавит набор элементов данных. Перед использованием шаблона убедитесь, что он совместим с узлом сети.
Нажмите Add, чтобы сохранить узел сети.
Поддержка протоколов конфиденциальности
В зависимости от вашей операционной системы и конфигурации net-snmp некоторые протоколы конфиденциальности могут быть недоступны:
-
В некоторых новых операционных системах (например, RHEL9) поддержка DES исключена из пакета net-snmp.
-
Протоколы шифрования AES192 и более сильные не поддерживаются «из коробки» в операционных системах старше RHEL 8, CentOS 8, Oracle Linux 8, Debian 12, Ubuntu LTS 22.04, openSUSE Leap 15.5.
Чтобы проверить, поддерживает ли библиотека net-snmp AES192+, используйте один из следующих вариантов:
net-snmp-config:
net-snmp-config --configure-options
Если вывод содержит --enable-blumenthal-aes, AES192+ поддерживается.
Обратите внимание, что net-snmp-config является частью пакета разработки для SNMP (libsnmp-dev для Debian/Ubuntu, net-snmp-devel для CentOS/RHEL/OL/SUSE) и может быть не установлен по умолчанию.
snmpget:
snmpget -v 3 -x AES-256
Если вывод содержит Invalid privacy protocol specified after -3x flag: AES-256, AES192+ не поддерживается.
Если вывод содержит No hostname specified., AES192+ не поддерживается.
Если ваша библиотека net-snmp не поддерживает протоколы AES192 и выше, перекомпилируйте net-snmp с параметром --enable-blumenthal-aes, затем перекомпилируйте сервер Zabbix, указав параметр --with-net-snmp=/home/user/yourcustomnetsnmp/bin/net-snmp-config.
Шаг 3
Создайте элемент данных для мониторинга.
Теперь вернитесь в Zabbix и нажмите Items для SNMP-узла сети, который вы создали ранее. В зависимости от того, использовали ли вы шаблон при создании узла сети, у вас будет либо список SNMP-элементов данных, связанных с вашим узлом сети, либо просто пустой список. Мы будем исходить из того, что вы собираетесь создать элемент данных самостоятельно, используя информацию, которую только что получили с помощью snmpwalk и snmpget, поэтому нажмите Create item.
Заполните обязательные параметры в новой форме элемента данных:

| Parameter | Description |
|---|---|
| Name | Введите имя элемента данных. |
| Type | Выберите здесь SNMP agent. |
| Key | Введите ключ, чтобы он был понятным. |
| Host interface | Обязательно выберите SNMP-интерфейс, например вашего коммутатора/маршрутизатора. |
| SNMP OID | Используйте один из поддерживаемых форматов для ввода значения(й) OID: walk[OID1,OID2,...] - получить поддерево значений. Например: walk[1.3.6.1.2.1.2.2.1.2,1.3.6.1.2.1.2.2.1.3].Этот вариант использует нативные bulk-запросы SNMP (GetBulkRequest-PDU) асинхронно. Параметры тайм-аута для этого элемента данных можно задать в форме настройки элемента данных. Рекомендуется установить небольшое значение тайм-аута, чтобы избежать длительных задержек, если устройство недоступно, поскольку при истечении тайм-аута или сбое предыдущих попыток будет выполнено до 5 повторов (например, тайм-аут 3 секунды может привести к ожиданию в 15 секунд). Вы можете использовать его как основной элемент данных, а зависимые элементы данных будут извлекать данные из основного с помощью предварительной обработки. Можно указать несколько OID в одном snmp walk, например walk[OID1,OID2,...], чтобы асинхронно обрабатывать по одному OID за раз.Если bulk-запрос не возвращает результатов, выполняется попытка получить одну запись без bulk-запроса. В качестве параметров поддерживаются имена MIB; таким образом, walk[1.3.6.1.2.1.2.2.1.2] и walk[ifDescr] вернут одинаковый результат.Если указано несколько OID/MIB, например walk[ifDescr,ifType,ifPhysAddress], то вывод будет представлять собой объединенный список.Запросы GetBulk используются с интерфейсами SNMPv2 и v3, а GetNext - для интерфейсов SNMPv1; максимальное число повторений для bulk-запросов настраивается на уровне интерфейса. Параметр max repetitions влияет на bulk-запросы, определяя максимальное количество OID, возвращаемых в одном bulk-ответе. Большее значение приводит к более крупным bulk-ответам, уменьшая количество необходимых передач. Однако не все устройства могут поддерживать очень высокие значения, что может вызвать проблемы. Этот элемент данных возвращает вывод утилиты snmpwalk с параметрами -Oe -Ot -On. Вы можете использовать этот элемент данных как основной в SNMP discovery. get[OID] - получить одно значение асинхронно. Например: get[1.3.6.1.2.1.31.1.1.1.6.3]Параметры тайм-аута для этого элемента данных можно задать в форме настройки элемента данных. Рекомендуется установить небольшое значение тайм-аута, чтобы избежать длительных задержек, если устройство недоступно, поскольку при истечении тайм-аута или сбое предыдущих попыток будет выполнено до 5 повторов (например, тайм-аут 3 секунды может привести к ожиданию в 15 секунд). OID - (устаревший вариант) введите один текстовый или числовой OID для получения одного значения синхронно, при необходимости в сочетании с другими значениями. Например: 1.3.6.1.2.1.31.1.1.1.6.3.Для этого варианта тайм-аут проверки элемента данных будет равен значению, заданному в файле конфигурации сервера. Рекомендуется использовать элементы данных walk[OID] и get[OID] для лучшей производительности. Все элементы данных walk[OID] и get[OID] выполняются асинхронно - не требуется получать ответ на один запрос до начала других проверок. Разрешение DNS также выполняется асинхронно.Максимальная параллельность асинхронных проверок составляет 1000 (определяется параметром MaxConcurrentChecksPerPoller). Количество асинхронных SNMP-опросчиков определяется параметром StartSNMPPollers. Обратите внимание, что для статистики сетевого трафика, возвращаемой любым из методов, на вкладке Preprocessing необходимо добавить шаг Change per second; в противном случае вы получите накопительное значение от SNMP-устройства вместо последнего изменения. |
Все обязательные поля ввода отмечены красной звездочкой.
Теперь сохраните элемент данных и перейдите в Monitoring > Latest data для ваших SNMP-данных.
Пример 1
Общий пример:
| Параметр | Описание |
|---|---|
| OID | 1.2.3.45.6.7.8.0 (или .1.2.3.45.6.7.8.0) |
| Ключ | <Уникальная строка, используемая как ссылка на триггеры> Например, "my_param". |
Обратите внимание, что OID может быть указан как в числовой, так и в строковой форме. Однако в некоторых случаях строковый OID необходимо преобразовать в числовое представление. Для этой цели можно использовать утилиту snmpget:
snmpget -On localhost public enterprises.ucdavis.memory.memTotalSwap.0
Пример 2
Мониторинг времени работы:
| Параметр | Описание |
|---|---|
| OID | MIB::sysUpTime.0 |
| Ключ | router.uptime |
| Тип информации | Числовой (с плавающей точкой) |
| Единица измерения | uptime |
| Множитель | 0.01 |
Встроенные SNMP bulk-запросы
Элемент данных walk[OID1,OID2,...] позволяет использовать встроенную функциональность SNMP для bulk-запросов (GetBulkRequest-PDUs), доступную в SNMP версий 2/3.
Запрос GetBulk в SNMP выполняет несколько запросов GetNext и возвращает результат в одном ответе. Это может использоваться как для обычных SNMP-элементов данных, так и для SNMP-обнаружения, чтобы минимизировать количество сетевых обменов.
SNMP-элемент данных walk[OID1,OID2,...] может использоваться как основной элемент данных, который собирает данные одним запросом, с зависимыми элементами данных, разбирающими ответ по мере необходимости с помощью предобработки.
Обратите внимание, что использование встроенных SNMP bulk-запросов не связано с опцией объединения SNMP-запросов, которая является собственным способом Zabbix объединять несколько SNMP-запросов (см. следующий раздел).
Для SNMP bulk-элементов данных будет выполнено до пяти повторных попыток, чтобы избежать сбоя, если один из пакетов будет потерян.
Тайм-аут для SNMP-элементов данных с get и walk (задается в форме настройки элемента данных) устанавливается для всей сессии.
Тайм-аут применяется независимо от того, получены ли данные полностью; если данные получены частично (например, данные успешно собраны только для одного из нескольких OID), то элемент данных становится неподдерживаемым с сообщением "Only partial data received".
Если достигнут тайм-аут, будет выполнена повторная попытка, тайм-аут будет сброшен, а последний запрос будет отправлен повторно, что позволит продолжить сессию с последнего запроса, если один пакет был потерян или пришел слишком поздно.
Рекомендуется устанавливать небольшое значение тайм-аута, чтобы избежать длительных задержек, если устройство недоступно, так как будет выполнено до 5 повторных попыток, если предыдущие завершились по тайм-ауту или неудачей (например, тайм-аут 3 секунды может привести к ожиданию в 15 секунд).
Внутренние принципы комбинированной обработки
Сервер и прокси Zabbix могут запрашивать SNMP-устройства на получение нескольких значений в одном запросе. Это влияет на несколько типов SNMP-элементов данных:
- обычные SNMP-элементы данных
- SNMP-элементы данных с динамическими индексами
- SNMP правила обнаружения низкого уровня
Все SNMP-элементы данных на одном интерфейсе с одинаковыми параметрами планируются к опросу одновременно. Первые два типа элементов данных опрашиваются poller'ами пакетами не более чем по 128 элементов, тогда как правила обнаружения низкого уровня обрабатываются по одному, как и раньше.
На нижнем уровне для запроса значений выполняются два вида операций: получение нескольких указанных объектов и обход дерева OID.
Для "getting" используется GetRequest-PDU с не более чем 128 привязками переменных. Для "walking" используется GetNextRequest-PDU для SNMPv1, а для SNMPv2 и SNMPv3 используется GetBulkRequest с полем "max-repetitions" не более 128.
Таким образом, преимущества комбинированной обработки для каждого типа SNMP-элементов данных описаны ниже:
- обычные SNMP-элементы данных выигрывают от улучшений "getting";
- SNMP-элементы данных с динамическими индексами выигрывают как от улучшений "getting", так и от улучшений "walking": "getting" используется для проверки индексов, а "walking" - для построения кэша;
- SNMP-правила обнаружения низкого уровня выигрывают от улучшений "walking".
Однако существует техническая проблема: не все устройства способны возвращать 128 значений за один запрос. Некоторые всегда возвращают корректный ответ, но другие либо отвечают ошибкой "tooBig(1)", либо вообще не отвечают, если потенциальный ответ превышает определенный предел.
Чтобы определить оптимальное число объектов для запроса к конкретному устройству, Zabbix использует следующую стратегию. Он начинает осторожно с запроса 1 значения за один запрос. Если это успешно, он запрашивает 2 значения за один запрос. Если это снова успешно, он запрашивает 3 значения за один запрос и далее аналогично увеличивает число запрашиваемых объектов в 1,5 раза, что дает следующую последовательность размеров запросов: 1, 2, 3, 4, 6, 9, 13, 19, 28, 42, 63, 94, 128.
Однако как только устройство перестает возвращать корректный ответ (например, для 42 переменных), Zabbix делает две вещи.
Во-первых, для текущего пакета элементов данных он уменьшает вдвое число объектов в одном запросе и запрашивает 21 переменную. Если устройство доступно, запрос должен сработать в подавляющем большинстве случаев, поскольку 28 переменных уже были успешно опрошены, а 21 - это значительно меньше. Однако если и это не срабатывает, Zabbix переходит к запросу значений по одному. Если и после этого запросы продолжают не выполняться, значит устройство определенно не отвечает, и размер запроса уже не имеет значения.
Во-вторых, для последующих пакетов элементов данных Zabbix начинает с последнего успешного числа переменных (28 в нашем примере) и продолжает увеличивать размер запроса на 1, пока не будет достигнут предел. Например, если максимальный размер ответа составляет 32 переменные, последующие запросы будут иметь размеры 29, 30, 31, 32 и 33. Последний запрос завершится неудачей, и Zabbix больше никогда не будет отправлять запрос размером 33. С этого момента Zabbix будет запрашивать для этого устройства не более 32 переменных.
Если большие запросы с таким числом переменных не выполняются, это может означать одно из двух. Точные критерии, которые устройство использует для ограничения размера ответа, неизвестны, но мы пытаемся приблизительно оценить их по числу переменных. Поэтому первая возможность заключается в том, что это число переменных примерно соответствует фактическому пределу размера ответа устройства в общем случае: иногда ответ меньше предела, иногда больше. Вторая возможность заключается в том, что UDP-пакет в одном из направлений просто был потерян. По этим причинам, если Zabbix получает неудачный запрос, он уменьшает максимальное число переменных, чтобы попытаться глубже попасть в комфортный диапазон устройства, но не более двух раз.
В приведенном выше примере, если запрос с 32 переменными случайно завершится неудачей, Zabbix уменьшит число до 31. Если и это тоже завершится неудачей, Zabbix уменьшит число до 30. Однако Zabbix не будет уменьшать число ниже 30, поскольку будет считать, что дальнейшие сбои связаны с потерей UDP-пакетов, а не с ограничением устройства.
Если же устройство по другим причинам не может корректно обрабатывать комбинированные запросы и описанная выше эвристика не работает, для каждого интерфейса предусмотрена настройка "Use combined requests", позволяющая отключить комбинированные запросы для этого устройства.
Если комбинированные запросы приводят к частичным или некорректным ответам, из-за которых неверно рассчитываются значения per-second (delta) (например, появляются ложные всплески в счетчиках интерфейса), отключите Use combined requests для затронутого интерфейса, чтобы принудительно выполнять отдельные запросы для каждого элемента данных; это часто предотвращает ложные всплески.
В качестве альтернативы можно использовать асинхронные элементы данных get[] или walk[], которые выполняются асинхронно и не подпадают под пакетирование по интерфейсу Use combined requests — их можно использовать вместо устаревших синхронных проверок OID, чтобы избежать проблем, связанных с комбинированными запросами.
Ищите в журналах сервера/прокси записи, похожие на приведенную в разделе Обзор, чтобы помочь определить затронутые устройства.
Кроме того, если интерфейс часто становится недоступным, может потребоваться увеличить параметр UnavailableDelay в файлах конфигурации сервера Zabbix или прокси Zabbix, чтобы снизить частоту запросов.
Элементы данных могут стать неподдерживаемыми, если во время обнаружения или обхода OID получены неполные данные.