PDA

View Full Version : Branch for users knowing only Russian.


AlexWhite
11-09-2006, 14:21
Probably to make a branch in which it would be possible to communicate in Russian?

Alexei
12-09-2006, 08:48
I'm ok to do this if you find at least ten interested ZABBIX users :)

Я ето сделаю если увижу как минимум 10 заинтересованных человек :)

AlexWhite
12-09-2006, 10:17
Создал голосование. Пусть выскажутся и проголосуют. :)

AlexWhite
12-09-2006, 15:10
А вопросы на русском можно задавать? А то тяжелова-то иногда объяснять что хочу спросить.

А то вот у меня расхождение в показании свободного места на /var
На графике показывает 1.72Мб. А реально 1.72Гб (параметр "Free disk space on /var" шаблон Unix_t)

den_crane
13-09-2006, 11:10
А вопросы на русском можно задавать? А то тяжелова-то иногда объяснять что хочу спросить.

А то вот у меня расхождение в показании свободного места на /var
На графике показывает 1.72Мб. А реально 1.72Гб (параметр "Free disk space on /var" шаблон Unix_t)unit поставь B, multiplier убери.

AlexWhite
13-09-2006, 11:22
unit поставь B, multiplier убери.
Попробовал, ничего не изменилось.
А вот еще один такой как я. Free disk space values (1000x) wrong (http://www.zabbix.com/forum/showthread.php?t=3980) Посмотрим, что будет сказано.
Ну хватит тут флейм разводить. А то можно и бан получить. ;)
Будем ждать что скажет админ. Или создаст отдельную ветку для таких обменов. Либо разрешит посты на русском в английских ветках (но это не есть хорошо)

ShivaS
27-09-2006, 16:38
u menya net problem chitat'...no moi translit chitat' nikto ne zahochet a po russki ya ne hochu napragatsya daje s progami pisat' i chinilkami..
na translite ya kak na english - blind typing.
a prichina v tom shto ya davno ne jivu v rossii..i slang computerny u menya tolko na english...
no esli Vam eto ne pomeha to ya progolosuu 3A ;-)

ShivaS
27-09-2006, 18:37
Попробовал, ничего не изменилось.
А вот еще один такой как я. Free disk space values (1000x) wrong (http://www.zabbix.com/forum/showthread.php?t=3980) Посмотрим, что будет сказано.
Ну хватит тут флейм разводить. А то можно и бан получить. ;)
Будем ждать что скажет админ. Или создаст отдельную ветку для таких обменов. Либо разрешит посты на русском в английских ветках (но это не есть хорошо)

I got same prob btw. 50 servers show GB and only 2 show MB...dunno why..servers are all the same.

Andrew
22-02-2007, 19:33
I'm ok to do this if you find at least ten interested ZABBIX users :)

Я ето сделаю если увижу как минимум 10 заинтересованных человек :)
Хм. Ну, можно сказать - ф дисятке. Осталось трое

gag
25-02-2007, 13:39
А что голосовалка ? Заморожена по таймауту ?
Я, вроде, тоже "в десятке". Продукт отличный. Хотя плохому админу он не нужен, а нормальному легче с англоязычными терминами разобраться...
Однако, я готов попереводить странички данного сайта в Wiki, в виде ответной услуги автору. Реклама на русском точно не помешает!

Alexei
25-02-2007, 13:58
На следущей неделе попытаемся объединить Forum и Wiki (одинаковая авторизация) - будет проще...

arruah
02-05-2007, 15:02
Я бы тоже с удовольствием проголосовал.

BorisL
13-05-2007, 13:07
+1 что ли...

SoloD
25-06-2007, 09:33
Меня тоже приплюсуйте

gescheit
20-07-2007, 10:04
Я бы тоже проголосовал. Еще бы рссы прикрутили на сайте :-/

Alexei
20-07-2007, 14:01
Я бы тоже проголосовал. Еще бы рссы прикрутили на сайте :-/
Смотрите FAQ. RSS уже существует.

gescheit
21-07-2007, 10:03
Тончо. Привык уже к тому что Iceweasel показывает что на сайте есть RSS :)

mrDevil
01-08-2007, 12:26
поддерживаю +1

maksim
18-10-2007, 07:16
а тема заглохла?

gescheit
21-11-2007, 08:51
угу, тут похоже всё заглохло:(

flycat
22-04-2008, 10:25
Не заглохло. Хотя, каких-то дополнительных объяснений на русском мне не надо. Скорее, наоборот. Если кому интересно, пытаюсь сам писать на русском: http://flycat.info/tag/zabbix/ - буду рад отзывам и предложениям.

I write about zabbix in Russian. You are welcome to read, write and feedback!

xs-
30-05-2008, 15:14
Although i understand this would be more convenient for people unable to read/write english, but it would be similarly inconvenient if solutions to problems or good ideas would only be available in the russian section which leaves the rest of us unable to benefit from this info.
Just my 2 cents.

Alexei
02-06-2008, 13:05
Although i understand this would be more convenient for people unable to read/write english, but it would be similarly inconvenient if solutions to problems or good ideas would only be available in the russian section which leaves the rest of us unable to benefit from this info.
Just my 2 cents.
I agree. However if one knows only Russian (Spanish, German, whatever), we have absolutely no chance to hear anything in English from him, right? Besides there is a great chance than valuable information posted in non-English forum will be eventually translated...

Hober
15-01-2009, 09:34
Всем привет!
Может кто поможет( c англицким туго, решил тут написать )
Собственно у меня несколько вопросов:
(Пока я тока разбираюсь и разворачиваю клиенты на сервера )
1. Возможности заббикса? а именно, сейчас пока в тествомо режиме реализовал опрос виндовых машин по wmi ( тупо выполняется внешний скрипт, на сервере с заббиксом ). В документации написано "Do not oversuse external checks! it can decrease perfomance for zabbix system very mutch". Насколько это критично? Мониторить собираюсь около 200 ( до 40 внешних скриптов ) windows серверов и 500 linux ( до 20 внешних скриптов ). Насколько это будет критично к производительности zabbix-а?
2. Клиент 2 раза свалился в даун. В логах:
3952:20090112:120027 One child process died. Exiting ...
3952:20090112:120029 ZABBIX Agent stopped. ZABBIX 1.6.1.
Дебаг левел поднять под 4, не имеется технической возможности. Причем свалился после 2ух суток работы. На этом хосте выполняются 4 команды через system.run[]. Одна чекалка рейда, другие - температура, куллера. Остальное все стандарт.
Может из-за этого?
3. По действиям:
Будут ли расширены возможности для описания действиий "Action conditions". Хотелось бы самому задавать условия, например (A AND B) OR ((D AND C) AND (E OR M)).

gescheit
15-01-2009, 10:54
Тут зависит от того как часто запускаешь скрипты. У меня где-то раз через 5 секунд запускается и ничего, справляется. Только вот нельзя задать большой таймаут для скриптов, что иногда нужно было. А то что заббикс падает это нормально:)

Alexei
15-01-2009, 17:38
А то что заббикс падает это нормально:)
Это абсолютно не нормально! Если такое происходит, сообщайте нам на любом языке. Интересуют логи агента при Debug=4.

dotneft
15-01-2009, 18:37
Удивлен, незамечал, что здесь есть русскоязычная ветка)
Начну издалека:)

Хотел бы выразить благодарность разработчикам ZABBIX за столь интересный продукт с куууучей возможностей. Хотелось бы, чтобы в дальнейшем темпы по разработке не сбавлялись;)

В нашей компании планируется крупномасштабное использование zabbix. Ориентировочно около 400-500 серверов разноудаленных друг от друга. Соответственно платформа была выбрана очень основательная с выделенной базой данных Oracle. В данный момент на сервере устанлена branch версия 1.6.1.

Найденные баги:
Похоже заббикс не оптимизировался для работы с Oracle, ну да ладно)
Имеется проблема с discovery, при обнаружении хоста и связывании его с шаблоном через actions имеется ошибка Oracle о недопустимости символа ";" у begin и commit. Проблема решилась исправлением "begin;" и "commit;" в файле src/zabbix_server/operations.c, убрал ";". Думаю это не унифицированное решение, но нам подойдет) надеюсь в будущей версии это будет исправлено.
Теперь появилась ошибка Oracle:

15396:20090113:154218 [Z3005] Query failed: [0] ORA-06550: line 1, column 5:
PLS-00103: Encountered the symbol "end-of-file" when expecting one of the following:

begin case declare exit for goto if loop mod null pragma
raise return select update while with <an identifier>
<a double-quoted delimited-identifier> <a bind variable> <<
close current delete fetch lock insert open rollback
savepoint set sql execute commit forall merge pipe
[begin]
15318:20090113:154221 Enabling host [10.100.189.244]
15318:20090113:154221 Expression [({13731}=1)&({13730}=1)] for item [24070][???] cannot be evaluated: unable to get function value: lastvalue IS NULL for fu$

Найти проблему в коде так и не удалось. Если потребуется дебаг лог выложу.

Также планируется использование DM. В англоязычной версии мне никто не отвечает, наверное из-за моего английского) спросим тут.
1) Допустим прокси заббикса стал недоступен на удаленном узле связи, тогда возникает вопрос, будет ли прокси сам собирать и аккумулировать данные до восстановления связи с заббикс сервером?
2) В документации нашел сначала, что прокси сервер не поддерживает Oracle, потом, что поддерживает. Чему верить?
3) Какой трафик будет генерироваться между прокси сервером и заббикс сервером при учете, что прокси сервер будет проверять около 5000-10000 элементов?
4) Какое из решений более стабильное nodes или прокси? Впринципе устраивают возможности и того и другого:)
5) Что означает фраза в документации "Ready for embedded hardware"?
6) Возможно ли сервер, который уже находится в продакшне преобразовать в мастер node?


PS: я создал патч, в котором добавлены в en_gb и ru_ru все возможные ошибки, уведомления и т.п. Хотелось бы узнать имеет будет ли он добавлен к branch версии? Требуется ли мне продолжать эту затею? Нужно ли сделать то же самое для trunk версии?

PSS: Имеется мануал для установки и настройки zabbix совместно с Oracle на Gentoo 64 битную. Если потребуется могу выложить. Правда только на англ языке. И имеется инструкция по настройке заббикс для snmp trap через snmptt)

Alexei
15-01-2009, 20:27
Также планируется использование DM. В англоязычной версии мне никто не отвечает, наверное из-за моего английского) спросим тут.

Дело, вероятно, не в английском. Не всегда руки доходят до написания ответов, а на сложные вопросы немногие могут ответить.

1) Допустим прокси заббикса стал недоступен на удаленном узле связи, тогда возникает вопрос, будет ли прокси сам собирать и аккумулировать данные до восстановления связи с заббикс сервером?

Конечно! Причем максимальное количество данных и период за который они собираются в режиме offline конфигурируется. При востановлении связи прокси все отсылает на сервер, постепенно.

2) В документации нашел сначала, что прокси сервер не поддерживает Oracle, потом, что поддерживает. Чему верить?

Прокси поддерживает все базы данных, что и сервер: Oracle, MySQL, PostgreSQL, Sqlite.

3) Какой трафик будет генерироваться между прокси сервером и заббикс сервером при учете, что прокси сервер будет проверять около 5000-10000 элементов?

Дело не в количестве элементов, а в количестве данных.

4) Какое из решений более стабильное nodes или прокси? Впринципе устраивают возможности и того и другого:)

Рекомендую использовать прокси. Nodes требуют большего труда, лучшего железа, возможны сложности (административного характера) при апгрейдах.

5) Что означает фраза в документации "Ready for embedded hardware"?

Это про использование связки прокси+sqlite. Минимум требуемых ресурсов (CPU, memory, etc).

6) Возможно ли сервер, который уже находится в продакшне преобразовать в мастер node?

Да, но есть несколько "тонкостей". :)

PS: я создал патч, в котором добавлены в en_gb и ru_ru все возможные ошибки, уведомления и т.п. Хотелось бы узнать имеет будет ли он добавлен к branch версии? Требуется ли мне продолжать эту затею? Нужно ли сделать то же самое для trunk версии?

Конечно, будем только рады!

PSS: Имеется мануал для установки и настройки zabbix совместно с Oracle на Gentoo 64 битную. Если потребуется могу выложить. Правда только на англ языке. И имеется инструкция по настройке заббикс для snmp trap через snmptt)
Wiki - как раз для этого! :)

dotneft
16-01-2009, 11:25
Спасибо, за столько скорый ответ;)
Вопросов больше нет.

Мануалы выложу где-то в течении месяца...сессия:(
Патч на локализации добавл в раздел Патчей:)

dotneft
16-01-2009, 17:46
Возможно создавать итемы на основые формулы?

Например:
Имеется итем1 и итем2

итем3=итем1/итем2

Alexei
16-01-2009, 17:57
Возможно создавать итемы на основые формулы?

Например:
Имеется итем1 и итем2

итем3=итем1/итем2
Нет, пока не возможно.

Hober
19-01-2009, 09:52
Кстати, у всех с кодировкой все в порядке?
CentOS 5.2, локаль UTF8
Zabbix 1.6.2
MySQL, локаль UTF8:
mysql> show variables like 'char%';
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | utf8 |
| character_set_connection | utf8 |
| character_set_database | utf8 |
| character_set_filesystem | binary |
| character_set_results | utf8 |
| character_set_server | utf8 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+


В "Последние данные,тригеры" все отлично с русским. В графиках непонятки ( скриншот ). Тестил как на 1.6.2, так и на 1.7 вчерашней сборки.
Также проблемы с кодировкой в "Действия", а именно кодировка макросов. Если ручками вводить текст, то все нормально, а если макрос ( допустим имя тригера на русском ), то проблемы.


Еще один вопрос.
Поставил DisableActive=0
( я так подразумеваю это надо для trapper )
В логах агента сыпется
" 25099:20090119:134800 Can't parse list of active checks. Can't open JSON object ""
Не могу понять в чем проблема.

dotneft
19-01-2009, 15:24
Кстати, у всех с кодировкой все в порядке?
CentOS 5.2, локаль UTF8
Zabbix 1.6.2
MySQL, локаль UTF8:
В "Последние данные,тригеры" все отлично с русским. В графиках непонятки ( скриншот ). Тестил как на 1.6.2, так и на 1.7 вчерашней сборки.
Также проблемы с кодировкой в "Действия", а именно кодировка макросов. Если ручками вводить текст, то все нормально, а если макрос ( допустим имя тригера на русском ), то проблемы.


тоже самое и в тех же местах:) видимо еще не доконца реализована поддержка UTF8, т.к. судя по планам разработчиков имеется пункт "Full support of UTF8"

dotneft
20-01-2009, 06:56
Заинтересовал один момент в заббиксе...Принцип построения графиков.
Вот например график трех элементов за неделю:
см. снизу поста справа
По графику видим, что немногим больше 35 и меньше 42, хотя по легенде графика максимальное значение элементов 60.

Теперь тот же самый график только за день (из этой же недели, что и на графике выше):
см. снизу поста слева
Значения на графике уже ближе к реальности, т.е. на графике видим, что приближаемся к отметке 60.

Соответственно возникает вопрос. Почему имеется расхождение м/у максимальным значением за неделю и за день на графиках? Хотя в легенде все верно.

Hober
20-01-2009, 09:47
Заинтересовал один момент в заббиксе...Принцип построения графиков.
Вот например график трех элементов за неделю:
см. снизу поста справа
По графику видим, что немногим больше 35 и меньше 42, хотя по легенде графика максимальное значение элементов 60.

Теперь тот же самый график только за день (из этой же недели, что и на графике выше):
см. снизу поста слева
Значения на графике уже ближе к реальности, т.е. на графике видим, что приближаемся к отметке 60.

Соответственно возникает вопрос. Почему имеется расхождение м/у максимальным значением за неделю и за день на графиках? Хотя в легенде все верно.

Кстати да, тоже это заметил.
У меня еще один вопросик. Нужно собирать данные не зависимо от того, есть ли связь с zabbix сервером или нету ( при появлении, сразу отправлять ). Возможно ли это?

dotneft
20-01-2009, 09:51
У меня еще один вопросик. Нужно собирать данные не зависимо от того, есть ли связь с zabbix сервером или нету ( при появлении, сразу отправлять ). Возможно ли это?

я уже спрашивал это посмотри на несколько постов раннее

Hober
20-01-2009, 09:55
я уже спрашивал это посмотри на несколько постов раннее

Уже разобрался:)) Работает отлично.

Aly
22-01-2009, 14:38
Ну так вы и выбрали отображать средние значения, а не максимальные. Данные на графике за неделю, скорее всего усреднённые по часам.

З.Ы. По теме отображения кирилицы на графиках, тема поднималсь на форуме не однократно, поищите, там же, скорее всего, вы найдёте ответы почему не все макросы работают.

dotneft
22-01-2009, 21:34
Ну так вы и выбрали отображать средние значения, а не максимальные. Данные на графике за неделю, скорее всего усреднённые по часам.

З.Ы. По теме отображения кирилицы на графиках, тема поднималсь на форуме не однократно, поищите, там же, скорее всего, вы найдёте ответы почему не все макросы работают.

хм...панятно. Спасибо;)

ЗЫ: будет ли встроенная поддержка кирилицы в графиках и картах?

Aly
23-01-2009, 13:47
Будет. А будет тогда, когда серверный код ноучится правильно обрабатывать мултибайтовые строки, тогда и БД будет переведена в Utf и графы с мапами.

dotneft
23-01-2009, 15:20
Будет. А будет тогда, когда серверный код ноучится правильно обрабатывать мултибайтовые строки, тогда и БД будет переведена в Utf и графы с мапами.

Понял) Вопросов больше не имею:)

dotneft
26-01-2009, 16:05
Все таки есть один)

Понадобилось мне запихать рисунок графика в другую страницу...имеется ли у заббикса возможность экспорта графиков?

Т.е. есть сторонняя страница в которой имеется график из заббикса, брать его допустим по graph id и диапазон за последний час.

все разобрался:)
может кому понадобится:
http://хост/chart2.php?groupid=7&hostid=10059&graphid=455&period=36000

из уже созданных графиков:) посмотреть параметры (hostid, groupid, graphid, period) можно в графиках выбрав хост и график, который требуется

nrg
29-01-2009, 20:11
Всем привет :)
А голосование больше не работает ? :(

Hober
10-02-2009, 12:54
Несколько вопросиков возникло, может кто поможет.

1. Производительность, ну этот вопрос довольно обширный и сложный.
Дано: 70 прокси, каждый пока обслуживает 2 хоста ( себя и соседний хост ).
Итого 140 хостов.
Пока что 1400 тригеров.
7000 тыс элементов ( в среднем 30 секунд обновление. На хост приблизительно 70 элементов данных ).


Смотрю очередь:
Элементы данных 5 секунд 10 секунд 30 секунд 1 минута 5 минут Более 10 минут
ZABBIX агент 1 0 0 6 10 3734
ZABBIX агент (активный) 1 4 3 66 0 1703

Итого около 6000 элементов данных. Откуда она получается? Я так подразумеваю не все данных обрабатываются. Какие параметры надо в конфиге сервера поменять? StartPollers?

смотрю детали ( на половине элементов ):
Следующая проверка:
01.01.1970 03:00:00
Это как?:)

Настройки сервера:
StartPollers=25
StartPollersUnreachable=5
StartPingers=5
StartHTTPPollers=1
Как правильно выставить данные параметры? От чего они зависят? Я в документации нашел инфу только о том, как вычислить свободное место.

Загрузка mysql под 100% всех 4-ех ядер.

Тюнинговал,
mysql.cnf
long_query_time = 5
key_buffer_size = 256M
thread_cache_size = 8M
query_cache_size = 256M
query_cache_limit = 256M
table_cache = 256M
max_connections = 200
join_buffer_size = 16M
tmp_table_size = 256M
max_heap_table_size = 256M
innodb_buffer_pool_size = 1500M


Теперь что касается самого сервера:
70 Прокси ( ПО, железо: один в один, различаются только настройки ).
Вот тут самое интерессное:

Смотрю узлы сети. 65 узлов нормально контролируются, на 5-ти оставшихся непонятные проблемы:
1. Пишет хост доступен, но
в последних данных
Host status - -
Хотя, связи с ним нету.

Элемент:
TMP - Linux - Base:Host status status 60 7 365 ZABBIX агент Активен Hostname -

2. Пишет хост не доступен
Get value from agent failed: ZBX_TCP_READ() failed [Interrupted system call]
Хотя связь с ним есть. В логах ничего не нашел.

Все собирается, кроме Host status ( причем это все после установки proxy и переезд на них )

Host status 09 Feb 15:13:47 Unreachable (2)
Host uptime (in sec) 10 Feb 13:50:31 4 days, 04:31:14

Alexei
10-02-2009, 13:24
Итого около 6000 элементов данных. Откуда она получается? Я так подразумеваю не все данных обрабатываются. Какие параметры надо в конфиге сервера поменять? StartPollers?

Очень коротко. Poller'ы вообще не участвуют в обработке данных с Proxy. Если Zabbix Server сам не занимается мониторингом устройств, то:

StartPollers=0
StartTrappers=100

Если занимается, то:

StartPollers=4
StartTrappers=100

В my.cnf:

max_connections=256

Hober
10-02-2009, 13:38
Очень коротко. Poller'ы вообще не участвуют в обработке данных с Proxy. Если Zabbix Server сам не занимается мониторингом устройств, то:

StartPollers=0
StartTrappers=100

Если занимается, то:

StartPollers=4
StartTrappers=100

В my.cnf:

max_connections=256

Понял, с остальными проблемами думаю разберусь.

dotneft
11-02-2009, 15:08
в branch 1.6.2 rev 6686 невозможно связать хост с шаблоном...в popup просто нет ни одного шаблона О_О

+
теперь в Items, если в фильтре указываешь какие либо параметры, то обязательно Group и Host должны быть определены не not selected. Неудобно как то получается( Например, если хочу выбрать из Группы хостов все деактивированные итемы, приходится пробегать по каждому хосту в группе

Alexei
11-02-2009, 15:37
в branch 1.6.2 rev 6686 невозможно связать хост с шаблоном...в popup просто нет ни одного шаблона О_О

+
теперь в Items, если в фильтре указываешь какие либо параметры, то обязательно Group и Host должны быть определены не not selected. Неудобно как то получается( Например, если хочу выбрать из Группы хостов все деактивированные итемы, приходится пробегать по каждому хосту в группе
Это будет исправлено. Спасибо!

aivarss
11-02-2009, 16:36
У меня тоже самое - Status = Unreachable(2), хотя все остальные данные собираются нормально. Хост мониторится через proxy.

dotneft
12-02-2009, 06:25
Сегодня обновил веб до 6694 и в разделе Настройки - items. Появилась ошибка:


ociexecute() [<a href='function.ociexecute'>function.ociexecute</a>]: ORA-00918: column ambiguously defined[/var/www/zabbix/include/db.inc.php:476]
SQL error [ORA-00918: column ambiguously defined] in [SELECT DISTINCT th.host as template_host,th.hostid as template_hostid, h.host, h.hostid, hg.groupid, i.* FROM hosts h,hosts_groups hg,groups g,items i LEFT JOIN items ti ON i.templateid=ti.itemid LEFT JOIN hosts th ON ti.hostid=th.hostid LEFT JOIN hosts_groups hg ON hg.hostid=th.hostid WHERE i.hostid=h.hostid AND (h.hostid IN (0)) AND i.hostid=hg.hostid AND g.groupid=hg.groupid AND g.name like '%VOIP Servers%' AND i.status=1 ORDER BY i.trends DESC,i.itemid]
ocierror() expects parameter 1 to be resource, boolean given[/var/www/zabbix/include/db.inc.php:403]
SQL error [] in []
ocifetchinto() expects parameter 1 to be resource, boolean given[/var/www/zabbix/include/db.inc.php:525]


Ошибка имеет место, если в фильтре from Host group like указать группу

+ при просмотре Inventory при выборе любой группы...всегда отображается только информация об одном хосте "Host profile"

Hober
12-02-2009, 07:35
У меня тоже самое - Status = Unreachable(2), хотя все остальные данные собираются нормально. Хост мониторится через proxy.

Как оказалось это не бага, а фича:)). Для определения доступности хоста, надо использовать nodata() ( я так сделал ). Например:
{TMP - Linux - Base:agent.ping. nodata( 120 ) }=1

status - сервер не опрашивает прокси, а прокси сам шлет инфу, поэтому Unreachable

SyJet
12-02-2009, 10:47
Удивлен, увидеть родной язык...
Только поставил Zabbix.. доку читал - но что-то, не особо понятно...
Не могу понять как происходит связка тригеров и системы оповещения.
Т.е. фактически, создал триггеры, поправил медиатайпы (добавил скрипт отправки через smtp с авторизацией).
А вот как это сделать - не осознал.. Нашел Configuration - Actions, но что и как-не могу разобраться... Плиз, поясните, желательно с примерами.

dotneft
12-02-2009, 11:04
Удивлен, увидеть родной язык...
Только поставил Zabbix.. доку читал - но что-то, не особо понятно...
Не могу понять как происходит связка тригеров и системы оповещения.
Т.е. фактически, создал триггеры, поправил медиатайпы (добавил скрипт отправки через smtp с авторизацией).
А вот как это сделать - не осознал.. Нашел Configuration - Actions, но что и как-не могу разобраться... Плиз, поясните, желательно с примерами.

на 86 странице мануала есть примеры;) и по форуму их куууучи...

например:
Условия
Группа узла сети = "VOIP Servers"
Важность триггера >= "Средняя"

Операции
Отправить сообщение Группа "NOC VOIP group"
все:)

Если сработал триггер у хоста относящегося к группе VOIP Servers и важность триггера более Средней то отправить сообщение группе пользоваталей NOC VOIP group

ЗЫ: забыл сказать есть два типа действий: на триггеры и на обнаружение

SyJet
12-02-2009, 11:27
А вариант, сделать, так, чтобы при сработке любого тригера шло уведомление, согласно настройек пользователя.
Т.е. в тригере выбирается уровень "угрозы", а в настройках пользователя - выбирается, какие и куда оповещения должны приходить?

dotneft
12-02-2009, 12:08
А вариант, сделать, так, чтобы при сработке любого тригера шло уведомление, согласно настройек пользователя.
Т.е. в тригере выбирается уровень "угрозы", а в настройках пользователя - выбирается, какие и куда оповещения должны приходить?

моно в настройках пользователя сделать такое, но только с учетом времени и уровню "угрозы", ну и что использовать для отправки (СМС, почта, жаббер, свой скрипт))

Hober
13-02-2009, 12:20
на 86 странице мануала есть примеры;) и по форуму их куууучи...

например:
Условия
Группа узла сети = "VOIP Servers"
Важность триггера >= "Средняя"

Операции
Отправить сообщение Группа "NOC VOIP group"
все:)

Если сработал триггер у хоста относящегося к группе VOIP Servers и важность триггера более Средней то отправить сообщение группе пользоваталей NOC VOIP group

ЗЫ: забыл сказать есть два типа действий: на триггеры и на обнаружение

Кстати никак не пойму, почему не отрабатывается действие, например:

Группа узла сети = "Main Servers"
Тригер = "Ldap Service - Down"
Значение тригера = "Проблема"

???
Если указывать не группу, а конкретный хост, то все ок.

Аналогична ситуация с:
Группа узла сети = "Main Servers"
Тригер = "Ldap Service - Down"
Важность тригера = "Проблема"

Hober
13-02-2009, 15:20
Вылез неприятный глюк ( причем не на всех проксях )
Попробую все описать.

Накатываю шаблон на хосты, которые мониторяться через прокси.
3 элемента:
sudo /usr/share/zabbix/scripts/run.sh ups_voltage
sudo /usr/share/zabbix/scripts/run.sh ups_load
sudo /usr/share/zabbix/scripts/run.sh ups_charge

Ставлю на прокси, обновлять конфигурацию через 60 секунд.

Смотрю: select * from items;
Данные об этих элементах не пришли.

Смотрю лог с прокси
insert into items (itemid,type,snmp_community,snmp_oid,snmp_port,hos tid,key_,delay,status,value_type,trapper_hosts,un
its,multiplier,delta,snmpv3_securityname,snmpv3_se curitylevel,snmpv3_authpassphrase,snmpv3_privpassp hrase,formula,log
timefmt,templateid,valuemapid,delay_flex,params,ip mi_sensor) values (37682,7,'public','interfaces.ifTable.ifEntry.ifI
nOctets.1',161,10108,'system.run[sudo /usr/share/zabbix/scripts/run.sh ups_charge]',60,0,0,'','',0,0,'',0,'','','1','
',32317,0,'','DSN=<database source name>\\nuser=<user name>\\npassword=<password>\\nsql=<query>','');
insert into items (itemid,type,snmp_community,snmp_oid,snmp_port,hos tid,key_,delay,status,value_type,trapper_hosts,un
its,multiplier,delta,snmpv3_securityname,snmpv3_se curitylevel,snmpv3_authpassphrase,snmpv3_privpassp hrase,formula,log
timefmt,templateid,valuemapid,delay_flex,params,ip mi_sensor) values (37683,7,'public','interfaces.ifTable.ifEntry.ifI
nOctets.1',161,10108,'system.run[sudo /usr/share/zabbix/scripts/run.sh ups_load]',60,0,0,'','',0,0,'',0,'','','1','',
32316,0,'','DSN=<database source name>\\nuser=<user name>\\npassword=<password>\\nsql=<query>','');
insert into items (itemid,type,snmp_community,snmp_oid,snmp_port,hos tid,key_,delay,status,value_type,trapper_hosts,un
its,multiplier,delta,snmpv3_securityname,snmpv3_se curitylevel,snmpv3_authpassphrase,snmpv3_privpassp hrase,formula,log
timefmt,templateid,valuemapid,delay_flex,params,ip mi_sensor) values (37684,7,'public','interfaces.ifTable.ifEntry.ifI
nOctets.1',161,10108,'system.run[sudo /usr/share/zabbix/scripts/run.sh ups_voltage]',60,0,0,'','',0,0,'',0,'','','1',
'',32315,0,'','DSN=<database source name>\\nuser=<user name>\\npassword=<password>\\nsql=<query>','');

И в конце
15358:20090213:161701 Query [rollback;]

делаю DELETE from items;
Данные приходят и все нормально мониторится.
В чем может быть проблема?

SyJet
17-02-2009, 14:38
Не везет мне с Забиксом.
Сервер - P4 3Гц, 1гиг, оперативы (своп 2 гига). СТоит на убунте сервер.
Мониторится порядка 10 коммутаторов (по 2-3 канала на каждом, есть тригеры и графики). Проработало 4 дня.. Сейчас перестали строить графики и приниматься данные. И самое интересное, сработал тригер о переполненом свопе на заббикс-сервере...
Что за беда такая - понять не могу.. Уже 3 раза ставил, и примерно тоже самое, спустя несколько дней то перестают отображаться графики, то память всю сжирает и еле-еле ворочиться, то еще чего...
Скажите, у кого какая конфигурация серваков + что мониторите

dotneft
17-02-2009, 20:18
Не везет мне с Забиксом.
Сервер - P4 3Гц, 1гиг, оперативы (своп 2 гига). СТоит на убунте сервер.
Мониторится порядка 10 коммутаторов (по 2-3 канала на каждом, есть тригеры и графики). Проработало 4 дня.. Сейчас перестали строить графики и приниматься данные. И самое интересное, сработал тригер о переполненом свопе на заббикс-сервере...
Что за беда такая - понять не могу.. Уже 3 раза ставил, и примерно тоже самое, спустя несколько дней то перестают отображаться графики, то память всю сжирает и еле-еле ворочиться, то еще чего...
Скажите, у кого какая конфигурация серваков + что мониторите

Number of hosts (monitored/not monitored/templates) 148
Number of items (monitored/disabled/not supported) 1714
Number of triggers (enabled/disabled)[true/unknown/false] 652
Required server performance, new values per second 43.3616666667

Gentoo 2.6.25 64bit, Oracle 10g2, 8GB RAM, 2 x Intel(R) Xeon(R) CPU E5420, RAID 2TB.

load average: 2.00, 1.59, 1.39
Mem: 8160416k total, 7459788k used, 700628k free, 284800k buffers
Swap: 15671284k total, 471524k used, 15199760k free, 5111028k cached

в основном мониторятся железяки 6-8 проверок каждые 30 сек...и штук 10 серверов по 60-70 проверок. Настроено без DM.

Hober
18-02-2009, 07:55
Number of hosts (monitored/not monitored/templates) 148
Number of items (monitored/disabled/not supported) 1714
Number of triggers (enabled/disabled)[true/unknown/false] 652
Required server performance, new values per second 43.3616666667

Gentoo 2.6.25 64bit, Oracle 10g2, 8GB RAM, 2 x Intel(R) Xeon(R) CPU E5420, RAID 2TB.

load average: 2.00, 1.59, 1.39
Mem: 8160416k total, 7459788k used, 700628k free, 284800k buffers
Swap: 15671284k total, 471524k used, 15199760k free, 5111028k cached

в основном мониторятся железяки 6-8 проверок каждые 30 сек...и штук 10 серверов по 60-70 проверок. Настроено без DM.

Количество узлов сети 212
Количество элементов данных 10327
Количество триггеров 1703
Требуемое быстродействие сервера, новые значения в секунду 92.8629

160 хостов через прокси, остальное с локального сервера. На хост от 40 до 50 элементов, с переиодичностью 30-60 секунд.

Cpu(s): 14.8%us, 2.9%sy, 0.7%ni, 79.6%id, 1.7%wa, 0.1%hi, 0.3%si, 0.0%st
Mem: 4154256k total, 3987916k used, 166340k free, 200356k buffers
Swap: 8193140k total, 64k used, 8193076k free, 1252100k cached

3 гига под мускул выделил ( + тюнинг ). В основном он жрет многа, буду наерное на sun перползать и на солярку.


Кстати, переделал инстялатор под виндовые сервера:
Простой интерфейс установки, далее вводятся всего 2 поля ( остальные настройки можно зашить сразу )

1.IP сервера
2.Имя хоста

Устанавливается, автоматом добавляется в шетдулер задание на обновление скриптов с rsync зеркала. Зеркало сделано для того, чтобы не надо было каждый раз ручками разливать свои скрипты. Если надо могу выложить.
Чуть позже сделаю rsync по ssl тунелю, как для виндовых, так и для линукс машин.

SyJet
19-02-2009, 13:24
Так, а загрузку каналов меряете или только доступность хостов-демонов?

Hober
19-02-2009, 13:26
Так, а загрузку каналов меряете или только доступность хостов-демонов?

мерею vpn тунели, мне этого достаточно. Щас есть идея мерять траффик по портам на фаерволах.

SyJet
19-02-2009, 13:26
Настроено без Dm
Это как и что?

SyJet
19-02-2009, 13:27
Стукнитесь в асю 153681790.. может кто поможет

Hober
19-02-2009, 14:55
Стукнитесь в асю 153681790.. может кто поможет

Тока вечером смогу
jabber: hober@jabr.ru


Почему так прокси глючит?
Данные собирает, но не передает на основной сервер. После очистки базы - все ок.

После отключения основного сервера, затем включения через некоторое время - все начинает колбасить. Запросы в базе до 2000 доходят, в нормальном режиме 400-500.

dotneft
20-02-2009, 06:45
В ревизии 6763 branch 1.6.2 имеется ошибка в синтаксисе в файле tr_comments.php

Parse error: syntax error, unexpected ')', expecting ']' in tr_comments.php on line 65


if(!isset($available_triggers[$_REQUEST['triggerid']])){


и еще никто не вкурсе, что за тип nan?
Type of received value [nan] is not suitable for value type [Numeric (float)] при стандартной проверке Template_Linux vfs.fs.inode[/,pfree]

dotneft
20-02-2009, 07:48
Это как и что?

Распределенный мониторинг (Distributed monitoring)

Aly
20-02-2009, 15:08
NAN - not a number, вроде так.

dotneft
21-02-2009, 10:00
NAN - not a number, вроде так.

Хм...понятно:)

Нашел баг небольшой в branch 1.6.2 6779rev. В файле hostprofiles.php,если закомментить строку:


$PAGE_HOSTS = get_viewed_hosts(PERM_READ_ONLY, $PAGE_GROUPS['selected'], $params);


то инветаризация отображается нормально, если же с этой строкой, то отображается профиль первого узла в выбранной группе:(

dotneft
24-02-2009, 17:56
Еще:)

если в Мониторинге->Графики выбрать группу все, а потом выбирать графики у серверов, то графики не отображаются:(

начиная с rev 6795 на dashboard перестали отображаться макросы {ITEM.LASTVALUE}

Hober
26-02-2009, 09:24
C некоторой периодичностью падают прокси. В логах:

13789:20090219:154439 One child process died. Exiting ...
13789:20090219:154441 ZABBIX Server stopped. ZABBIX 1.6.2.

dotneft
26-02-2009, 09:34
C некоторой периодичностью падают прокси. В логах:

13789:20090219:154439 One child process died. Exiting ...
13789:20090219:154441 ZABBIX Server stopped. ZABBIX 1.6.2.

а дебаг лог не включен?

Hober
26-02-2009, 09:36
а дебаг лог не включен?

Неа. Щас на самых падучих включу.

Hober
26-02-2009, 10:00
Неа. Щас на самых падучих включу.

Все разобрался. Надо было базу на проксе почистить.

Alexei
26-02-2009, 12:42
Все разобрался. Надо было базу на проксе почистить.
Все равно интересно почему это поизошло! Почему прокси так остановился?

Hober
26-02-2009, 12:50
Все равно интересно почему это поизошло! Почему прокси так остановился?

Почему остановился, не знаю. Включил дебаг, жду. Но после включения - данные перестали отправляться на основной сервер, очистил базу на прокси, все заработало.

p.s. Лс-ом отправил дебаг, когда данные перестали отправляться.

dotneft
03-03-2009, 16:25
Система устранения аварий:

Отдельная система и она не в системе мониторнинга должна решаться, а в системе сопровождения и решения проблем.
Суть простая – чтобы не забивать на аварии, иметь их историю, параметры скорости устранения, гарантированную передачу исполнителям (решающим) – существуют спец ситсемы, в результате авараии рождается задача (объект) на рашение данной аварии и оно проходит по схеме решения.
Заббикс с этим очень тесно связан, в нем какие-то функции на эту тему есть, поэтому, возможно, что такое кто то уже делал или есть в базе.

планируется такое дополнение?

dims
03-03-2009, 18:21
Возникла подобная проблема: существует скрипт, который проверяет очередь sendmail и выводит домен, с которого рассылается больше всех писем, вывод скрипта получается такой:
612 mails from domain.name/forum/index.php in mail queue
может кто подсказать, каким образом настроить тригер на срабатывание, при условии, если первое значение больше 500.

dotneft
03-03-2009, 20:17
Возникла подобная проблема: существует скрипт, который проверяет очередь sendmail и выводит домен, с которого рассылается больше всех писем, вывод скрипта получается такой:
612 mails from domain.name/forum/index.php in mail queue
может кто подсказать, каким образом настроить тригер на срабатывание, при условии, если первое значение больше 500.

думаю можно сделать с помощью regexp.

Например: ({test:test.regexp(^[5-9][0-9][0-9]\s.*$}=1) || ({test:test.(^[1-9][0-9][0-9][0-9]+\s.*$)}=1}

возможно ошибаюсь в правильности написания выражения, но суть думаю понятна:)

(Если строка начинается с 5 до 9 и число трехзначное) или (число более 3 знаков)

Dragomir
04-03-2009, 14:35
Help!!!
После апгрейда до 1.6.2 перестал правильно работать специальный параметр status, независимо от доступности устройства он в любом случае = 0.
Может кто сталкивался с таким странным поведением?

gescheit
05-03-2009, 15:23
А никто не знает из-за чего заббикс перестает писать в жаббер? В дашборде пишет что послал, но ничего не приходит. Зато если остановить заббикс сразу приходить куча сообщений. Такое-же поведение наблюдалось и в 1.6.1.

dotneft
05-03-2009, 16:54
А никто не знает из-за чего заббикс перестает писать в жаббер? В дашборде пишет что послал, но ничего не приходит. Зато если остановить заббикс сразу приходить куча сообщений. Такое-же поведение наблюдалось и в 1.6.1.

http://www.zabbix.com/forum/showthread.php?t=10480

gescheit
06-03-2009, 09:07
http://www.zabbix.com/forum/showthread.php?t=10480

Странно. Жаббер стоит на этом же серваке, не понятно почему он может отпадать... Как-то жаббер в заббиксе фигово реализован. Даже SRV из коробки не работает, приходится патчить

dotneft
09-03-2009, 20:59
Нашел три маленьких бага:

1) Профили хостов перестали отображаться с 6687 ревизии лечится удалением:

# $PAGE_HOSTS = get_viewed_hosts(PERM_READ_ONLY, $PAGE_GROUPS['selected'], $params);
# validate_group($PAGE_GROUPS, $PAGE_HOSTS, false);


2) При Apache авторизации раньше, если не заведен в системе Zabbix, то входишь под guest правами, сейчас же (началось с ревизии 6650):

ERROR: Login name or password is incorrect


3) на dashboard не отображаются макросы у сработавших триггеров, например {ITEM.LASTVALUE} начиная с 6795 ревизии.

dotneft
11-03-2009, 16:05
Возможно ли просуммировать нескольо элементов у хоста и сделать, например график или итем?

dotneft
12-03-2009, 15:10
Нашел для себя неприятный баг. При обнаружении и связывании хоста с шаблоном добавляется всего 1 график из шаблона.

Я нашел несколько тикетов по этому поводу
[ZBX-673] (https://support.zabbix.com/browse/ZBX-673)Autodiscovered hosts have 1 graph instead of the 4 from the template
[ZBX-54] (https://support.zabbix.com/browse/ZBX-54) Auto discovery and graphs

Все предложенные на форуме и в тикете методы борьбы не помогают, кроме как отсоединить и подключить шаблон.

Они "висят" уже довольно давно. Хотелось бы узнать у разработчиков о сроках устранения этого бага?

Zabbix 1.6.2 rev 6951
Gentoo, Oracle 10g2

dotneft
12-03-2009, 20:03
Появилась проблема с графиками(

коммутатор, порт, снмп v2c, bps, дельта в секунду.

При более близко рассмотрении графика (4часа) видно что имеются пропуски, при просмотре этого же графика за день все ок:)

+ если посмотреть по значениям элемента, видно, что значения имеются, правда период их снятия вместо указнных в настройках 60сек 3-4 минуты.

Проблем с производительностью точно 100% нет...Дури еще дофига:)

Alexei
13-03-2009, 11:52
Кстати, скоро я буду делать доклад на конференции RootConf 2009 (http://www.rootconf.ru) в Москве. Если кто хочет меня послушать, пообщаться - милости прошу! :)

dotneft
13-03-2009, 12:03
Кстати, скоро я буду делать доклад на конференции RootConf 2009 (http://www.rootconf.ru) в Москве. Если кто хочет меня послушать, пообщаться - милости прошу! :)

Я бы с удовольствием, но пока у нас Zabbix в тестовом режиме работает (в режиме обдумывания переезда на него) думаю начальство не согласится на такую идею:(

Алексей, у вас есть какая нибудь информация (сроки и т.п.) относительно проблемы с добавлением графиков при обнаружении?

Alexei
13-03-2009, 12:08
Алексей, у вас есть какая нибудь информация (сроки и т.п.) относительно проблемы с добавлением графиков при обнаружении?
Пока ничего сказать не могу. Очень хотелось бы это исправить до выхода 1.6.3.

dotneft
14-03-2009, 13:23
Пока ничего сказать не могу. Очень хотелось бы это исправить до выхода 1.6.3.

УРААААА...я похоже нашел проблему)

ошибка в libs/zbxdbhigh/host.c в функции DBcopy_graph_to_host:

при проверке имеется ли график с такими же элементами
сначала берется chd_templateid из chd_graph_data[12], по которому позже проверяется требуется обновлять график или добавлять новый, но далее, если chd_templateid не равняется нулю то происходит выход из цикла, но в chd_graphid остается уже id графика, поэтому нужно строку
ZBX_STR2UINT64(chd_graphid, chd_graph_data[0]); поставить после if ( chd_templateid != 0 ) continue;


- ZBX_STR2UINT64(chd_graphid, chd_graph_data[0]);
ZBX_STR2UINT64(chd_templateid, chd_graph_data[12]);
if ( chd_templateid != 0 ) continue;
+ ZBX_STR2UINT64(chd_graphid, chd_graph_data[0]);


не уверен, что это правильное решение, может что то упустил, но решение работает:)

+ в этой же функции далее сравниваются элементы графиков if(DBcmp_graphitems(&new_gitems[i], &chd_gitem)) continue;, т.е. если имеются одинаковые элементы, то продолжить, НО в функции DBcmp_graphitems, если элементы не равны возвращается значение больше нуля, если же что равны, то возвращается нуль. Таким образом получается что если элементы не одинаковы, то продолжить и тем самым нарастить счетчик одинаковых элементов О_О. Может я что то путаю:) и C наоборот if(false), то {}.

watto
17-03-2009, 16:21
Присоединяюсь к голосованию :) Огромная благодарность разработчикам Zabbix!

dotneft
18-03-2009, 20:17
гы...оказывается неверное местоположение строки это только часть айсберга) Огромное спасибо за столь быстрое исправление бага;) Еще хотелось бы уточнить сравнение элементов if(DBcmp_graphitems(&gitems[i], &chd_gitem)) continue верно? О_О

dotneft
20-03-2009, 10:33
Может стоит убрать кнопку "Выйти из системы", если авторизация через apache? толку от неё ноль)

MOHAX
24-03-2009, 03:11
Я конечно понимаю что вопрос не самый умный....но мануала как юзать Use extended profile нет((( может ктонить обьяснит чего и куда писать если можно с примером(возьмем длинк 3026):D :

Alias - Как её юзать не понял.

Тип устройства - Сооответственно

Device Chassis - ?

OS (Full Details) - Ось если есть =)
OS (Short) - Ось с коротким названием

HW Architecture - ?

Serial Number - серийник

Model Number - модель

Asset Tag - ?

Device Vendor - поставщик

Device Contract Number - ? вроде инвентарка

Installer Name - установщик

Device Deployment Status - ?

Software Application #1 - ?
Software Application #2 - ?
Software Application #3 - ?
Software Application #4 - ?
Software Application #5 - ?
URL #1 - ?
URL #2 - ?
URL #3 - ?

Device Port Connections - Порт подключения

Device Notes - заметки о устройстве ?
Device Hardware - ?
Device Software - ?

Host Subnet Mask - Чья маска сети ?
Host Router - ?
Host MAC Address - ?

Для чего и как ет юзать?
OOB IP Address
OOB Subnet Mask
OOB Router

Это вообще не понятно к чему(
Date HW Purchased
Date HW Installed
Date HW Maintenance Expires
Date HW Decommissioned
Site Address 1
Site Address 2
Site Address 3
Site City
Site State / Province
Site Country
Site Zip / Postal
Site Rack Location
Site Notes


POC - сигнализация...вот ток не понял это тупо информация.. или он будет оповещать по этим данным?
Primary POC Name
Primary POC Email
Primary POC Phone 1
Primary POC Phone 2
Primary POC Cell
Primary POC Screen Name
Primary POC Comments
Secondary POC Name
Secondary POC Email
Secondary POC Phone 1
Secondary POC Phone 2
Secondary POC Cell
Secondary POC Screen Name
Secondary POC Comments

dotneft
24-03-2009, 08:08
Не у каждого устройства можно заполнить все пункты


Alias - Как её юзать не понял.

Может у устройства имеется какой нибудь алиас)


Device Chassis - ?

Тип корпуса устройства



HW Architecture - ?

Аппаратная архитектура устройства


Asset Tag - ?

Метка устройства


Device Contract Number - ? вроде инвентарка

Номер контракта на устройство


Device Deployment Status - ?

Состояние развертывания устройства (Продакшн, Тест и т.п.)


Software Application #1 - ?
Software Application #2 - ?
Software Application #3 - ?
Software Application #4 - ?
Software Application #5 - ?

Приложения используемые на устройстве (mysql,apache+php and etc)


URL #1 - ?
URL #2 - ?
URL #3 - ?

Адрес. Например производителя, суппорта и т.п.


Device Notes - заметки о устройстве ?

именно так


Device Hardware - ?
Device Software - ?

Аппаратное и программное обеспечение.


Host Subnet Mask - Чья маска сети ?
Host Router - ?
Host MAC Address - ?

Маска подсети, шлюз, мак адрес устройства


Для чего и как ет юзать?
OOB IP Address
OOB Subnet Mask
OOB Router

OOB - out-of-band насколько я понимаю


Это вообще не понятно к чему(
Date HW Purchased
Date HW Installed
Date HW Maintenance Expires
Date HW Decommissioned

Дата покупки устройства, дата установки, дата окончания гарантийного срока, дата списания.


Site Address 1
Site Address 2
Site Address 3
Site City
Site State / Province
Site Country
Site Zip / Postal
Site Rack Location
Site Notes

Физическое расположение устройства


POC - сигнализация...вот ток не понял это тупо информация.. или он будет оповещать по этим данным?
Primary POC Name
Primary POC Email
Primary POC Phone 1
Primary POC Phone 2
Primary POC Cell
Primary POC Screen Name
Primary POC Comments
Secondary POC Name
Secondary POC Email
Secondary POC Phone 1
Secondary POC Phone 2
Secondary POC Cell
Secondary POC Screen Name
Secondary POC Comments
хз...но подозреваю, что данные с кем связываться, если будет что то не так:)

InG0d
24-03-2009, 11:50
Может кто нибудь поможет со следующей проблемой.
Нужен тригер который срабатывал бы, при отсутствии данных от агента в течении 30 минут.
Агент на винде.
Сделал такой тригер
{XXX:agent.ping. nodata( 1800 ) }=1
Итем
agent.ping раз в 60 сек

Вроде бы работало, но в последнее время стала наблюдаться странная ситуация.
Вот данные итема
2009.Mar.24 00:00:02 Up (1)
2009.Mar.23 23:59:03 Up (1)
2009.Mar.23 23:58:02 Up (1)
2009.Mar.23 23:57:02 Up (1)
2009.Mar.23 23:56:02 Up (1)
2009.Mar.23 23:55:02 Up (1)
2009.Mar.23 23:54:02 Up (1)
2009.Mar.23 23:53:02 Up (1)
2009.Mar.23 23:42:39 Up (1)
2009.Mar.23 23:41:38 Up (1)

То есть видно что не было данных с
2009.Mar.23 23:42:39 Up (1)
по
2009.Mar.23 23:53:02 Up (1)

А вот как выглядит тригер
2009.Mar.23 23:52:53 Zabbix Agent not send data on Nord_Office_n-server OK Чрезвычайная 8h 48m 51s
2009.Mar.23 23:52:53 Zabbix Agent not send data on Nord_Office_n-server ПРОБЛЕМА Чрезвычайная 0s
2009.Mar.23 23:52:27 Zabbix Agent not send data on Nord_Office_n-server OK Чрезвычайная 26s
2009.Mar.23 23:52:21 Zabbix Agent not send data on Nord_Office_n-server ПРОБЛЕМА Чрезвычайная 6s
2009.Mar.23 23:51:57 Zabbix Agent not send data on Nord_Office_n-server OK Чрезвычайная 24s
2009.Mar.23 23:51:50 Zabbix Agent not send data on Nord_Office_n-server ПРОБЛЕМА Чрезвычайная 7s
2009.Mar.23 23:47:45 Zabbix Agent not send data on Nord_Office_n-server OK Чрезвычайная 4m 5s
2009.Mar.23 23:46:43 Zabbix Agent not send data on Nord_Office_n-server ПРОБЛЕМА Чрезвычайная 1m 2s
2009.Mar.23 23:46:13 Zabbix Agent not send data on Nord_Office_n-server OK Чрезвычайная 30s
2009.Mar.23 23:32:10 Zabbix Agent not send data on Nord_Office_n-server ПРОБЛЕМА Чрезвычайная 14m 3s

Как например тригер стал OK в 23:46:13 совершено не понятно

ПС проблема наблюдается примерно в одно и то же время при большой загрузке сервера(идет бэкап)

dotneft
24-03-2009, 13:15
Может кто нибудь поможет со следующей проблемой.
Нужен тригер который срабатывал бы, при отсутствии данных от агента в течении 30 минут.
Агент на винде.
Сделал такой тригер
{XXX:agent.ping. nodata( 1800 ) }=1
Итем
agent.ping раз в 60 сек

Вроде бы работало, но в последнее время стала наблюдаться странная ситуация.
Вот данные итема
2009.Mar.24 00:00:02 Up (1)
2009.Mar.23 23:59:03 Up (1)
2009.Mar.23 23:58:02 Up (1)
2009.Mar.23 23:57:02 Up (1)
2009.Mar.23 23:56:02 Up (1)
2009.Mar.23 23:55:02 Up (1)
2009.Mar.23 23:54:02 Up (1)
2009.Mar.23 23:53:02 Up (1)
2009.Mar.23 23:42:39 Up (1)
2009.Mar.23 23:41:38 Up (1)

То есть видно что не было данных с
2009.Mar.23 23:42:39 Up (1)
по
2009.Mar.23 23:53:02 Up (1)


хм 2009.Mar.23 23:53:02-2009.Mar.23 23:42:39 около 10 минут, а триггер 1800сек=30мин. Вот и не сработал:)

InG0d
24-03-2009, 13:26
Сори описание тригера взял новое, поменял после того как глючит начало.
должно быть
{XXX:agent.ping. nodata(600) }=1

dotneft
24-03-2009, 13:30
Сори описание тригера взял новое, поменял после того как глючит начало.
должно быть
{XXX:agent.ping. nodata(600) }=1

мда...ну тогда честно хз:) могу посоветовать только дебаг включить и посмотреть там

InG0d
24-03-2009, 13:44
Как включить, куда смотреть ? :))

dotneft
24-03-2009, 13:51
Как включить, куда смотреть ? :))

/etc/zabbix/zabbix_server.conf

DebugLevel=4 (4 - for debugging (produces lots of information))

LogFile=/var/log/zabbix/zabbix_server.log (у тя в другом месте)

Да, валится инфы очень много сразу предупреждаю...поэтому осторожнее:)

ну и tcpdump тоже можно заюзать

Hober
25-03-2009, 07:44
Кстати, скоро я буду делать доклад на конференции RootConf 2009 (http://www.rootconf.ru) в Москве. Если кто хочет меня послушать, пообщаться - милости прошу! :)

О_о, попробуем приехать.

Hober
25-03-2009, 09:27
Кстати, как можно проверить доступность хоста за прокси ( без агента ).
icmmping ( простая проверка ) не работает.
Пока что придумал костыль через перловый скрипт, но тут же возникает еще один вопрос - можно ли в элементе данных передавать IP узла ( ну в строке Ключ ), есть ли какая нибудь переменная? ( в документации не нашел ).

Hober
26-03-2009, 08:27
Пока что придумал костыль через перловый скрипт, но тут же возникает еще один вопрос - можно ли в элементе данных передавать IP узла ( ну в строке Ключ ), есть ли какая нибудь переменная? ( в документации не нашел ).
Все разобрался,оказалось все просто

watto
26-03-2009, 12:04
Доброе время суток!
Каким образом можно мониторить счетчики производительности русского Win2k3 сервера? Заббикс не понимает кириллические названия объектов и счетчиков.

dotneft
26-03-2009, 14:47
Доброе время суток!
Каким образом можно мониторить счетчики производительности русского Win2k3 сервера? Заббикс не понимает кириллические названия объектов и счетчиков.

подозреваю что кириллические названия можно заменить циферями;)

ща гляну мануал...сек.

Во нашел раздел 4.12.Windows performance counters:)

watto
26-03-2009, 15:05
подозреваю что кириллические названия можно заменить циферями;)

ща гляну мануал...сек.

Во нашел раздел 4.12.Windows performance counters:)

Я дико извиняюсь, но 4.12 это раздел какого мануала? :)

dotneft
26-03-2009, 16:03
Я дико извиняюсь, но 4.12 это раздел какого мануала? :)

Zabbix'а) http://www.zabbix.com/downloads/ZABBIX%20Manual%20v1.6.pdf

watto
26-03-2009, 16:24
Zabbix'а) http://www.zabbix.com/downloads/ZABBIX%20Manual%20v1.6.pdf
О, спасибо, у меня оказывается старая версия мануала по 1.6

watto
26-03-2009, 16:48
Все равно не пойму.
Мне нужен параметр \PhysicalDisk(_Total)\Avg. Disk Queue Length, согласно реестру, это \234\1400, однако заббикс говорит итему "не поддерживается".
Ключ указывал вот такой: perf_counter[\234\1402]

gospodin.horoshiy
26-03-2009, 23:38
Все равно не пойму.
Мне нужен параметр \PhysicalDisk(_Total)\Avg. Disk Queue Length, согласно реестру, это \234\1400, однако заббикс говорит итему "не поддерживается".
Ключ указывал вот такой: perf_counter[\234\1402]

Вот так надо:
perf_counter["\234(_Total)\1400"]

watto
27-03-2009, 11:47
Вот так надо:
perf_counter["\234(_Total)\1400"]

Спасибо !

dotneft
27-03-2009, 14:30
Сегодня словил очень плохую ошибку, после чего сервер умер:(

Причина: была создана проверка с типом текст.

Проблема с таблицей history_text со стоблцом clob:(

Вот логи дебага:

26680:20090327:171344 In delete_history(trends,20837,365,1238156005)
26680:20090327:171344 Query [select min(clock) from trends where itemid=20837]
26510:20090327:171344 End update_triggers [23171]
26510:20090327:171344 Query [commit]
26523:20090327:171344 End of update_item()
26523:20090327:171344 In update_functions(52032)
26523:20090327:171344 Query [select distinct function,parameter,itemid,lastvalue from functions where itemid=52032]
26680:20090327:171344 In delete_history(history,20838,30,1238156005)
26680:20090327:171344 Query [select min(clock) from history where itemid=20838]
26510:20090327:171344 In substitute_simple_macros (data:"vfs.fs.size[/home,pused]")
26510:20090327:171344 In int_in_list(list:,value:10199)
26510:20090327:171344 End int_in_list(ret:FAIL)
26510:20090327:171344 In get_value(key:vfs.fs.size[/home,pused])
26510:20090327:171344 In get_value_agent(host:asterisk02.is74.ru,addr:10.10 0.10.59,key:vfs.fs.size[/home,pused])
26523:20090327:171344 ItemId:52032 Evaluating regexp(^OK$)
26523:20090327:171344 In evaluate_function('auth05-Campus7-link.is74.ru:auth.server.accounting.regexp(^OK$)')
26523:20090327:171344 In evaluate_STR()
26523:20090327:171344 Query [select * from (select value from history_text where itemid=52032 order by id desc) where rownum<=1]
26680:20090327:171344 In delete_history(history_uint,20838,30,1238156005)
26510:20090327:171344 Sending [vfs.fs.size[/home,pused]
]
26680:20090327:171344 Query [select min(clock) from history_uint where itemid=20838]
26492:20090327:171344 End of update_item()
26523:20090327:171344 [Z3005] Query failed: [0] LIBSQLORA8-30012: Unsupported database data type.
(sqlora line: 4549)
[select * from (select value from history_text where itemid=52032 order by id desc) where rownum<=1]
26492:20090327:171344 In update_functions(18511)
26492:20090327:171344 Query [select distinct function,parameter,itemid,lastvalue from functions where itemid=18511]
26680:20090327:171344 In delete_history(history_str,20838,30,1238156005)
26680:20090327:171344 Query [select min(clock) from history_str where itemid=20838]
26680:20090327:171344 In delete_history(history_text,20838,30,1238156005)
26680:20090327:171344 Query [select min(clock) from history_text where itemid=20838]
26492:20090327:171344 End update_functions()
26492:20090327:171344 In update_triggers [itemid:18511]
26492:20090327:171344 Query [select distinct t.triggerid,t.expression,t.description,t.url,t.com ments,t.status,t.value,t.priority,t.type from triggers t,functions f,items i where i.status<>3 and i.itemid=f.itemid and t.status=0 and f.triggerid=t.triggerid and f.itemid=18511]
26510:20090327:171344 Get value from agent result: '0.192546'
26680:20090327:171344 In delete_history(history_log,20838,30,1238156005)
26680:20090327:171344 Query [select min(clock) from history_log where itemid=20838]
26510:20090327:171344 End get_value()
26510:20090327:171344 In process_new_value(vfs.fs.size[/home,pused])
26510:20090327:171344 In add_history(key:vfs.fs.size[/home,pused],value_type:0,type:2)
26510:20090327:171344 In add_history(itemid:27371,DOUBLE:0.192546)
26510:20090327:171344 In add_history()
26510:20090327:171344 Query [insert into history (clock,itemid,value) values (1238156024,27371,0.192546)]
26680:20090327:171344 In delete_history(trends,20838,365,1238156005)
26492:20090327:171344 End update_triggers [18511]


судя по исходникам libqlora8. Библиотека данный тип не поддерживает:


File: sqlora.c
case SQLT_BLOB:
case SQLT_CLOB:
case SQLT_BFILEE:
case SQLT_CFILEE:
status = SQLO_ERROR; /* not supported in this mode */
break;

dotneft
30-03-2009, 19:45
Обновление Revision: 7097 - [ZBX-822] fixed dashboard when logged in as guest (Artem)
Не дает залогиниться гостю, если включена HTTP аутентификация:(

помогает:

Index: include/perm.inc.php
================================================== =================
--- include/perm.inc.php (revision 7098)
+++ include/perm.inc.php (working copy)
@@ -81,7 +81,7 @@
}
}

- if(!$USER_DETAILS && !isset($_SERVER['PHP_AUTH_USER'])){
+ if(!$USER_DETAILS ){
$sql = 'SELECT u.* '.
' FROM users u '.
' WHERE u.alias='.zbx_dbstr(ZBX_GUEST_USER).

Alexei
31-03-2009, 09:52
Обновление Revision: 7097 - [ZBX-822] fixed dashboard when logged in as guest (Artem)
Не дает залогиниться гостю, если включена HTTP аутентификация:(

Все верно, так и должно работать.

dotneft
31-03-2009, 10:04
Все верно, так и должно работать.

Не есть гуд) почему именно такой принцип выбран для http авторизации? О_О

Может тогда имеет смысл вынести в конфиг возможность выбора пускать или не пускать под гостей при apache авторизации?

gescheit
31-03-2009, 13:28
А в заббикс собираются добавить постраничный вывод списка хостов в режиме конфигурации?

dotneft
03-04-2009, 15:20
После обновления 7131 перестали отображаться группы в разделах Хосты, Итемы, Триггеры и т.п.

Сервер не настраивался для ДМ

Hober
06-04-2009, 16:23
Кто нибудь разбирался с эскалацией?
Никак не могу до конца понять, как она работает. Например:
Тригер: SMTP Service Down

При срабатывании тригера должно происходить следующее:
Шаг1 - удаленная команда ( restart exim ) ( то есть попробовать рестартануть exim ) с этим проблем нету
Шаг2 - через 5 минут еще раз попробовать выполнить удаленную команду ( если тригер все еще DOWN )
Шаг3 - если через 30 минут, тригер все еще Down - отправить допустим письмо пользователю

Делаю так:
Условия:
(A) Группа узла сети = "Main Services"
(B) Триггер = "SMTP Service Down"
(D) Значение триггера = "ПРОБЛЕМА"

1 - 1 Удаленная команда По умолчанию В текущий момент
2 - 2 Удаленная команда По умолчанию 00:5:00
3 - 3 Отправить сообщение пользователю 00:10:00

Вот тут возникает 2 вопроса.
Как задать задержку для каждого шага?

Как можно задать задержку для данного действия?
Допустим сработала удаленная команда, сервис exim поднялся, тригер стал OK, но через минуту опять тригер DOWN. В текущем варианте, действие опять начент срабатывать по новой, а хотелось бы чтобы через 5 минут ( если тригер опять сработал DOWN ) опять попробовать выполнить удаленную команду.
А то как то, не совсем все корректно получаеться.


p.s. А когда починят срабатывание действия если ( триггер = триггер шаблона )?

О_о, тока заметил что вышла 1.6.4, пойду пробовать

Alexei
06-04-2009, 17:11
Вот тут возникает 2 вопроса.
Как задать задержку для каждого шага?

Как обычно, очень коротко. :)

В данном случае устанавливаем Default (seconds) в 300 секунд (5 минут). Шаг будет увеличиваться каждые 5 минут.

Как можно задать задержку для данного действия?
Допустим сработала удаленная команда, сервис exim поднялся, тригер стал OK, но через минуту опять тригер DOWN.

Никак. Эскалация работает пока существует проблема. Нет проблемы - эскалация завершается.

Alexei
06-04-2009, 18:29
Две хорошие новости. Добро пожаловать на www.zabbix.com/ru. :) Скоро (завтра?) появится форум для общения на русском!

dotneft
06-04-2009, 18:46
Две хорошие новости. Добро пожаловать на www.zabbix.com/ru. :) Скоро (завтра?) появится форум для общения на русском!

очень...очень радуют эти новости:)

Alexei
07-04-2009, 12:17
А вот и форум! ;)

watto
07-04-2009, 12:47
Отлично ! :)

gescheit
07-04-2009, 14:26
Хм. Форум тот-же открывается. А кроме главной страницы что-нибудь переведено?

http://www.zabbix.com/ru/rn1.6.3.php не открывается например.

dotneft
07-04-2009, 14:36
Хм. Форум тот-же открывается. А кроме главной страницы что-нибудь переведено?

http://www.zabbix.com/ru/rn1.6.3.php не открывается например.

Москва не сразу строилась;)

Разработчикам агромный респект;)

Alexei
07-04-2009, 14:39
Хм. Форум тот-же открывается. А кроме главной страницы что-нибудь переведено?

http://www.zabbix.com/ru/rn1.6.3.php не открывается например.
Переведено, но пока не всё. Исправили.

gescheit
07-04-2009, 16:49
А не планируется ввести такую фичу, чтоб можно было несколько адресов одному хосту дать? У меня например возникает потребности мониторить разные интерфейсы на одной железки

Alexei
08-04-2009, 10:36
Всем. Предлагаю создавать отдельные ветки, а не продолжать этот топик. Самим ведь будет проще ориентироваться. :)

dotneft
08-04-2009, 14:28
может стоит закрыть его тогда?)

Alexei
08-04-2009, 14:42
может стоит закрыть его тогда?)
Закрываем!