1 问题

概述

Monitoring > Problems 中,你可以查看当前存在的问题。 问题是处于“Problem”状态的那些触发器。

默认情况下,所有新问题都被归类为原因问题。 可以手动将某些问题重新分类为原因问题的症状问题。 有关详细信息,请参见 cause and symptom events

Column Description
Checkbox 显示用于选择问题的复选框。
复选框旁边的图标含义如下:
icon\_number.png - 原因问题对应的症状事件数量;
icon\_expand.png - 展开以显示症状事件;
icon\_collapse.png - 折叠以隐藏症状事件;
icon\_symptom.png - 这是一个症状事件。
Time 显示问题开始时间。
Severity 显示问题严重性。
问题严重性最初基于底层问题触发器的严重性,不过,在事件发生后,可以通过 Update problem screen 进行更新。问题持续期间,问题严重性的颜色会用作单元格背景。
Recovery time 显示问题恢复时间。
Status 显示问题状态:
Problem - 未解决的问题
Resolved - 最近已解决的问题。你可以使用过滤器隐藏最近已解决的问题。
新问题和最近已解决的问题会闪烁 2 分钟。已解决的问题总共显示 5 分钟。这两个值都可以在 Administration > General > Trigger displaying options 中配置。
Info 如果问题因全局关联而关闭,或者在更新问题时被手动关闭,则会显示绿色信息图标。将鼠标悬停在该图标上会显示更多详细信息:
info.png
如果正在显示被抑制的问题(请参见过滤器中的 Show suppressed problems 选项),则会显示以下图标。将鼠标悬停在该图标上会显示更多详细信息:
Host 显示问题主机。
单击主机名称会打开 host menu
Problem 显示问题名称。
问题名称基于底层问题触发器的名称。
触发器名称中的宏会在问题发生时解析,解析后的值之后不会再更新。
Note,可以在问题名称后附加显示部分最新监控项值的 operational data
单击问题名称会打开 event menu
将鼠标悬停在问题名称后的 图标上会显示触发器描述(适用于包含该描述的问题)。
Operational data 显示包含最新监控项值的 operational data
如果在触发器级别进行了配置,operational data 可以是文本和监控项值宏的组合。如果在触发器级别未配置 operational data,则会显示表达式中所有监控项的最新值。
仅当过滤器中的 Show operational data 选择了 Separately 时,才显示此列。
Duration 显示问题持续时间。
另请参见:Negative problem duration
Update 单击 Update 链接可进入 problem update 界面,在那里可以对问题执行各种操作,包括添加评论和确认问题。
Actions 使用符号图标显示问题相关活动的历史记录:
icon\_acknowledged\_green.png - 问题已被确认。此图标始终最先显示。
icon\_comment.png - 已添加评论。还会显示评论数量。
icon\_sev\_up1.png - 问题严重性已提高(例如 Information → Warning)。
icon\_sev\_down1.png - 问题严重性已降低(例如 Warning → Information)。
icon\_severity\_back.png - 问题严重性已更改,但又恢复到原始级别(例如 Warning → Information → Warning)。
icon\_suppression.png - 问题已被抑制。
icon\_unsuppressed.png - 问题已取消抑制。
icon\_actions.png - 已执行操作。还会显示操作数量。
icon\_actions\_progress1.png - 已执行操作,且至少有一个正在进行中。还会显示操作数量。
icon\_actions\_failed.png - 已执行操作,且至少有一个失败。还会显示操作数量。
将鼠标悬停在这些图标上时,会显示包含活动详细信息的弹出窗口。有关弹出窗口中用于已执行操作的图标的更多信息,请参见 viewing details
Tags 显示 Tags(如果有)。
此外,还可能显示来自外部工单系统的标签(请参见配置 webhooks 时的 Process tags 选项)。

问题的操作数据

可以显示当前问题的操作数据,即最新的监控项值,而非问题发生时的监控项值。

操作数据显示可在监控 > 问题的过滤器或相应dashboard widget的配置中进行设置,通过选择以下三个选项之一:

  • - 不显示操作数据
  • 单独显示 - 操作数据显示在单独的列中

  • 与问题名称一起显示 - 操作数据附加到问题名称后并用括号括起。 仅当触发器配置中的操作数据字段非空时,操作数据才会附加到问题名称后。

操作数据的内容可通过每个trigger操作数据字段中进行配置。 该字段接受包含宏的任意string,最重要的是{ITEM.LASTVALUE<1-9>}宏。

该字段中的{ITEM.LASTVALUE<1-9>}将始终解析为触发器表达式中监控项的最新值。 该字段中的{ITEM.VALUE<1-9>}将解析为触发器状态变化时刻(即变为问题、变为OK、被用户手动关闭或被关联关闭)的监控项值。

请注意,手动关闭问题不会产生新值,因此{ITEM.LASTVALUE<1-9>}{ITEM.VALUE<1-9>}的解析值仍会显示问题发生时的值。

如果最新历史值的收集时间早于最大历史显示周期(参见Administration > General),{ITEM.LASTVALUE<1-9>}{ITEM.VALUE<1-9>}将解析为*UNKNOWN*。

负向问题持续时间

在某些常见场景中确实可能出现负值的问题持续时间,即问题解决时间早于问题创建时间,例如:

  • 当某个主机通过proxy监控时,若发生网络故障导致服务器一段时间未收到proxy数据,服务器将触发nodata(/主机/key)触发器。 连接恢复后,服务器会收到proxy发送的带有历史时间戳的监控项数据。 此时nodata(/主机/key)问题将被解决,且该问题持续时间将显示为负值;
  • 当Zabbix sender发送的监控项数据包含早于问题创建时间的时间戳并解决了该问题时,同样会显示负值的问题持续时间。

负值问题持续时间不会以任何方式影响特定触发器的SLA calculationAvailability report,既不会缩短也不会延长问题时间。

批量编辑选项

列表下方的按钮提供一些批量编辑选项:

  • 批量更新 - 通过进入 问题更新 页面来更新所选问题

要使用此选项,请先勾选相应问题前面的复选框,然后单击 批量更新 按钮。

按钮

右侧按钮提供以下选项:

将所有页面中的内容导出为 CSV 文件。

视图模式按钮是所有部分通用的,相关说明请参见 Monitoring 页面。

使用过滤器

您可以使用过滤器仅显示您感兴趣的问题。 为了获得更好的搜索性能,数据搜索时不会解析宏。

过滤器位于表格上方。 收藏的过滤器设置可以保存为选项卡,然后通过单击过滤器上方的选项卡快速访问。

参数 说明
显示 按问题状态过滤:
最近的问题 - 显示未解决和最近已解决的问题(默认)
问题 - 显示未解决的问题
历史 - 显示所有事件的历史记录
主机组 按一个或多个主机组过滤。
指定父主机组会隐式选择所有嵌套的主机组。
主机 按一个或多个主机过滤。
触发器 按一个或多个触发器过滤。
问题 按问题名称过滤。
严重性 按触发器(问题)严重性过滤。
持续时间小于 按问题存在时间长短过滤。
显示症状 勾选此复选框可将被归类为症状的问题单独显示在一行中。
显示被抑制的问题 勾选此复选框可显示原本会因主机维护或单个问题抑制而被抑制(不显示)的问题。
确认状态 过滤以显示所有问题、仅未确认的问题,或仅已确认的问题。勾选附加复选框可筛选掉那些曾被您确认过的问题。
主机清单 按清单类型和值过滤。
标签 event tag名称和值过滤。可以包含或排除特定标签及标签值。可设置多个条件。标签名称匹配始终区分大小写。
每个条件可使用以下运算符:
Exists - 包含指定的标签名称
Equals - 包含指定的标签名称和值(区分大小写)
Contains - 包含指定的标签名称,其中标签值包含输入的字符串(子字符串匹配,不区分大小写)
Does not exist - 排除指定的标签名称
Does not equal - 排除指定的标签名称和值(区分大小写)
Does not contain - 排除指定的标签名称,其中标签值包含输入的字符串(子字符串匹配,不区分大小写)
条件有两种计算类型:
And/Or - 必须满足所有条件,具有相同标签名称的条件将按 Or 条件分组
Or - 满足任一条件即可
过滤后,这里指定的标签将优先与问题一起显示,除非被下面的标签显示优先级列表覆盖。
显示标签 选择显示的标签数量:
None - 在监控 > 问题中不显示标签
1 - 标签列包含一个标签
2 - 标签列包含两个标签
3 - 标签列包含三个标签
要查看该问题的所有标签,请将鼠标悬停在三个点图标上。
标签名称 选择标签名称显示模式:
Full - 完整显示标签名称和值
Shortened - 标签名称缩写为 3 个符号;标签值完整显示
None - 仅显示标签值;不显示名称
标签显示优先级 输入问题的标签显示优先级,格式为以逗号分隔的标签列表(例如:customer,scope,component)。只能使用标签名称,不能使用值。此列表中的标签将始终优先显示,覆盖按字母顺序的自然排序。
显示操作数据 选择操作数据的显示模式:
None - 不显示操作数据
Separately - 在单独的列中显示操作数据
With problem name - 将操作数据附加到问题名称后,并使用括号括起操作数据
紧凑视图 勾选此复选框可启用紧凑视图。
显示详情 勾选此复选框可显示问题底层的触发器表达式。若勾选了紧凑视图复选框,则此项不可用。
显示时间线 勾选此复选框可显示可视化时间线和分组。若勾选了紧凑视图复选框,则此项不可用。
高亮整行 勾选此复选框可高亮显示未解决问题的整行。高亮使用问题严重性颜色。
高亮整行在高对比度主题中不可用。

对于 7.0.19 之前的 Zabbix 版本,此选项仅在标准蓝色和深色主题中勾选了紧凑视图复选框时受支持。
收藏过滤器的选项卡

常用的过滤参数组合可以保存到选项卡中。

要保存一组新的过滤参数,请打开主选项卡,配置过滤设置,然后点击 Save as 按钮。 在新的弹出窗口中,定义 Filter properties

problem\_filter0.png

Parameter Description
Name 要在选项卡列表中显示的过滤器名称。
Show number of records 如果希望在选项卡名称旁显示问题数量,请勾选此项。
Override time period selector 勾选后可为此过滤器组合设置特定的默认时间段。如果启用,只有通过更新过滤设置才能更改此选项卡的时间段。对于没有自定义时间段的选项卡,可以通过点击右上角的时间选择按钮来更改时间范围(按钮名称取决于所选时间间隔:This week、Last 30 minutes、Yesterday 等)。
此选项仅适用于 Monitoring > Problems 中的过滤器。
From/To 时间段 的开始和结束时间,支持绝对时间语法(Y-m-d H:i:s)或相对时间语法(now-1d)。当勾选 Set custom time period 时可用。

保存后,过滤器会作为一个命名的过滤器选项卡创建,并立即激活。

要编辑现有过滤器的过滤属性,请点击当前活动选项卡名称旁边的齿轮图标。

problem\_filter2.png

注意:

  • 要隐藏过滤区域,请点击当前选项卡的名称。 再次点击活动选项卡名称可重新打开过滤区域。
  • 支持键盘导航:使用方向键在选项卡之间切换,按 Enter 打开。
  • 过滤器上方的左/右按钮可用于在已保存的过滤器之间切换。或者,向下箭头按钮会打开一个包含所有已保存过滤器的下拉菜单,您可以点击所需的过滤器。
  • 过滤器选项卡可以通过拖放重新排序。
  • 如果已保存过滤器的设置已更改(但尚未保存),过滤器名称后会显示一个绿色圆点。 要根据新设置更新过滤器,请点击 Update 按钮,该按钮会替代 Save as 按钮显示。
  • 当前过滤器设置会保存在用户配置文件中。 当用户再次打开该页面时,过滤器设置将保持不变。

要共享过滤器,请复制并发送活动过滤器的 URL 给其他人。 打开此 URL 后,其他用户将能够在其 Zabbix 账户中将这组参数保存为永久过滤器。
另请参见:页面参数

过滤按钮
filter\_apply.png 应用指定的过滤条件(不保存)。
filter\_reset.png 重置当前过滤器并返回到当前选项卡的已保存参数。在主选项卡上,这将clear过滤器。
filter\_save\_as.png 在新选项卡中保存当前过滤器参数。仅在主选项卡上可用。
filter\_update.png 使用当前指定的参数替换选项卡参数。在主选项卡上不可用。

查看详情

Monitoring > Problems 中,问题开始和恢复的时间是链接。 点击它们会打开该事件的更多详情。

请注意,问题严重性在触发器和问题事件中可能不同 - 如果已使用 Update problem screen 对问题事件进行了更新。

在操作列表中,使用以下图标表示活动类型:

  • icon\_generated.png - 生成了问题事件。
  • icon\_message.png - 已发送消息。
  • icon\_acknowledged.png - 问题事件已确认。
  • icon\_unacknowledged.png - 问题事件未确认。
  • icon\_comment2.png - 已添加注释。
  • icon\_sev\_up1.png - 问题严重性已提高(例如 Information → Warning)。
  • icon\_sev\_down1.png - 问题严重性已降低(例如 Warning → Information)。
  • icon\_severity\_back.png - 问题严重性已更改,但已恢复到原始级别(例如 Warning → Information → Warning)。
  • icon\_remote.png - 已执行远程命令。
  • icon\_recovery.png - 问题事件已恢复。
  • icon\_closed.png - 问题已手动关闭。
  • icon\_suppression.png - 问题已被抑制。
  • icon\_unsuppressed.png - 问题已取消抑制。
  • icon\_symptom.png - 问题已转换为症状问题。
  • icon\_cause.png - 问题已转换为原因问题。