重要
自 2021 年 7 月 1 日起,你将无法在现有工作区中添加新测试,也无法在网络性能监视器中启用新的工作区。 可以继续使用在 2021 年 7 月 1 日之前创建的测试。 若要最大程度地减少对当前工作负荷的服务中断,请在 2024 年 2 月 29 日之前将测试从网络性能监视器迁移到 Azure 网络观察程序中的新连接监视器。
网络性能监视器是一种基于云的混合网络监视解决方案,可帮助你监视网络基础结构中各个点之间的网络性能。 它还有助于监视与服务和应用程序终结点的网络连接,并监视 Azure ExpressRoute 的性能。
网络性能监视器可检测网络问题,例如流量黑屏、路由错误和传统网络监视方法无法检测到的问题。 该解决方案会生成警报,并在网络链接的阈值被泄露时通知你。 它还可确保及时检测网络性能问题,并将问题的来源本地化为特定的网络段或设备。
网络性能监视器提供三大功能:
性能监视器:可以跨云部署和本地位置、多个数据中心、分支机构以及任务关键型多层应用程序或微服务监视网络连接。 使用性能监视器,可以在用户投诉之前检测网络问题。
服务连接监视器:可以监视用户与所关心的服务的连接,确定路径中的基础结构,并确定网络瓶颈的发生位置。 可以在用户之前了解中断情况,并查看网络路径中问题的确切位置。
此功能可帮助你基于 HTTP、HTTPS、TCP 和 ICMP 执行测试,以近乎实时或从历史上看服务的可用性和响应时间进行监视。 还可以监视网络在数据包丢失和延迟方面的贡献。 使用网络拓扑图,可以定位网络速度变慢的问题。 可以识别从节点到服务的网络路径上出现的问题点,每个跃点上都有延迟数据。 借助内置测试,无需预配置即可监视到 Microsoft 365 和 Dynamics CRM 的网络连接。 借助此功能,可以监视与任何支持 TCP 的终结点(如网站、SaaS 应用程序、PaaS 应用程序和 SQL 数据库)的网络连接。
ExpressRoute Monitor:通过 Azure ExpressRoute 监视分支机构与 Azure 之间的端到端连接和性能。
有关 网络性能监视器 支持的各种功能的详细信息,可联机获取。
支持的区域
NPM 可以从托管在以下区域之一的工作区监视世界上任何一个地区的网络和应用程序之间的连接:
- 北欧
- 西欧
- 瑞士北部
- 法国中部
- 南非北部
- 加拿大中部
- 美国西部
- 美国中西部
- 美国中北部
- 美国中南部
- 美国中部
- 美国东部
- 美国东部 2
- 美国西部 2
- 日本东部
- 东南亚
- 澳大利亚中部
- 澳大利亚东部
- 澳大利亚东南部
- 英国南部
- 东亚
- 韩国中部
- 印度中部
- 美国弗吉尼亚州政府
- 美国政府亚利桑那州
- 中国东部 2
ExpressRoute Monitor 支持的区域列表在 文档中提供。
设置并配置
注释
您可能也会看到 Log Analytics 代理被称为 Microsoft 监视代理 (MMA) 或 OMS Linux 代理。
安装和配置代理
使用基本过程安装代理,将 Windows 计算机连接到 Azure Monitor,将 Linux 计算机连接到 Azure Monitor(预览版),并将 Operations Manager 连接到 Azure Monitor 。
在哪里安装代理
性能监视器:在连接到每个子网的至少一个节点上安装 Log Analytics 代理,以便监视与其他子网的网络连接。
若要监视网络链接,请在该链接的两个终结点上安装代理。 如果不确定网络的拓扑,请在运行关键任务并需要监视网络性能的各台服务器上安装软件代理。 例如,如果要监视 Web 服务器与运行 SQL 的服务器之间的网络连接,请在这两台服务器上安装代理。 代理监视主机之间的网络连接(链接),而不是主机本身。
服务连接监视器:在要监视到服务终结点的网络连接的每个节点上安装 Log Analytics 代理。 例如,如果要监视从编号为 O1、O2 和 O3 的办公室到 Microsoft 365 的网络连接。 在 O1、O2 和 O3 中的每个节点上至少安装 Log Analytics 代理。
ExpressRoute Monitor:在 Azure 虚拟网络中安装至少一个 Log Analytics 代理。 此外,在本地子网中至少安装一个代理,该子网通过 ExpressRoute 专用对等互连进行连接。
配置 Log Analytics 代理以监视
网络性能监视器使用综合事务监视源代理和目标代理之间的网络性能。 可以选择 TCP 和 ICMP 作为在性能监视器和服务连接监视器功能中监视的协议。 只有 TCP 可用作 ExpressRoute 监视器的监视协议。 确保防火墙允许 Log Analytics 代理之间的通信,这些代理用于监视所选协议。
- TCP 协议:如果选择 TCP 作为监视协议,请在用于网络性能监视器和 ExpressRoute 监视器的代理上打开防火墙端口,以确保代理可以相互连接。 对于 Windows 计算机,若要打开端口,请在具有管理权限的 PowerShell 窗口中运行 EnableRules.ps1 PowerShell 脚本,而无需任何参数。 对于 Linux 计算机,需要手动更改使用的端口号。
- 导航到路径:/var/opt/microsoft/omsagent/npm_state。
- 打开文件:npmdregistry
- 更改端口号
“PortNumber:<port of your choice>”
的值
请注意,在工作区中使用的所有代理中,使用的端口号应相同。
该脚本创建解决方案所需的注册表项。 它还会创建 Windows 防火墙规则,允许代理创建彼此之间的 TCP 连接。 脚本创建的注册表项指定是否记录调试日志和日志文件的路径。 该脚本还定义用于通信的代理 TCP 端口。 脚本会自动设置这些键的值。 请勿手动更改这些键。 默认情况下打开的端口为 8084。 通过向该脚本提供参数 portNumber 即可使用自定义端口。 在运行该脚本的所有计算机上使用相同端口。
注释
此脚本仅在本地配置 Windows 防火墙。 如果有网络防火墙,请确保它允许流量发往网络性能监视器使用的 TCP 端口。
注释
无需为服务连接监视器运行 EnableRules.ps1 PowerShell 脚本。
ICMP 协议:如果选择 ICMP 作为监视协议,请启用以下防火墙规则来可靠地利用 ICMP:
netsh advfirewall firewall add rule name="NPMDICMPV4Echo" protocol="icmpv4:8,any" dir=in action=allow netsh advfirewall firewall add rule name="NPMDICMPV6Echo" protocol="icmpv6:128,any" dir=in action=allow netsh advfirewall firewall add rule name="NPMDICMPV4DestinationUnreachable" protocol="icmpv4:3,any" dir=in action=allow netsh advfirewall firewall add rule name="NPMDICMPV6DestinationUnreachable" protocol="icmpv6:1,any" dir=in action=allow netsh advfirewall firewall add rule name="NPMDICMPV4TimeExceeded" protocol="icmpv4:11,any" dir=in action=allow netsh advfirewall firewall add rule name="NPMDICMPV6TimeExceeded" protocol="icmpv6:3,any" dir=in action=allow
配置解决方案
请按照解决方案库中添加 Azure Monitor 解决方案的过程,将网络性能监视器解决方案添加到您的工作区。 如果要在连接监控器中使用非 Azure 终结点,则需要这样做。
打开 Log Analytics 工作区,然后选择 “概览” 磁贴。
选择 网络性能监视器 磁贴,其中包含消息 解决方案需要其他配置。
在 安装程序 页上,可以看到安装 Log Analytics 代理的选项,并在“通用设置” 视图中配置用于监视的代理。 如前所述,如果安装和配置了 Log Analytics 代理,请选择 安装程序 视图来配置要使用的功能。
性能监视器:选择要用于 默认 性能监视器规则中的综合事务的协议,然后选择 保存 & 继续。 此协议选择仅适用于系统生成的默认规则。 每次创建性能监控规则时,需要明确选择协议。 始终可以移动到“性能监视器”选项卡上的“默认 规则设置”(在完成 day-0 配置后显示)并稍后更改协议。 如果您不想使用性能监视器功能,可以在 性能监视器 选项卡上的 默认 规则设置中禁用默认规则。
Service Connectivity Monitor:此功能提供内置的预配置测试,用于监视从代理到 Microsoft 365 和 Dynamics 365 的网络连接。 选中要监视的 Microsoft 365 和 Dynamics 365 服务,方法是选中它们旁边的复选框。 若要选择要监视的代理,请选择 添加代理。 如果不想使用此功能或想要以后再设置,请不要选择任何选项,然后选择保存 & 继续。
ExpressRoute Monitor:选择 “立即发现” 以搜索并找到与此 Log Analytics 工作区关联的 Azure 订阅中的虚拟网络连接的所有 ExpressRoute 专用对等互连。
发现完成后,发现的线路和对等连接将显示在表格中。
这些电路和对等连接的监视最初处于停用状态。 从右侧的详细信息视图中选择要监视的每个资源,并为其配置监视。 选择保存以保存配置。 若要了解详细信息,请参阅“配置 ExpressRoute 监视”一文。
设置完成后,数据填充需要 30 分钟到一小时。 虽然解决方案聚合来自网络的数据,但看到消息 解决方案需要在“网络性能监视器”“概述”磁贴上 其他配置。 收集数据并编制索引后,概述 磁贴会更改,并以摘要形式通知您网络运行状况。 然后,您可以编辑对已安装 Log Analytics 代理的节点和从环境中发现的子网的监视。
编辑子网和节点的监视设置
配置页上的 “子网”选项卡上列出了安装至少一个代理的所有子网。
启用或禁用对特定子网的监视:
- 选中或清除 子网 ID旁边的复选框。 然后,确保选择或清除 用于监视,视情况而定。 可以选择或清除多个子网。 禁用后,不会监视子网,并更新代理以停止 ping 其他代理。
- 选择要在特定子网中监视的节点。 从列表中选择子网,并在包含未监视节点和受监视节点的列表之间移动所需的节点。 可以将自定义说明添加到子网。
- 选择保存以保存配置。
选择要监视的节点
节点 选项卡上列出了安装了代理的所有节点。
- 选择或取消选择要监视或停止监视的节点。
- 选择“用于监视,或根据需要将其清除。
- 选择 保存。
配置所需的功能:
数据收集详细信息
为了收集丢失和延迟信息,网络性能监视器在选择 TCP 作为协议时使用 TCP SYN-SYNACK-ACK 握手数据包。 选择 ICMP 作为协议时,网络性能监视器使用 ICMP ECHO 和 ICMP ECHO REPLY。 跟踪路由还用于获取拓扑信息。
下表显示了数据收集方法和有关如何为网络性能监视器收集数据的其他详细信息。
平台 | 直接代理 | System Center Operations Manager 代理 | Azure 存储 | 需要运营经理吗? | Operations Manager 代理程序的数据通过管理组传送 | 收集频率 |
---|---|---|---|---|---|---|
Windows操作系统 | • | • | TCP 握手/ICMP ECHO 消息每 5 秒发送一次,每 3 分钟发送一次数据 |
解决方案使用模拟事务来评估网络的运行状况。 Log Analytics 代理安装在网络中的各个点,彼此之间交换 TCP 数据包或 ICMP Echo。 代理是否使用 TCP 数据包或 ICMP Echo 取决于所选用于监视的协议。 在此过程中,代理会了解往返时间和数据包丢失(如果有)。 每个代理还会定期对其他代理执行路由跟踪,以明确网络中需要测试的各种路径。 使用此数据,代理可以推断网络延迟和数据包丢失数字。 测试每五秒重复一次。 数据在上传到 Azure Monitor 中的 Log Analytics 工作区之前,由代理聚合大约三分钟。
注释
尽管代理经常相互通信,但在执行测试时不会生成重要的网络流量。 代理仅依赖于 TCP SYN-SYNACK-ACK 握手数据包来确定丢失和延迟。 不会交换任何数据包。 在此过程中,代理仅在需要时才相互通信。 代理通信拓扑经过优化,以减少网络流量。
使用解决方案
“网络性能监视器概述”磁贴
启用网络性能监视器解决方案后,概述 页上的解决方案磁贴提供了网络运行状况的快速概述。
网络性能监视器仪表板
重要网络健康事件:此页面提供系统中最新的健康事件和警报列表,以及自事件开始活动以来的时间。 每当所选指标的值(丢失、延迟、响应时间或带宽利用率)超过阈值时,就生成运行状况事件或警报。
ExpressRoute 监视器:此页面提供各种由该解决方案监视的 ExpressRoute 对等连接的运行状况摘要。 拓扑 磁贴显示在您的网络中监控的 ExpressRoute 电路中的网络路径数量。 选择此磁贴可转到 拓扑 视图。
服务连接监视器:此页面提供所创建的不同测试的运行状况摘要。 拓扑 图块显示所监视的终结点数。 选择此磁贴可转到 拓扑 视图。
性能监视器:此页面提供解决方案监视 网络 链接和 子网 链接的运行状况摘要。 拓扑 磁贴用来显示您网络中监控的网络路径数量。 选择此磁贴可转到 拓扑 视图。
常见查询:此页面包含一组搜索查询,用于直接提取原始网络监视数据。 可以将这些查询用作起点,为自定义报告创建自己的查询。
深入探究
可以选择解决方案仪表板上的各种链接,以更深入地钻取到任何感兴趣的区域。 例如,当你看到警报或不正常的网络链接显示在仪表板上时,请选择它以进一步调查。 页面列出特定网络链接的所有子网链接。 可以看到每个子网链接的丢失、延迟和运行状况状态。 可以快速找出哪些子网链接会导致问题。 选择 查看节点链接 以查看不正常的子网链接的所有节点链接。 然后,可以看到各个节点到节点的链接,并查找不正常的节点链接。
选择 查看拓扑图 以查看源节点和目标节点之间路由的逐跳拓扑。 异常的路由以红色显示。 可以查看每个跃点造成的延迟,以便快速确定网络特定部分的问题。
网络状态记录器控制
每个视图都会在特定时间点显示网络运行状况的快照。 默认情况下,将显示最新的状态。 页面顶部的条形图显示显示状态的时间点。 若要查看之前某个时间的网络健康状况快照,请选择 操作。 还可以在查看最新状态时启用或禁用任何页面的自动刷新。
趋势图
您在每个深入查看的级别上,都可以看到适用指标的趋势。 它可以是丢失、延迟、响应时间或带宽利用率。 若要更改趋势的时间间隔,请使用图表顶部的时间控件。
趋势图显示性能指标性能的历史视角。 某些网络问题本质上是暂时性的,仅查看网络的当前状态很难捕获。 问题可以在任何人注意到之前快速浮出水面和消失,但稍后才再次出现。 对于应用程序管理员来说,解决此类暂时性问题也很困难。 这些问题通常显示为无法解释的应用程序响应时间增加,即使所有应用程序组件似乎都顺利运行。
可以通过查看趋势图轻松检测此类问题。 此问题表现为网络延迟或数据包丢失的骤增。 若要调查此问题,请使用网络状态记录器控件查看发生该问题的时间点的网络快照和拓扑。
拓扑图
网络性能监视器在交互式拓扑图上显示源端点和目标端点之间的逐跳路由拓扑。 若要查看拓扑映射,请选择解决方案仪表板上的 拓扑 磁贴。 还可以在下钻页面中选择 查看拓扑 链接。
拓扑图显示源和目标之间的路由数以及数据包采用的路径。 每个网络跃点造成的延迟也可见。 其总路径延迟高于阈值(在相应的监视规则中设置)的所有路径均以红色显示。
选择节点或将鼠标悬停在拓扑图上时,会看到节点属性,例如 FQDN 和 IP 地址。 选择一个跃点以查看其 IP 地址。 可以通过注意它造成的延迟来识别出现问题的网络跃点。 若要筛选特定路由,请使用可折叠作窗格中的筛选器。 若要简化网络拓扑,请使用操作窗格中的滑块隐藏中间跃点。 可以使用鼠标滚轮放大或缩小拓扑图。
地图中显示的拓扑是第 3 层拓扑,不包含第 2 层设备和连接。
Azure Monitor 中的日志查询
通过网络性能监视器仪表板和深入钻取页面以图形方式公开的所有数据,也可以在 日志查询中直接获取。 可以对存储库中的数据执行交互式分析,并将来自不同源的数据关联起来。 还可以创建自定义警报和视图,并将数据导出到 Excel、Power BI 或可共享链接。 仪表板中的 常见查询 区域具有一些有用的查询,你可以使用这些查询作为创建自己的查询和报表的起点。
警报
网络性能监视器使用 Azure Monitor的警报功能。
这意味着所有通知都使用动作组进行管理。
如果你是通过 Log Analytics 创建警报的 NPM 用户:
- 你将看到一个链接,该链接将重定向到 Azure 门户。 单击它以访问门户。
- 单击“网络性能监视器解决方案”磁贴。
- 导航到“配置”。
- 选择要对其创建警报的测试,并按照下面提到的步骤进行作。
如果您是在 Azure 门户中创建警报的 NPM 用户:
- 可以选择直接输入电子邮件,也可以选择通过作组创建警报。
- 如果选择直接输入电子邮件,则会创建名称 NPM Email ActionGroup 的作组,并将电子邮件 ID 添加到该作组。
- 如果选择使用操作组,则必须选择一个以前创建的操作组。 你可以在这里了解如何创建操作组 。
- 成功创建警报后,可以使用“管理警报”链接来管理警报。
每次创建警报时,NPM 都会在 Azure Monitor 中创建基于查询的日志警报规则。 默认情况下,此查询每 5 分钟触发一次。 创建的前 250 条日志警报规则不收取 Azure Monitor 费用,超过 250 个日志警报规则限制的任何警报规则都将按照 Azure Monitor 定价页中的 警报定价计费。 在 Azure Monitor 定价页 中,根据通知定价,通知是单独收费的。
定价
定价信息 可在在线获取。
提供反馈
UserVoice: 你可以发布你希望我们处理的网络性能监视器功能的想法。 访问 UserVoice 页面。
加入我们的队列: 我们总是有兴趣让新客户加入我们的队列。 作为其中的一部分,你可以提前访问新功能,并有机会帮助我们改进网络性能监视器。 如果你有兴趣加入,请填写此 快速调查。
后续步骤
详细了解 性能监视器、Service Connectivity Monitor,以及 ExpressRoute Monitor。