Skip to main content
开放网络的先行者与推动者—星融元
加入我们技术支持(Support)  TEL:(+86)4000989811

标签: 科普-园区

园区网络新突破!vAsterNOS正式支持PTP高精度时间同步验证

近期文章


园区交换机运行起了 SONiC,是在卷生卷死的大环境下“杀鸡用牛刀”,还是引入了一场对园区传统建设运营范式的“降维打击”?与其猜测,不如亲自体验一番这款面向园区场景的 SONiC NOS —— AsterNOS Campus,一切自有答案。

当前,vAsterNOS Campus v6.0(GNS3/EVE-NG设备模拟器)已支持下载,全功能版本的试用/演示名额现正开放申请中 。

  • 下载和申请演示:https://asterfusion.com/d-vasternos/
  • 技术交流支持 :加入官方QQ群(群号:801700146),获取用户手册、配置案例及技术答疑服务。

AsterNOS 是星融元 Asterfusion 面向AI智算、通算云和企业园区等场景的一站式 SONiC 交钥匙解决方案的核心技术。其中 AsterNOS Campus v6.0是专为企业、校园及各类园区网络打造的企业级SONiC解决方案,具备丰富的L2/L3功能,如ACL、MSTP、QinQ、IGMP Snooping,OSPF/BGP等。

此外,AsterNOS Campus v6.0 还具备增强的MPLS L2VPN / L3VPN,PTP等高级功能,帮助企业和园区构建高效的多业务承载网络,实现跨域互联,并提供纳秒级别的时间同步,适用于对时间精度要求极高的业务场景。

星融元园区交换机及vAsterNOS虚拟化平台的开放生态中,PTP作为关键功能之一,为园区网络、工业自动化及AI算力场景提供了精准的时间同步能力,成为构建高可靠、低时延基础设施的核心支撑 。

什么是PTP?

PTP(精确时间协议,Precision Time Protocol) 是一种基于IEEE 1588标准的网络时间同步协议,旨在为分布式系统中的设备提供亚微秒级(甚至纳秒级)的高精度时钟同步。其核心目标是通过消除网络传输延迟的不确定性,确保跨设备的动作、数据采集或控制指令在严格统一的时间基准下执行。

什么领域需要PTP?

在园区网络中,随着物联网、工业自动化、金融交易和高清视频协作等应用的普及,设备间对高精度时间同步的需求日益增强。

传统网络时间协议(NTP)仅能提供毫秒级同步精度,难以满足微秒甚至纳秒级场景(如传感器协同、5G基站调度、分布式系统事务一致性)的严苛要求。

IEEE 1588定义的精确时间协议(PTP)通过硬件时间戳消除网络传输延迟误差,结合主从时钟架构动态补偿链路不对称性,可为园区内的摄像头工业控制器服务器集群等设备提供亚微秒级同步,保障实时业务时序精准性、故障诊断准确性及系统协同效率,成为智能园区低时延、高可靠组网的核心基础。

PTP的核心优势(对比NTP)

维度PTPNTP
同步精度微秒/纳秒级(硬件支持)毫秒级(软件实现)
延迟抖动通过硬件时间戳和TC/BC消除抖动受操作系统和网络波动影响
适用场景工业控制、5G、金融高频交易等办公、IT系统、通用服务
部署成本高(需专用硬件)低(纯软件)

PTP实现时间同步的核心机制

实现时间同步的两种核心机制:一步模式(单步模式) 与 两步模式(双步模式),主要区别在于时间戳的嵌入方式、网络开销及硬件依赖。以下是两者的对比解析:

两步模式(Two-Step)

  • 兼容性高 :适用于不支持硬件时间戳的设备,依赖软件处理。
  • 网络开销大 :需额外传输Follow_Up报文,增加带宽占用。
  • 抗干扰性弱 :在高负载网络中,Sync与Follow_Up报文可能因拥塞失序,导致同步误差。

PTP

主时钟先发送 Sync报文 ,记录其发送时刻 t1 ,随后通过 Follow_Up报文 将 t1 传递给从时钟。 从时钟接收Sync报文时记录接收时刻 t2 ,再发送 Delay_Req报文记录发送时刻 t3 ,主时钟响应 Delay_Resp报文返回接收时刻 t4。

在这些交换结束后,从属时钟拥有所有四个时间戳。因此,它可以计算出它的时钟相对于主时钟的偏移量为:偏移 = (t2 + t3 – t1 – t4) /2

一步模式(One-Step)

  • 高精度 :硬件级时间戳消除协议栈处理延迟,同步精度可达纳秒级 。
  • 低网络开销 :减少50%的PTP报文数量,降低网络负载。
  • 硬件依赖性强 :需PHY/MAC芯片支持硬件时间戳嵌入功能,成本较高 。

PTP

单步模式将时间戳直接嵌入Sync报文,无需Follow_Up报文: 主时钟在发送Sync报文时,硬件芯片实时标记 t1 并写入报文字段 。 从时钟接收Sync报文后,直接提取 t1 与本地记录的 t2 计算偏移和延迟。

特性一步模式两步模式
同步精度纳秒级(硬件时间戳)微秒级(软件时间戳)
报文数量少(无Follow_Up)多(需Follow_Up)
硬件要求需专用PHY/MAC芯片通用网络设备兼容
适用场景工业实时控制、高频交易普通办公网络、传统音视频传输

星融元园区交换机多款产品支持PTP功能,同步精度可达20ns?!

作为新一代开放网络解决方案提供商,其多款园区级交换机深度集成 IEEE 1588 PTP(精确时间协议) 功能,结合硬件加速、高精度时钟设计及基于SONIC自研AsterNOS网络操作系统,可为工业控制、金融交易、5G基站等场景提供纳秒级时间同步能力,最高精度可达 20ns,助力企业构建高可靠、低时延的智能网络底座。

园区产品

通过硬件与软件协同设计,星融元突破传统同步瓶颈:

  • 基于SONiC生态的PTP协议:基于SONiC的企业级发行版AsterNOS,结合开源linuxPTP项目(遵循IEEE 1588标准的PTP协议实现),通过自主研发的PTP功能与SONiC深度集成,拥有高精度、高可靠的时间同步能力。
  • 通过标准化接口实现灵活配置:AsterNOS提供丰富的RESTful API,用户可通过编程接口直接配置PTP参数(如主从时钟选择、同步间隔调整等),实现自动化运维。
  • 面向超低时延场景的优化:硬件平台(如CX854E-N)采用的Marvell TL10支持PTP的芯片,结合AsterNOS的软件优化,可实现纳秒级时间同步精度。通过内存数据库Redis实现模块间状态同步,可能用于实时记录和分发PTP时间戳数据,提升同步效率和系统可靠性。
  • 定制化开发与生态兼容性:支持多厂商芯片(如Marvell Teralynx(部分)、Prestera等),确保PTP在不同硬件平台上的兼容性,满足异构网络部署需求。

如需完整方案(含园区控制器)演示,欢迎拨打官方热线 400-098-9811 转产品咨询。

返回资源中心

最新动态

园区网前沿实践:基于开放网络架构的云化路由设计


关注星融元


底层物理网络设计

如下图所示,区别于传统的“接入-汇聚-核心”架构,新一代云化园区比照数据中心网络采用 Leaf-Spine 的 Clos 架构组网,Leaf 和 Spine 层都被设计成独立的 AS 并通过 eBGP 互联,支持终端设备以 1GE 及以上端口速率接入网络。
园区底层物理网的云化升级关键是将 EVPN 和 BGP 等能力下沉到接入级交换机。目前全功能的企业级SONiC(AsterNOS)可稳定运行在园区交换机上,完全支持将此类成熟的云网技术引入园区。
由此,我们构建了足够灵活、可靠的全三层网络来承载园区日益复杂、多变的网络业务,消除了原有传统架构用于业务分区管理的二层网络,也无需引入堆叠架构。
根据实际需求,我们有时也会在 Spine 和 Leaf 之间添加二层交换机,但其唯一功能是扩展端口容量,不会参与路由、EVPN 或 BGP 操作。
这种设计对大型园区的好处十分明显,例如杜绝内网广播风暴,降低网络架构复杂度(一键下发配置模板做到”全自动BGP”);同时也具备一定的内生安全性(例如隔绝了依赖广播的病毒攻击等等),以及高度适应企业数字化转型的云原生特性。

终端IP地址规划和分配

回归到路由设计的话题,构建全三层路由网络的重难点是合理规划和分配 IP 地址。
我们知道,传统园区网络设计中不可避免的一大挑战来自交换机的表项资源,其大小决定了园区接入规模的上限,这也是为什么曾经我们需要大型机框作为核心路由来支持超大型网络。
而在上述的云化园区网里,我们并未引入任何昂贵的机框设备,那么仅凭全盒式的开放交换机设备是如何做到的呢?
园区网架构
简言之,通过聚合路由技术和合理的IP分配策略,我们可以有效节约路由表项资源,并结合多级的 Leaf-Spine 架构将网络平滑扩容到30K+终端接入规模。

两种不同类型的终端路由信息

园区网络中的终端大体可分为漫游和非漫游两种类型。
对于非漫游终端,我们可以使用聚合路由,即将多个终端设备 IP 地址聚合到一个子网路由,以减少交换机表项空间占用。
聚合路由的正常运行需要与 IP 地址分配策略紧密结合,而借助 DHCP Option 82,我们可以确保同一 Leaf 交换机下的所有非漫游终端设备聚合在同一子网内。
DHCP Option 82 即“中继代理信息选项”。园区Leaf交换机作为 DHCP 中继代理设备,会在客户端发起的DHCP请求报文中添加 Option 82 字段,将 DHCP 客户端的位置信息附加进去提供给DHCP 服务器,后者利用该字段信息为主机分配合适的IP地址和其他配置信息;中继代理设备会在将DHCP回复转发给客户端之前删除该字段。
对于漫游终端不会使用聚合路由,而是保留其原有的 IP 地址。即使终端漫游到不同的 Leaf 交换机,也将一直使用原有的主机路由信息接入网络。
Spine 层交换机负责正确维护这些漫游终端的主机路由信息,整网范围皆为“云漫游”域。这种新架构下我们无需建立CAPWAP隧道让流量绕行转发,配置管理上也做到了高度简化。
以上过程中所有二层数据帧都将被转发并转换为三层报文,ARP 侦听机制在其中起到了至关重要的作用。

ARP 侦听机制

终端发起 ARP 请求时,其接入的Leaf 交换机会通过 ARP 侦听机制生成 ARP 和 IP 地址之间的映射(将ARP表项转换为32位主机路由),将这些信息同步到直连的 Spine 设备上,并通过BGP重分发学到的主机路由使其在 Spine 层传播,但不会再发送到其他 Leaf 交换机上。
最终,各类主机的路由信息会以如下方式逐级汇总:
  • Leaf 交换机保存本地连接的主机路由和通往上层 Spine 交换机的默认路由
  • Spine 层交换机维护整个网络的路由,包括整网所有终端的主机路由信息
  • 更上层的网络设备(如FW)路由表存放非漫游终端的聚合路由和漫游终端的主机路由
如此一来,无论是 MAC 地址表还是主机路由表,Leaf 交换机都只存储本地路由和默认路由,只有高性能的 Spine 层交换机维护全局路由信息,从而给后续网络扩容留有充足空间。

BGP 路由快速收敛

我们的整个网络采用 BGP 路由协议,利用 BFD (双向转发检测)实现快速路由收敛。BGP 使用 BFD 监控链路和节点状态,可在单链路或单节点故障时实现快速恢复,故障检测时间约为 150 毫秒,性能可调。发生故障时,流量会自动切换到备用交换机,确保快速恢复端到端服务。

EVPN Multihoming 技术确保终端高可靠接入

为了保证终端访问的可靠性,接入园区网络的服务器可采用 EVPN-Multihoming 技术,将其连接到两个 Leaf 交换机上作为主-主备份的双上行接入;对于无线AP也可以采用类似的设计,将它们连接到两个 Leaf 交换机,以确保在单链路故障时业务不中断。

WiFi 6、WiFi 7的无线漫游技术及方案实现


关注星融元


WiFi 6 无线漫游技术

WiFi 6实现的无缝漫游主要基于802.11k/v/r协议。
802.11k/v/r是WiFi 6中三个与WLAN相关的协议,又称为“快速漫游三协议”,用于解决传统漫游过程中的丢包严重、漫游触发不及时、选择漫游的目标AP不合适等问题。以下是对这三个协议的详细解析:
分别解决了何时漫游漫游到何处以及如何快速重连的问题。

802.11k协议

802.11k协议,又称无线局域网频谱资源测量协议(Radio Resource Measurement of Wireless LANs,RRM),解决了何时漫游的问题。
该协议定义了AP和STA如何协同工作,以确定STA在移动时能够漫游到最佳AP的时机。在漫游开始前,802.11k协议通过AP与STA之间的信息交换,提前告知STA漫游时可选择的AP列表。这是因为AP会定期或根据STA的请求收集周围邻居AP的信息,包括信号强度、吞吐量、可用频道等,并整理成邻居报告。当STA检测到当前连接的AP信号不佳时,会向AP发起请求,请求AP提供可漫游AP的列表和相关信息。AP将邻居报告发送给STA,STA根据报告中的信息评估周围AP的状态,并确定是否需要漫游。同时,STA也可以向AP发送自己的测量报告,包括当前连接的AP的信号质量、丢包率等参数,以便AP评估STA的连接状态。STA根据接收到的邻居报告和自己的测量报告,评估当前连接的AP和其他潜在漫游目标的AP之间的优劣。在802.11k之前,STA通常只会连接到信号最强的AP,而802.11k协议则提供了更多的信息,帮助STA做出更合理的漫游选择。

802.11v协议

802.11v协议,又称无线网络管理协议(Wireless Network Management,WNM),解决了漫游到何处的问题。
该协议允许STA与AP之间交换网络拓扑信息,包括信号环境、拓扑状态等,以促进无线网络的整体优化。AP响应STA的报告请求后,会评估无线终端的连接质量,引导终端漫游到能提供更优网络体验的AP,从而实现负载均衡,提升整个无线网络的性能和用户漫游体验。简单来说,802.11v的作用是让STA可以请求到漫游目标AP,而AP给STA一个建议漫游的目标AP。

802.11r协议

802.11r协议,又称快速漫游协议(Fast Roaming),解决了如何快速重连的问题。
该协议定义了STA在不同AP间漫游时的交互细则,提供了实现BSS快速切换的标准。它使用了FT(快速基本服务集转换)功能来简化认证,省略了802.1x认证过程和四次握手过程,使STA能够快速且安全地漫游至新AP。在此之前,无线终端每次在加密网络中漫游时都需要重新关联验证无线密码,而通过该协议简化认证流程后,大幅缩短漫游切换时间,减少用户感知到的中断时间,确保在漫游过程中业务数据流的低延时传输,提高用户上网体验。

WiFi 7在无线漫游方面的优势

尽管WiFi 7 的标准尚未完全批准,但已有产品上市。WiFi 7 与WiFi 6 的对比如下:
 WiFi 6WiFi 7
IEEE标准802.11ax802.11be
最大传输速率9.6Gbps23Gbps
频段2.4GHz、5GHz、6GHz(仅WiFi 6E)2.4GHz、5GHz、6GHz
安全协议WPA3WPA3
信道带宽20MHz、40MHz、80MHz、
160MHz、80+80MHz
最大可到320MHz
调制方式1024-QAM OFDMA4096-QAM OFDMA

更高的带宽和传输速率:

从表格中可以看出WiFi 7的最大传输速率为23Gbps,支持最大320MHz带宽,相比WiFi 6又有所提高。对于无线漫游来说,高速率的数据传输能够确保在AP切换过程中数据传输的连续性和流畅性,避免因延迟或速率不足导致的卡顿、掉线等问题。

更低的业务时延

Wi-Fi 7支持Multi-RU机制,允许将多个RU分配给单用户。而在WiFi 6 中同一周期单用户只能分配到单个特定RU ,存在部分 RU 资源被闲置的情况。WiFi 7相比WiFi 6 大大提升了频谱资源调度的灵活性并降低了业务时延。与高速率相通,低时延也是无线漫游中保障数据传输完整和稳定的重要因素。

增强的多用户性能:

WiFi 7引入了16x16MIMO和更高阶的4096-QAM调制技术。数据流由原来的8条变为16条,每个符号位传输数据由原来的10bit变为12bit,相比Wi-Fi 6 提升20%。WiFi 7进一步增强了多用户性能和高并发能力,能够更好地处理大量设备同时连接和漫游的情况,减少冲突和延迟。

更可靠的链路机制

WiFi 7 引入Multi-Link多链路机制,定义了多链路聚合相关的技术。即AP和客户端之间同时建立多个链路进行数据通信,多发选收,负载均衡以提高链路的可靠性,从整体上提高用户在无线漫游中的体验。

更精简的无缝漫游方案

基于前文提到的快速漫游三协议以及传统组网方案的局限性,星融元在此提出无线网新架构。

基于分布式网关的无线网

在无线漫游工作原理篇我们提到集中式网关极易成为整网性能瓶颈,那不妨试试将一个子网的网关分布于每一个接入交换机上。这样做可以分担数据流量,充分利用每一个接入交换机的能力,实现负载均衡。进而提升整网转发速率,并避免了单一设备导致整网瘫痪的风险。
除此以外,该方案还能够提高转发效率。因为相比传统集中式网关,分布式网关方案中的业务报文无需到某个集中式网关上“兜圈子”,而是直接在本地接入交换机以最短路径完成漫游后的转发。这种高效的转发路径大大提高了流量转发效率。

用标准VXLAN替代CAPWAP的集中式转发

鉴于上述分布式无线方案依赖于云化后的有线网络,我们又提出了在不改变现网架构基础上单独升级无线网络的另一方案——无CAPWAP的集中式转发。
该方案借助VXLAN实现了极简的无线漫游,即AP和网关交换机之间建立的是VXLAN 隧道。AP上运行 VTEP 对用户原始数据帧进行封装和解封装,并且用不同的VNI实现网络隔离。
除了无需改变现网外,该方案还可以打破CAPWAP协议的厂商锁定。这是因为方案中用VXLAN替代了CAPWAP隧道,而VXLAN是更加标准化的技术。该方案也可应用于园区网络,客户只需引入一对具备一定可编程能力的“网关交换机”以及合适的AP即可。

方案测试

值得注意的是,不管是基于分布式网关的无线网还是用标准VXLAN替代CAPWAP的集中式转发,星融元都是基于开放的软硬件实现,即:SONiC+OpenWiFi+白盒化的接入交换机和AP。
对于该组合,我们进行了无线漫游的实际测试。
测试区域:单层办公空间(约180平米,有墙面硬隔断,日常办公场景存在一定网络干扰) 交换机:星融元CX-M系列(CX206P),其上运行AsterNOS(企业级SONiC发行版)
AP配置:SSID-Asterfusion,射频参数设置为5G,40MHz,加密方式WPA2-PSK
测试终端:同时支持802.11k/v/r、WiFi5、WiFi6的华为 mate60 pro和联想win10专业版 Comfast CF-952AX
测试结果显示,在智能手机的漫游过程中,发生了20次AP切换数据,漫游耗时稳定在10ms上下,平均8.7ms,丢包率为0;在笔记本电脑的漫游过程中,发生了5次漫游,漫游耗时稳定在10ms左右。该测试结果足以说明无线网新架构的可靠性,更详细的测试内容可参考小于10ms!基于SONIC+白盒AP的WiFi无缝漫游实测

什么是无线漫游?无线漫游的工作原理是什么?


关注星融元


什么是无线漫游

无线漫游是指在相同SSID(Service Set Identifier,服务集标识)的无线网络中,确保无线终端STA(如手机、电脑等终端设备)在移动过程中能够保持不间断网络连接的技术。因为在无线局域网中,每个AP(Access Point,无线访问接入点)设备的信号覆盖范围都有限,无线终端用户在通信过程中会从一个AP信号覆盖区进入到另一个AP覆盖区域,为了避免用户在不同的AP之间切换时,网络通讯中断,需要借助无线漫游技术,确保用户设备与新的AP自动关联,与原有AP断开关联,同时保持网络连接的连续性,使用户在移动通信的过程中自由切换且无感知地保持对网络的持续访问。

无线漫游分类

根据无线终端STA是否在同一子网内漫游,可将其分为二层漫游和三层漫游。如果STA在不同的AP间漫游切换时始终处在一个VLAN子网中,则为二层漫游;如果STA漫游前后处于不同的子网,则为三层漫游。
根据无线终端STA是否在同一个AC(Access Controller,无线控制器)管理的不同AP之间移动,可将其分为AC内漫游和AC间漫游。如果STA在同一个AC管理的AP之间移动,则为AC内漫游;如果STA在不同AC管理的AP之间移动,则为AC间漫游。值得注意的是,由于AC间漫游涉及到不同AC之间的数据同步和转发,可能需要借助隧道技术(如CAPWAP隧道)来实现数据的跨AC转发,在下文“无线漫游的工作原理”中会详细讲解。

无线漫游的工作原理

无线漫游阶段

漫游过程中,当STA进行通信时,会持续寻找其他无线AP,并与信号覆盖范围内的多台无线AP进行认证,但只和其中一台AP进行关联。终端远离其原本关联的AP后,信号强度会逐渐降低,当低于预设信号阈值时,它将尝试连接到周围信号最强的另一台AP,从当前的BSS(Basic Service Set)漫游到新的BSS,并提供终端的无缝切换。
根据以上工作原理,我们可以将漫游过程分为如下四个阶段:
  1. 信号检测:STA在移动过程中持续检测周围AP的信号强度。当其移动到两个AP覆盖范围的临界区域时,开始评估哪个AP的信号更强、更稳定。
  2. 漫游决策:根据信号检测结果,STA会做出漫游决策。如果新的AP信号强度明显高于当前连接的AP,且满足漫游条件(如信号强度阈值、漫游延迟等),设备将开始漫游过程。
  3. 认证与关联:STA向新AP发送认证请求,并进行必要的认证过程(如WPA/WPA2的PSK、EAP认证)。认证成功后与新AP建立关联,与原AP断开连接。
  4. 数据转发:漫游过程中STA的数据传输不会中断。对于AC内漫游的设备,数据可以直接在本地转发,无需经过额外的隧道或路由。而对于AC间漫游,可能需要通过隧道技术(如CAPWAP隧道)进行数据转发。

隧道协议CAPWAP

在隧道转发模式下,AP和AC之间需要建立隧道用以传输管理报文和数据报文,数据包被封装在CAPWAP隧道中,然后由AC转发到上层网络。CAPWAP协议本身并不包括任何无线技术, 协议目前由两部组成,一是我们常说的CAPWAP隧道协议,二是无线BINDING协议。CAPWAP隧道协议主要负责完成AP发现AC等基本协议功能并规定各个阶段需要完成的任务,无线BINDING协议则说明了在各种接入方式下如何完成CAPWAP协议规定的任务。
CAPWAP建立需要经历以下六个过程:
  1. AP获取AC的IP地址,AP本身IP地址有两种,静态地址和动态地址,并且AC通过广播的方式让AP获取自己的Loopback地址,为Discovery阶段。
  2. AC和AP建立控制信道的交互,称为Join状态。
  3. AC通过镜像下发使AP升级,称为Image Data状态。
  4. AC下发配置至AP,称为Configuration状态。
  5. AP发送Data Check报文确认配置,称为Data Check。
  6. AP与AC控制和数据信道均建立成功后进入Run状态。

星融元园区无线网新架构——基于SONiC+OpenWiFi+白盒硬件无CAPWAP集中式转发

星融元借助VXLAN实现了极简的无线漫游,即AP和网关交换机之间建立的是VXLAN 隧道。AP上运行 VTEP 对用户原始数据帧进行封装和解封装,并且用不同的VNI实现网络隔离。
该方案可应用于园区网络,客户只需引入一对具备一定可编程能力的“网关交换机”以及合适的AP即可。在此我们推荐Asterfusion CX-M系列园区交换机和基于OpenWiFi 的白盒AP设备。

总结

上述的经典“AP+AC”组网解决了STA的无线漫游问题。AC统一管理AP和下发配置,能给无线用户统一做认证,无疑做到了方便管理。除此之外,该模式在很多成熟方案中可以通过设置漫游阈值来促使终端自动切换到信号更好的AP,保证漫游过程中信号不中断。
但随着物联网加速普及、网络规模不断扩大,这种传统的无线漫游设计也存在一定的问题。在大规模网络下不仅多台AC的部署,冗余的设备、链路和交换策略的设计会使运维难度逐渐增加到难以掌控的地步,无线网络中心节点AC也极易成为整网性能瓶颈。除此之外,CAPWAP大多为厂商的私有协议,不同厂商的协议标准仍在修改迭代中,这就导致不同厂家产品,甚至同厂商的一些新旧产品都无法混合组网。要想突破这些局限性,还需要对现网升级,做到精简和高效。
具体升级方案会在后续文章中讨论,详情可参考园区无线网新架构:无CAPWAP的集中式转发

一文读懂:企业园区无线网技术及部署指南


关注星融元


前言:无线网络直接影响整体网络性能,在当今企业网环境中,已有超过一半的数据流量通过无线信道传输,随着物联网技术的普及,无线网将承载更多的关键业务流量。企业/园区场景的无线网络值得考虑的关键因素有很多,例如终端移动性,AP 漫游能力和覆盖范围、带宽和吞吐量、延迟、信道、射频干扰等。当然,还有网络安全配置和用户认证等等。


无论是新建还是升级无线网络,在采取行动之前回顾并更新有关无线网的关键知识是绝对必要的,我们将从以下几个方面入手,希望这篇文章帮助您做出更好的选择。

  • 无线网络基础概念和参数速查
  • 无线标准/协议的演进
  • 不同无线组网模式和适用场景
    ○ 常见的园区无线组网
    ○ 新一代云化网络
  • 无线AP部署要点

无线网基础概念和参数速查

在无线通信系统中,信息可以是图像、文字、声音等。信息需要先经过信源编码转换为便于电路计算和处理的数字信号,再经过信道编码和调制,转换为无线电波发射出去。其中,发送设备和接收设备使用接口和信道连接,对于有线通信很容易理解,设备上的接口是可见的,连接可见的线缆;而对于无线通信,接口是不可见的,连接着不可见的空间,称为空口(空间接口)

无线网络分类

无线网络根据应用范围可分为个人网络、局域网、城域网和广域网。

 个人网络 局域网 城域网 广域网
协议标准 BluetoothIEEE802.11b,IEEE802.11a,IEEE802.11g, IEEE802.11nIEEE 802.16,MMDS,LMDSGSM, GPRS, CDMA, 2.5-3G-4G
传输速度 小于1Mbps1Mbps~600Mbps22+ Mbps1-7Mbps-100Mbps
覆盖范围 10m100~300m十几公里几十到几百公里
应用场景 点对点、设备对设备企业、园区、学校、酒店等网络最后一公里接入移动电话

无线射频

无线电波是由振荡电路的交变电流产生的电磁波(日常使用中也被称为射频或无线电等),它能够通过天线发射和接收,无线电波的频率范围称为频段。所有的射频设备都有灵敏度等级,即无线终端在某个信号强度之上可以正确地解释和接收无线电信号。灵敏度单位是dBm。接收灵敏度值越小,说明接收性能越好。

常见无线频段
手机 GSM:900/1800MHz,CDMA:800MHz
5G方案 移动(2.6G 160MHz)/3.3G 100MHz室内共建,电信、联通3.5G 3400-3600MHz移动:4800-4900MHz,广电4900-5000MHz
调频87.5MHz-108.0MHz(民用广播)
70MHz-87.5MHz(校园广播)
108-160MHz(业余无线电通讯)
160MHz以上是对讲机和电视伴音通信频率,对讲机常集中在400~470MHz和136-174MHz
无绳电话 45~48MHz
无线网络 2.4GHz和5GHz( Wi-Fi 7还有6GHz )
蓝牙 2.4GHz

天线传播覆盖

天线是一种变换器,是在无线设备中用来发射或接受电磁波的部件,它可以将传输线上传播的导行波和在空间中传播的电磁波相互转换。天线一般有全向和定向两种信号覆盖模式(如下图所示)。

天线传播覆盖

空间流和MIMO

无线电在同一时间发送多个信号,每一份信号都是一个空间流。通常情况下一组收发天线间可以建立一个空间流。

MIMO指多输入多输出技术,也称多天线技术,分别使用多个发射天线和接收天线,实现多发多收,成倍地提高信道容量。空间流数是决定最高物理传输速率的参数。我们常用(AxB:C)数据格式表示多天线技术支持的最大发射天线数量(A)、最大接收天线数量(B)和最大空间数据流数量(C)。当前主流的802.11ac和802.11ax协议规定一个射频最大8个空间流;大多数智能终端使用 2×2:2 或 3×3:3 MIMO 无线电。

MIMO

MIMO系统中,发射端的多个天线可以各自独立发送信号(引入发射波束成形技术使多个天线的发射信号在接收机达到相同相位,从而增强信号强度),同时在接收端用多个天线接收信号并重组原始信息。

MIMO技术让1x1的客户端也能间接从中受益

MIMO技术让1×1的客户端也能间接从中受益

传播衰减

⑴ 自由空间路径损耗

自由空间路径损耗(FSPL)是指无线电波因自然扩展导致信号强度下降,这是波传播的自然属性。我们可以通过以下近似公式算出。

FSPL=32.44+(20log 10 (f))+(20log 10 (D))

FSDL=路径损耗(dB) ;f =频率(MHz);D=天线之间的距离(km)

实际部署时我们通常使用6dB法则进行估算,即:传输距离加倍将导致信号衰减6dB。

⑵ 穿透损耗(吸收)

电磁波穿过墙体、车体、树木等障碍物,被不同材质的吸收,导致信号衰减。下表总结了常见障碍物对无线信号的影响

典型障碍物厚度(毫米)2.4G信号衰减(dB) 5G信号衰减(dB)
普通砖墙 120 1020
加厚砖墙2401525
混凝土2402530
石棉834
泡沫板834
空心木2023
普通木门40 34
实木门40 1015
普通玻璃 847
加厚玻璃 12810
防弹玻璃302535
承重柱5002530
卷帘门101520
钢板803035
电梯803035

⑶ 反射损耗

当波撞击到一个比波自身更大的光滑物体时,波可能会往另一个方向传递。当无线发射信号与接收位置需要经过多次反射才可触达,我们可以通过尝试调整信号源位置并辅以定向天线来改善通信。

⑷ 衍射损耗

由于射频信号被局部阻碍,射频信号在物体周边发生的弯曲。位于障碍物正后方的区域称为射频阴影,它可能成为覆盖死角,一般是可以通过另一个AP的无线信号去消除。

无线标准/协议的演进

WiFi与 IEEE 802.11

WiFi 通常是指基于 IEEE 802.11 标准的无线网络。“Wi-Fi”一词由Wi-Fi 联盟(WFA)创造,该联盟是一个全球性联盟,致力于促进和认证无线设备的互操作性。简单来说,Wi-Fi 是描述无线网络技术的流行术语,而 IEEE 802.11 是定义无线通信底层协议和规范的技术标准。

技术标准

WiFi6 的核心技术

根据Wi-Fi联盟的报告,Wi-Fi 6 自2019年推出以来仅用3年就在全球市场份额超过了50%,而Wi-Fi 5用了4年时间。WiFi 6 为每个用户提供更大的总带宽,总频谱和信道,能够在高并发接入的环境下为每个用户较前代技术高 4 倍的吞吐量,其高带宽、高并发、低时延、低耗电的特点为未来的智能基础设施奠定基础。

⑴ 提升吞吐量:1024-QAM调制

802.11ax采用1024-QAM正交幅度调制,每个符号位传输10bit数据(2^(10)=1024);相对于802.11ac(采用256-QAM正交幅度调制,每个符号传输8bit数据)来说,802.11ax的单条空间流数据吞吐量提高了25%。使用1024-QAM调制对信道条件有较高要求。

⑵ 改善多用户并发接入:OFDMA 和上行+下行的MU-MIMO

MU-MIMO 代表多用户的多输入多输出,它允许单个 AP 设备同时通过多个通道与多个用户进行通信,802.11ax(WiFi 6)在原有基础上进行了增强,提高了并发上行用户数量,理论上能够在上行和下行链路上为最多 8 个用户提供服务,并向单个客户端同时提供 4 个流。MU-MIMO生效需要通信双方都支持MU-MIMO。

OFDMA(正交频分多址)将信道进一步细分为可单独分配的“资源单元”,这是实现性能优势的关键。它允许多达 30 个用户同时共享一个信道,从而减少延迟、提高容量并提高效率。

OFDMA

OFDMA 和 MU-MIMO 的技术作为先进无线网络中的互补技术,可以基于所服务的应用类型来改善用户体验。

对于流媒体电影或游戏等高带宽应用,MU-MIMO 允许多个终端并发传输数据,建立高带宽网络以达到每个客户端的的最大速率。此外,MU-MIMO 使访问无线网络的队列从一个变为多个,多个设备可同时访问而无需等待。

对于即时消息、电子邮件或网页浏览等低带宽应用,分配给每个客户端的资源单元数量取决于数据包大小、终端设备限制以及流量服务质量(QoS)配置等因素,而OFDMA使用单个频段可以为多个用户提供这类低流量传输服务,起到类似“拼车”的效果,大大提高了网络资源利用率。

⑶ 降低信道间干扰:空分复用技术(SR) & BSS Coloring

当相同或相邻信道上的AP和终端检测到单个信道资源利用率偏高,噪声强度超过阈值时,则会需要排队等待(CCA功率调节机制)。

WiFi6协议里采用了空间复用和着色机制以提升信道利用率,减少排队。它可以类比为在客户端和AP之间建立起了虚拟的“高架桥”,根据不同目的地在空间上划分为互相独立不干扰的通路。不同的AP会各自给下连的终端着色(例如下图左,同为信道6的3个AP分别着色),只要信道资源没有完全占满,就依然会传输数据。

⑷ 降低能耗调度:目标唤醒时间 TWT

TWT(目标唤醒时间)最早出现在 802.11ah “Wi-Fi HaLow” 标准中,用于支持大规模物联网环境中的能效,并随着 IEEE 802.11ax 的发展而得到扩展。它使用计划机制来告诉客户端何时唤醒和睡眠,而不是让它们一直在某个频道上监听。

在 TWT 中,客户端和 AP 之间会商定一个时间表,该时间表由时间段组成。它通常包含一个或多个信标(例如几分钟、几小时,甚至长达几天)。当时间到了,客户端被唤醒,等待 AP 发送的触发帧并交换数据,然后重新进入休眠状态。AP 和终端设备会独立协商特定时间,或者 AP 可以将终端进行分组,一次连接到多个设备。

Wi-Fi 6E 及其他

在 Wi-Fi 6 标准发布一年后,由于频谱短缺,Wi-Fi 6e 应运而生,将现有技术扩展到 6GHz 频段。Wi-Fi 6E 使用 WPA3 代替传统的 WPA2 来增强安全性,但它仍然使用 802.11ax,因此它算作 WiFi 6 的附加增强功能,而不是下一代标准。

此外,Wi-Fi 的演进还包括几个小众项目。例如,毫米波 Wi-Fi (802.11ad/ay) 以极低的覆盖范围为代价,支持高达 275 Gbps 的标称数据速率。大量用户无线访问的新兴交互式应用和新服务,例如8K 流媒体、AR/VR、游戏、远程办公、工业物联网、云计算等等,正在推动行业支持更高吞吐量的无线网络。

WiFi 7 还有多远?

Wi-Fi 7在Wi-Fi 6的基础上引入了320MHz带宽、4096-QAM、Multi-RU、多链路操作、增强MU-MIMO、多AP协作等技术,使得Wi-Fi 7相较于Wi-Fi 6将提供更高的数据传输速率和更低的时延。

由于国内暂未开放6G频段给Wi-Fi使用,Wi-Fi 7特性未能完整发挥。目前Wi-Fi7实际生效的有以下几项:

  • 4096QAM:每个符号位传输 12bit 数据,相比Wi-Fi 6 提升20%
  • 16x16MIMO:由8×8提升到16×16空间流,增强高并发能力
  • 多链路传输:AP 和 客户端之间同时建立多个链路进行数据通信,可以利用多条链路进行负载分担,提升单用户峰值吞吐量;利用多条链路进行多发选收,提高链路可靠性。
  • Multi-RU:Wi-Fi 6 标准下同一周期单用户只能分配到 1 个 RU ,必然有部分 RU 资源被闲置。Wi-Fi 7 突破了限制,允许单用户同时占用多 RU,且不同大小的 RU 之间可以进行组合,使得业务延时降低25%。

  • 前导码打孔:支持把受干扰的20M信道打孔、屏蔽,然后剩余的140MHz信道继续捆绑在一起传输信息,极大提高了信道利用率;Wi-Fi 6中的做法一般是将工作信道限制在20M内传输,剩余信道受阻。

前导码打孔

常见的无线组网模式

自治AP(胖AP)

此类AP设备是最早进入无线网络市场的类型,因其可以近乎“即插即用”的方式工作且无需额外的控制器,建网成本极低,非常适合例如家庭、小型商户和办公室等小型无线网场景,正如其名,每个自治AP都可独立工作并且内置了基础的网络配置、流量控制、认证等功能的完整逻辑,所以每个 AP 都需要单独手动配置。

自治AP

瘦AP+ AC(无线AP控制器)

这种集中式方法涉及 2 个无线产品,包括 AP 和无线 AP 控制器 (AC)。AC在该解决方案中扮演着最重要的角色,AP 仅提供基本的无线电频率,在物理层传输 802.11 数据包,并通过无线接入点控制和配置协议(CAPWAP)与控制器建立通信。

AC 可处理多种功能,例如访问控制、AP 配置和监控、数据包转发、漫游、安全控制。它的工作原理就像无线网络的大脑一样,允许在一个地方配置和管理整个无线网络。这些使其适用于具有许多接入点的大型企业网络。

⑴ AC部署模式

  • 串联模式:AC 串接进网络,现在比较少见。
  • 旁路模式:AC只管理AP,旁路连接到汇聚交换机,让据包经由AC集中转发再传输到上层网络,适合在不改变现有网络的情况下对无线网络进行改造。

⑵ 数据转发模式:直接转发和隧道转发

并不是所有的数据包都需要经过集中式AC的封装和处理。某些情况下,数据包可以直接转发到网络的上层,但这仅适用于二层网络。隧道转发模式下,数据包被封装在CAPWAP隧道中,然后由AC转发到上层网络。如下图所示,CAPWAP隧道可能是控制数据隧道,也可能是业务数据隧道。

AP+AC

⑶ VLAN 规划和 AC 备份

VLAN规划主要包括两个方面,一是划分管理VLAN和业务VLAN,二是根据需要映射业务VLAN和SSID。由于是集中式部署,需要考虑冗余的设备、链路、交换策略,确保单点故障不影响整个系统功能,所以AP+AC架构中往往还需要多个AC互为备份。如果要为大量无线接入用户实现AP漫游,这对网络工程师来说可能是一个巨大的挑战。

  • 方案一:尽量在二层网络中规划漫游区域,但二层网络越大,安全性越差。
  • 方案二:建立连接两个WAC的隧道,将漫游流量传回原AC,但这会导致网络配置复杂,流量绕行,影响漫游性能。

除了配置相对复杂之外,多家供应商都有自己的专有协议,并在自己的产品中不断更改这些协议以改善通信。一般来说不同供应商的产品无法实现通信和交互。

属性胖AP瘦AP
技术模式 传统 新型,管理加强
安全性 单点安全,无整网统一安全能力统一的安全防护体系,无线入侵检测
网络管理能力 单台管理统一管理
配置管理 每个AP需要单独配置,管理复杂配置统一下发,AP零配置
自动RF调节 没有射频自动调节能力自动优化无线网络配置
漫游能力 支持2层漫游功能,适合小规模组网 支持2层、3层快速安全漫游
可扩展性 无扩展能力方便扩展,对于新增AP无需任何配置管理
高级功能 对于基于WiFi的高级功能,如安全、语音等支持能力很差可针对用户提供安全、语音、位置业务、个性化页面推送、基于用户的业务/完全/服务质量控制等等

无线Mesh网络(WMN)

无线mesh网络最初是为军事应用而开发的,它是一种由无需连接到有线端口的无线电设备组成的架构。无线Mesh网络中的每个设备都像路由器一样工作,其中各个节点不仅可以增强信号,还可以计算网络拓扑并进行路由,将长距离数据传输划分为多个短跳。当配置好主节点信息后,配置将⾃动同步给整个网络中其他的节点。

Mesh组网在难以或无法布线的情况下特别有用,例如临时的室内或室外区域、老旧历史建筑内等。目前已有不少厂商提供了面向企业和家庭的Mesh网络解决方案,不过一般来说无线 Mesh AP 不兼容多供应商。

无线Mech网络

在为较小的区域设计无线Mesh网络时,我们可能只需要将一两个Mesh AP连接到有线网络,如果范围扩大,我们仍然需要将多个Mesh AP 插入有线网络以确保网络可用性。部署Mesh AP 时,应综合考虑数量、传输距离和电源位置,并且应将它们放置得更近以获得更好的信号,因此往往需要更多的 AP 来覆盖给定的区域,成本随之上升(甚至会抵消其他方面节省的费用)。

值得注意的是该种组网方式最大的问题:带宽损耗。因为无线mesh组网会占用一半的带宽(还有无线传输本身的损耗),经过中继后的AP的吞吐量一般会下降约50%。

新一代云化园区无线组网模式

分布式网关转发

云网络很早就开始采用分布式的网关架构,将网关部署到更靠近终端的接入/边缘层。这种架构在转发路径、网络运维、表项空间、安全性等方面都有着显著的优势,也为企业网络的创新提供了一种很好的思路。

在这样的 IP Fabric 中,分布式网关意味着所有子网都存在于每个接入交换机上,它们会自动同步整个网络的端点 IP/MAC 和安全策略。这样,每个接入交换机都得到充分利用,所有跨子网流量的转发/漫游都由最近的交换机处理,而无需经过很长的路径到达集中式 AC。

更多信息请参阅:下一代园区网络,“分布式网关”实现更高效的无线漫游!

 集中式网关(隧道转发)分布式网关
转发路径业务报文经过隧道封装,经由集中式网关统一转发业务报文在本地接入交换机上转发
运维部署部署时需要大量手动配置(例如AP分组规划,单独的SSID/VLAN等)较为复杂,日后维护起来难度大开局一次性配置分布式网关信息即可,无需其他额外操作
可靠性过于集中的网关功能有压垮设备的风险,一旦出现故障,影响面大网关功能分散到所有接入交换机上;但设备发生故障对业务影响小
扩展性承载着关键性的网关业务,需要高性能大容量的设备,也容易成为限制网络规模迅速扩展的瓶颈接入层交换机仅需存储本地表项,对设备容量要求不高,更容易扩展接入规模

去CAPWAP的集中式转发

这种新型WLAN的设计同样基于云网络技术,相比上文的“分布式网关”其最大的优势在于无需改变现有的有线网络架构,只需部署一台可编程交换机接入核心交换机作为集中式网关,然后将旧AP替换为新AP即可完成无线网络的升级。

VXLAN

每台网关交换机拥有 3.2Tbps 吞吐量,轻松支持 10K+ 接入点 100K+ 无线终端。接入点通过 VXLAN 隧道与网关通信,接入点上运行多个 VTEP 以实现网络隔离。此外,接入点可以是完全基于开源技术的白盒硬件,而且相对于CAPWAP,VXLAN 技术也更加开放和标准化。

至于惯常思路里的无线AC,在新一代云化园区的无线网络中已经不存在了,取而代之的是使用云原生控制器(Cloud SDK)来统一管理园区内的有线和无线网络设备并下发配置——它既可以融合部署在网关交换机或其他本地设备上,也可以灵活部署在云端,从手机、电脑随时随地通过加密域名访问。

更多信息请参阅:园区无线网新架构:无CAPWAP的集中式转发

无线接入点(AP)部署要点

影响AP覆盖范围的因素

  • 无线电发射功率:室内AP不超过100mW/20dBm,室外AP不超过500mW/27dBm
  • 天线增益:室内天线增益一般在3-5dBi,室外天线增益一般大于10dBi
  • 部署环境:周围环境是否有强电磁场、障碍物遮挡、同类型Wi-Fi干扰、相似类型无线干扰,金属或者电子设备等干扰,相同信道频谱干扰
  • 天线和终端接收灵敏度:与终端设备有关

影响AP接入量的因素

芯片性能:同等无线速率下,如果是不同的芯片等级,能同时并发的用户数也不一样

射频:

  • 单射频AP最大接入128/512
  • 双射频AP最大接入256/1024
  • 三射频AP最大接入384/1536

用户流量模型:不同的用户流量也直接影响了能同时并发多少用户。

比如办公场景每人4M,推荐人数在30人;公共上网场景每人1M,推荐人数在60-100人

所需无线带宽估算

估算带宽时可以根据人数模糊概论(尤其适用高密场景),假如要求有1000人同时接入,实际使用时同时接入的人数在600人;接入的600人并非所有终端同时并发,算下来约会在200左右。

并发用户数=估算接入人数 * 并发比率

根据用户数与单用户速率需求分析可以得到总带宽需求:

总带宽=并发用户数 * 单用户速率

下表仅供参考(单用户速率参考)

场景 终端类型 并发比率(按100人算) 最低标准 推荐标准 良好体验标准
办公室 笔记本 20%—50% 100KB/S下行
20KB/S上行
200KB/S下行
40KB/S 上行
300KB/S下行
100KB/S 上行
酒店
会议室
商超 手机 5%—30% 20KB/S下行
20KB/S 上行
50KB/S 下行
20KB/S 上行
80KB/S 下行
40KB/S 上行
室外
应用速率要求时延要求
网页浏览 160-512Kbps 200KB 的页面需要3~10s
P2P 流媒体1Mbps 实时
IM(如微信等)32-64Kbps 2KB/Session,0.5s
Email400Kbps 100KB/Session,2s
SNS(如微博等)200Kbps 50KB/Session,2s
VoIP512Kbps 实时
游戏 1Mbps 125KB,100ms
视频服务(标清) 2Mbps实时
视频服务(高清) 4Mbps 实时

AP通用部署原则

  • 尽量保证 AP 与终端之间可视无障碍物;
  • 优先考虑 AP 面积覆盖与间距合理,后考虑接入人数要求。
  • AP 以正六边形方式呈蜂窝状部署(同楼层平面,上下楼层同样)

AP通用部署原则

AP的覆盖部署

  1. 尽量减少信号穿过障碍物数量,一般建议最多穿透单层墙体(典型120mm砖墙)设计,部分特殊场景(如石膏墙、玻璃墙体等) 可考虑穿过2层墙体
  2. 240mm厚砖墙、混凝土墙体和金属材质墙体不建议穿透覆盖,如在不满足约束条件时仍采用AP穿透覆盖方案,则会导致穿墙后 弱信号和漫游不连续问题,针对此种情况,如需保障良好覆盖和漫游,网络规划时需要基于客户墙体结构新增部署AP点位
  3. 重点区域、VIP区域尽量保证单独部署AP以保障用户体验。
  4. 路口或拐角单独部署AP,保证信号覆盖连续性(大于-65dBm ),相邻AP可建立邻居关系表,保障良好漫游体验。
  5. AP安装位置远离承重柱3米以上

几条重要规则

  1. 不要采取在走廊部署吸顶AP去覆盖房间,除非拿设备验证过。像学校宿舍这种场景,如果有运营收费更不能放走廊。
  2. 任何场景 AP 间距不少于 8 米。同信道 AP 间距不少于 15 米。
  3. AP 吸顶安装时,需考虑吊顶材质,若为无机复合板、石膏板,衰减较小,可安装于吊顶内,若为铝制板,衰减较大,建议安装在吸顶安装于天花上,或用美化天线。
  4. 空旷的空间工勘时,一定要考虑后期放什么东西。比如宿舍,前期是空的,但之后可能放了金属桌子;空旷的仓库,之后可能放了很多金属货架。这些都会导致信号覆盖风险。
  5. 部署前务必先去现场工勘测试。不要“看图说话”。
  6. 室外项目中,为了保证使用效果,需使用定向天线,少用全向天线。不确定的情况找当地客服咨询。
  7. 室外项目务必要求施工方做好防水防雷,否则容易造成故障。

本文部分内容摘录整理自互联网公开知识,仅供各位读者参考,如有错漏和理解不当之处,敬请谅解、指正。

开源网络监控工具Prometheus,有哪些优势?


更多相关内容


网络监控是网络管理的重要组成部分,定期网络监控可以预防故障、优化性能、规划容量,确保网络的可用性、安全性等。相比较普通的监控工具,开源网络监控工具拥有可定制性、灵活性、可扩展性等优势,受到国内外众多企业的追捧,有哪些好用的开源网络监控工具,该如何选择呢?

一、盘点好用的开源网络监控工具

1、开源网络监控工具盘点

工具描述主要特点
Cacti一种图形解决方案,可与 RRDTool 一起收集 LAN 中的性能数据。–简单的网络管理协议(SNMP)支持
–绘制交通数据图表
–易于设置的模板
–用于数据存储的MySQL数据库
Nagios Core一种流行的监控工具,具有可扩展性和易用性的界面。– 自动发现设备
– 复杂的性能图
– 通过附加组件进行定制
– PHP Web 界面 (Nagios V-Shell)
– RESTful API
Icinga 2一个灵活的工具,建立在Nagios Core之上,提供可定制的仪表板和出色的可视化功能。– 用于自定义配置的RESTful API
– 实时性能数据监控
– 对 Graphite 和 InfluxDB的原生支持
– 通过电子邮件或文本发出警报和通知
Zabbix涵盖网络、服务器、云、应用、业务监控的综合监控工具。– 网络带宽使用情况跟踪
– 网络运行状况和配置更改监控
– SNMP、IPMI 和 IPv6 支持
– 用于轻松发现设备的模板
– 警报和通知
– 支持广泛的平台
Prometheus一种用于监控时间序列数据的流行工具,拥有大量社区追随者。– 时间序列数据监控
– 用于事件通知的警报管理器
– 与各种数据源(Docker、StatsD、JMX)集成
– 用于可视化的 Grafana 集成

2、对比展现Prometheus优势

作为发行时间最晚(Prometheus发行于2016年)的开源网络监控工具,Prometheus有哪些优势呢?以传统的Zabbix为例,一起来对比吧!

 ZabbixPrometheus
监控规模集群规模上限为10000个节点支持更大的集群规模
监控对象物理机环境云环境
存储关系型数据库时间序列的数据库
服务发现PushPull/Push
配置配置复杂一个核心Server组件,配置简单
社区活跃度国内比较活跃,社区活跃度相对较低开源社区非常活跃CNCF支持

二、Prometheus 是做什么的?

Prometheus 是一款免费软件,可帮助监控和发送有关计算机系统的警报,2012年已经产生并一直存在,并在公司和组织中变得非常流行。许多开发人员和用户积极为它做出贡献。它不属于任何特定公司,由共同工作的社区管理。2016 年,Prometheus 成为云原生计算基金会的一部分。

《Prometheus》-配图-01

《Prometheus》-配图-02

核心组件:

  • Prometheus Server
  • Exporter
  • Alertmanager
  • Pushgateway
  • Service discovery

Prometheus Server是Prometheus组件中的核心部分,负责实现对监控数据的获取,存储以及查询。

1、工作流程

  1. Exporter将监控数据采集的端点通过HTTP服务的形式暴露给Prometheus Server;
  2. 在Prometheus Server中支持基于PromQL创建告警规则,如果满足PromQL定义的规则,则会产生一条告警,而告警的后续处理流程则由AlertManager进行管理;
  3. Prometheus Server与Push网络需求无法直接满足时,就可以利用PushGateway来进行中转;
  4. Service discovery:监控系统而言就意味着没有了一个固定的监控目标,所有的监控对象(基础设施、应用、服务)都在动态的变化。

2、Exporter

定义:广义上来讲,任何向Prometheus提供监控样本数据的程序都可以被称为一个Exporter,Exporter的一个实例称为Target。

《Prometheus》-配图-03

若要从Target (host or service)收集监视数据,首先必须在要收集的Target上安装收集组件,称为Exporter,他们的官网(http://prometheus.io)上有很多Exporter:

– Consul exporter (official)
– Memcached exporter (official)
– MySQL server exporter (official)
– Node/system metrics exporter (official)
– HAProxy exporter (official)
– RabbitMQ exporter
– Grok exporter
– InfluxDB exporter (official)

可根据所监控的对象选取特定的Exporter:

范围Exporter
数据库MySQL exporter, Redis exporter, MongoDB exporter, MSSQL exporter等
硬件Apcupsd exporter, IoT Edison exporter, IPMI exporter, Node exporter等
消息队列Beanstalkd exporter, Kafka exporter, NSQ exporter, RabbitMQ exporter等
存储Ceph exporter, Gluster exporter, HDFS exporter, RabbitMQ exporter等
HTTP服务Apache exporter, HAProxy exporter, ScaleIO exporter等
API服务AWS ECS exporter, Docker Cloud exporter, Docker Hub exporter, GitHub exporter等
日志Fluentd exporter, Grok exporter等
监控系统Collected exporter, Graphite exporter, InfluxDB exporter, Nagios exporter, SNMP exporter等
其他Blockbox exporter, JIRA exporter, Jenkins exporter, Confluence exporter等

工作方式:

– 注册指标:exporter需要定义要导出的指标及其相关信息
– 数据收集:exporter定期从系统或应用程序中收集指标数据
– 指标转换:exporter将收集到的指标数据转换为Prometheus的指标类型
– 暴露指标:exporter提供一个HTTP接口,通过该接口将转换后的指标暴露给Prometheus

《Prometheus》-配图-04

3、告警产生以及推送

《Prometheus》-配图-05

  • Prometheus会周期性的对告警规则进行计算,如果满足告警触发条件就会向Alertmanager发送告警信息
  • Alertmanager根据配置推送给对接的平台,支持对接多种平台告警推送

流程:

  1. 告警路由:会根据事先定义的路由配置对告警进行路由。路由配置规定了如何处理不同的告警,包括将告警发送到不同的接收者(如电子邮件、PagerDuty、Slack等)、进行静默处理或者进行其他操作。
  2. 告警抑制:Alertmanager会对接收到的告警进行去重处理,以避免重复通知。
  3. 告警分组:Alertmanager会将具有相同标签或属性的告警进行分组,以便进行更有效的通知和处理。这样可以避免发送大量重复的告警通知,提供更清晰的告警视图。

三、示例:将Prometheus与AsterNOS结合

1、为什么使用Prometheus监控AsterNOS

《Prometheus》-配图-06

2、效果展示

以星融元CX-M园区网络为例,使用Prometheus + SNMP + Grafana组合方案进行监控,能够采集系统运行数据,实现网络数据可视化以及网络架构拓扑展示。

园区方案

《Prometheus》-配图-07

在AsterNOS设备上部署Node exporter,以HTTP接口的形式暴露AsterNOS的系统运行数据,Prometheus将主动Pull数据。Prometheus获取到数据后一方面用于评估告警规则——若产生告警将由Alertmanager推送给所对接的服务;另一方面落地到Prometheus服务器本地存储中。Grafana可以利用Prometheus所存储的监控数据来进行可视化展示。

《Prometheus》-配图-08

以Node exporter所采集的数据作为来源展示

《Prometheus》-配图-10

《Prometheus》-配图-09

返回资源中心

企业网络如何做好无线网接入安全控制?

更多相关内容


对于许多企业来说,Wi-Fi 已成为用户和终端的首选网络接入技术。与有线局域网相比,无线局域网具有许多优势,比如可靠灵活,还能降低拥有成本。无线局域网安装简单,可以移动,不受物理位置的限制,而且具有可扩展性。然而,这些优点也带来了一个非常明显的缺点:安全性。

Wi-Fi 的无边界特性,再加上一系列令人困惑的传统和现代身份验证、访问控制和加密技术,使 WLAN 的安全性问题成为企业网络运维团队普遍面临的重要挑战。

什么是 WLAN 安全?

WLAN 网络安全威胁可能导致数据被盗。为了防范这种风险,安全团队要建立机制,阻止通过无线介质读取传输或接收通信以及收集敏感信息(如个人信息、登录凭证或业务数据)的企图。

企业的IT团队可以使用多种方法保护 Wi-Fi 的安全通信。其中一些方法是在管理有线和无线通信的通用方法,比如企业级身份验证机制、通过MAC地址允许列表限制企业网络访问、基于网络和设备的防病毒和恶意软件服务,以及使用第三方 VPN。

什么是 WLAN 安全?

WLAN 网络安全威胁可能导致数据被盗。为了防范这种风险,安全团队要建立机制,阻止通过无线介质读取传输或接收通信以及收集敏感信息(如个人信息、登录凭证或业务数据)的企图。

企业的IT团队可以使用多种方法保护 Wi-Fi 的安全通信。其中一些方法是在管理有线和无线通信的通用方法,比如企业级身份验证机制、通过MAC地址允许列表限制企业网络访问、基于网络和设备的防病毒和恶意软件服务,以及使用第三方 VPN。

常见的WLAN威胁和漏洞

IP 和 MAC 欺骗

如果坏人成功连接到企业 WLAN,他们可以使用工具通过更改数据包头中的源 IP 地址或篡改允许列表设备的 MAC 地址来冒充或欺骗受信任的设备。反过来,接收设备可能会在不知情的情况下接受欺骗通信。DDoS 僵尸网络和中间人攻击是最常见的欺骗手段。

DNS 缓存欺骗/中毒

DNS 欺骗是指在 WLAN 上放置未经授权的设备,欺骗其他已连接客户端使用的 DNS 服务器。反过来,被欺骗的 DNS 服务器会将试图访问可信远程资源(如网站)的用户和设备重定向到恶意资源。

恶意接入点(AP)

当坏人部署了使用相同或外观相似的服务集标识符(SSID)的无线接入点时,就会出现这种情况。毫无戒备的用户连接到恶意设备,然后流量就会被捕获和监控,甚至被重定向到恶意目的地。这些非法接入点往往模仿公司 SSID,试图让公司设备连接到它,而不是合法接入点。

外部非法接入

当 WLAN 信号传播到公司围墙外的公共空间时,某些程序会自动搜索开放的或可利用的 WLAN,用于免费上网 不法分子可以利用这些来查找和窃取敏感的企业数据。

无线局域网安全最佳实践

企业应认真规划和执行统一的策略,以保护其 WLAN 免受数据丢失和未经授权的访问。虽然最终的安全选项取决于所需的保护级别和预算,但IT团队可以遵循一些重要的提示和技巧,比如明确谁需要访问什么以及何时访问?这里的对象包括集中办公人员以及远程办公人员。

按 SSID 区分 Wi-Fi 用户和设备

各部门和设备使用 WLAN 的方式各不相同。因此,团队不能使用相同的标准保护每台设备。例如,保护支持 WPA-Enterprise 的设备和只支持 WPA-Personal 的设备的一种方法是将传统设备逻辑地划分为单独的 SSID。分段后,团队就可以对安全性较低的端点实施访问策略。

访客 Wi-Fi。为只需要访问互联网的用户和设备设置一个单独的访客 Wi-Fi SSID。访问策略可以阻止这些设备与企业网络上的任何用户或设备通信,同时还能在网络边缘之外安全地传输互联网流量。

避免信号强度泄漏到不安全区域

安装在外墙附近的接入点应仔细设置其功率级别,以减少信号泄漏到附近的停车场或公共广场。这样做有助于防止外部无线干扰,减少未经授权的用户成功连接网络的机会。

恶意 AP 检测

大多数企业级 WLAN 平台都包含监控 802.11 无线频率范围的工具,以识别恶意 AP 或可能欺骗企业 SSID 的 AP。
802.1x 身份验证与 PSK。尽可能要求用户和设备使用 802.1x 而不是 PSK 进行身份验证。这减少了每年多次手动更改 PSK 的需要。它还能防止共享 PSK,因为共享 PSK 有可能导致黑客利用 Wi-Fi 未经授权访问企业网络。

网络局域网交换端口配置

在配置将无线接入点连接到企业局域网的交换端口时要考虑到安全性。将 AP 管理 IP 地址放在分段虚拟局域网上,只允许特定 VLAN 中继到 AP。使用静态或固定MAC 地址端口安全技术,防止有人拔下 AP 插头并将未经授权的设备连接到局域网。

新一代云化园区网络架构中的内生安全

结合新一代云化园区架构的内生安全特性,星融元云化园区网络可以提供多种接入终端安全管理能力,智能保障园区网络的安全性,为IT运维团队大大减少了花费在终端安全控制上的时间和人力成本。例如:交换机将主动跟踪任何接入终端与DHCP服务器之间的交互过程,并自动学习设备信息,非法终端产生的网络流量将在接入端口被直接丢弃,不再依赖手动配置安全策略。

云化园区网络可以提供多种接入终端安全管理能力

此外,星融元云化园区网络支持与多种主流安全认证系统的对接。

AAA(Authentication Authorization Accounting,认证/授权/计费)是目前主流的认证框架体系,由接入用户、接入设备、认证服务器三部分组成,接入用户是需要获取网络访问权限的实体,接入设备一般是交换机,负责验证用户身份和管理用户接入,认证服务器负责管理用户信息。AAA可以通过多种协议来实现。

在与接入用户交互阶段:星融元云化园区网络支持802.1x(有线终端)、MAC(哑终端)、Portal(无线终端)三种认证方式。

在与认证服务器交互阶段:星融元云化园区网络支持主流的RADIUS、TACACS+两种认证协议,支持认证/授权/计费功能。

实践应用中,星融元云化园区网络和知名的开源软件FreeRADIUS进行了全方位适配开发,也和ForeScout、ClearPass、ISE等主流商用认证系统成功对接。

也和主流商用认证系统成功对接。

更多有关企业园区网络的产品和方案信息,请参考:云化园区网络解决方案

星融元无线产品一览

返回资源中心

提升企业网络WiFi体验,如何科学部署无线网络?

更多相关内容


Wi-Fi 一直是企业网络的重要组成部分。对于许多企业网络环境来说,WiFi 是大多数终端设备的主要接入方式。当终端用户连接到一个稳定的无线局域网时,最好的感知就是没有感知——因为一切都能顺畅运行。这就意味着无线局域网必须可靠,其设置必须能够支持运营目标,而这些目标可能因个别网络情况而异。

无线接入点的部署

任何无线局域网的成功配置都取决于从物理和逻辑角度对组成网络的接入点进行的科学布置。通常情况下,我们需要关注以下几点:

以空间需求和业务目的驱动 Wi-Fi 规划和设备选型

好的 Wi-Fi 设置并不是随随便便就能实现的,尤其是在大型或技术复杂的环境中。有时,IT 团队会将无线接入点(AP)安装在简单方便的区域,而不是将接入点放置在需要达到最佳性能的地方。一旦出现这种情况,最终用户体验不佳几率就会成倍增加。

不同的网络目的通常会产生不同的网络设计和接入点布局。例如,使用基于 Wi-Fi 的定位服务、提供访客访问的WLAN和为终端提供服务的 WLAN 会产生不同的设计,正确的 Wi-Fi 接入点布置取决于每个网络设置的政策、具体情况和运营目标。

灵活规划无线接入点的物理位置

不同组织在规划无线接入点的布置和物理安全时并没有一套统一的指导方针或建议可供遵循。比如有些环境需要带锁的机柜或单独的隔绝外部的空间。而在另一些环境中,机柜则是一种浪费,因为机柜的成本甚至都会高于无线接入点本身,或者已有安全摄像头覆盖了该区域,或者该空间本就不对公众开放。

在放置无线接入点时,经常出现的错误是过分关注隐藏无线AP,这使得以后很难对其进行维护。另一个错误是将接入点安装在易受攻击的区域,它们可能会被容易被非官方人员操作修改或被机器或其他设备以外撞到。

根据业务类型考虑接入点的合理布局

如今,大多数无线网络都是多用途的,它们可能会生成不同的SSID分别用于提供语音服务,供访客或受管理的企业笔记本电脑接入使用,但所有这些其实都由相同的接入点设备提供服务。每个 SSID 通常相当于一个特定的虚拟局域网,需要根据使用该 SSID 的客户类型进行安全配置。

严格控制设备管理权限

在企业网络环境中,很少会在客户端设备使用的网络上管理 AP。AP、交换机、闭路电视摄像机和一系列其他设备通常在严格控制的 IP 地址空间内进行管理,无论是使用防火墙还是访问控制列表,这些设备通常都与互联网和网络的其他部分隔绝,只有一小部分管理员可以访问这些设备,而且只有在满足双因素身份验证要求后才能访问。

监测非法接入点

无论 WLAN 如何满足操作要求,有些人可能会将无线路由器或 AP 连接到企业网络内的局域网,而他们根本没有必要这样做。个人的无知、对政策的无视或纯粹的恶意都可能促使非法无线网络设备的加入。无论这些设备出现的原因是什么,都必须提前制定应对策略。哪怕不并非寻找安全漏洞,不受控的无线接入点也会产生高强度干扰,阻碍合法用户使用企业 Wi-Fi 系统。

要最大限度地减少非法接入设备的出现,首先要制定并传达明确的政策。在这之后检测是关键,这就需要持续监控 Wi-Fi 频谱,查找可疑的信号来源。

更深层次的优化思路——架构升级

在无线接入点部署以外,我们也可以深层次地从网络架构的优化来提升无线网络的使用体验,并简化企业网络中的安全管理。例如采用分布式网关提升无线漫游的效率,简化前期部署和后期的动态维护工作。此外,架构本身自带的内生安全特性也可大大减少手动配置安全策略等枯燥又易错的运维工作。

什么是分布式网关?

星融元云化园区网络解决方案搭建是一个全三层的IP网络,一个子网的网关会以分布式的形式存在于每一个接入交换机上。它充分利用每一个接入层设备的能力,所有的跨子网转发动作在最近的分布式网关上完成,让网关功能不再成为压垮网络中某一台设备的潜在风险,同时大幅度提升整网的转发效率。

传统无线网方案对星融元分布式方案对比

对比传统的无线方案,设备发生AP漫游后的流量不再需要绕道转发,也无需在配置前期考虑网络划分的问题——网络管理员只需要在网络初始化时一次性配置好所有分布式网关的信息即可,无需在运行过程中动态调整,进一步降低运维的复杂度。

接入终端安全控制

结合认证系统和内生安全特性,星融元云化园区网络可以提供多种接入终端安全管理能力,智能保障园区网络的安全性。例如:交换机将主动跟踪任何接入终端与DHCP服务器之间的交互过程,并自动学习设备信息,非法终端产生的网络流量将在接入端口被直接丢弃,不再依赖手动配置安全策略。

云化园区网络可以提供多种接入终端安全管理能力

更多有关企业园区网络的产品和方案信息,请参考:云化园区网络解决方案 – 星融元Asterfusion

星融元无线产品一览

返回资源中心

“超堆叠”云化园区网:高可靠,但无需STP和堆叠

更多相关内容


园区网络高可靠技术的演进

STP(生成树协议)

STP技术

原理:通过生成树协议中的选举机制算法,自动阻塞一部分链路从而破坏环路。

优点:

  1. 具备冗余能力,一根链路故障,流量可切换至另一根备份链路转发
  2. 破坏网络环路,解决广播风暴

缺点:

  1. 通过阻塞端口破坏环路,既浪费链路带宽,又不能实现负载分担
  2. 故障收敛时间最快秒级(RSTP),影响业务流量
  3. 实现原理和配置相对复杂

堆叠(Stacking)

堆叠技术

原理:通过专用的堆叠端口和线缆,将多台交换机虚拟化成一台设备来使用。

优点:

  1. 具备冗余能力,且能实现负载分担转发
  2. 物理拓扑虽然环路,但通过虚拟化技术进行规避,避免发生广播风暴
  3. 故障收敛时间毫秒级,对业务流量影响小

缺点:

  1. 需要专用线缆将堆叠接口互联
  2. 升级需要堆叠组重启,影响业务
  3. 实现原理和配置相对复杂

“超堆叠”网络是什么?

星融元将云网技术引入园区网络,通过改变网络的原有架构,园区网络在保留同等的高可靠特性的前提下,不再需要运行防环协议,也无需借助运维复杂,技术专有的堆叠技术。在云化园区网架构下,集群的规模可以非常大而不必担心堆叠带宽的问题,并且与堆叠架构对外呈现的管理控制面类似,“超堆叠”网络中的交换机使用同一套配置文件模板,具有统一的管理界面,配置将自动同步到集群成员。

云园区网络架构

  • 天然无环:在Spine-Leaf架构基础上组建全三层路由网络,从根源上解决二层网络环路问题
  • 负载分担:采用路由网络天然的ECMP机制,既实现了多链路负载分担,又不增加配置复杂度
  • 快速收敛:基于BFD协议和自研的快速故障转移机制,将故障收敛时间控制在毫秒级之内

应用举例:“超堆叠”网络应用于终端双上行接入的场景

在园区网络建设中,可能包括由计算、存储服务器组成的小规模数据中心,如企业网络的办公网和研发网。和普通上网终端不同,这些服务器需要实现高可靠接入。

“超堆叠”网络应用于终端双上行接入的场景

传统园区一般采用接入交换机做堆叠的方式,而云化园区网络采用更轻量级的MC-LAG方式实现。

  1. 服务器使用两个独立网口双上连到两台Leaf
  2. 服务器两个网口通过Bond实现负载分担转发
  3. 两台Leaf横向互联,同步转发表项,实现跨设备链路聚合

总结:“超堆叠”网络对比传统堆叠架构的优势

堆叠vs超堆叠上架部署配置任务冗余能力软件升级稳定性
传统堆叠网络使用专用线缆通过堆叠接口互联创建集群、主从选举、分裂检测具备链路级和设备级的故障恢复能力需要堆叠组重启,业务会中断控制面集中,故障可能在集群内扩散
“超堆叠”网络(三层路由+ECMP)无需横向互联无需额外配置具备链路级和设备级的故障恢复能力在不中断业务的前提下升级控制面独立,稳定性更高
“超堆叠”网络(MC-LAG)使用业务线缆通过业务接口互联创建MC-LAG组、配置互联接口具备链路级和设备级的故障恢复能力在不中断业务的前提下升级控制面独立,稳定性更高

返回资源中心

什么是 NetOps 与 DevOps?

更多相关内容


当今的企业生存和死亡取决于他们快速构建、启动和改进应用和服务以实现业务目标的能力。NetOps和DevOps是支持软件持续集成,交付和部署的互补概念。

DevOps是什么?

DevOps 是一种与敏捷方法相关的软件开发方法,开发人员和系统管理员一起工作,不断构建、测试、交付和改进应用和服务。支持者表示,与使用传统的、市场缓慢的瀑布模型的孤立开发和运营团队相比,DevOps可以更好地跟上当今企业的数字需求。核心 DevOps 原则包括协作、自动化、持续集成 (CI)、持续测试和持续交付 (CD)。

NetOps是什么?

从历史上看,术语 NetOps 是网络操作的简写,即与维护、监视和排除网络故障相关的活动。但是,今天,NetOps通常是指在网络中使用DevOps原则和工具。这种现代方法也被称为NetOps 2.0,DevNetOps,NetDevOps,网络即代码和Super-NetOps。 NetOps 2.0 结合了网络自动化、编排和虚拟化,将基础架构视为代码 (IaC)。这将产生更灵活、可编程和可扩展的网络基础架构,需要更少的手动干预,并且可以跟上 DevOps 设置的加速步伐。 在某些情况下,IaC 使 DevOps 团队能够通过自动化和自助服务在整个开发和测试阶段管理应用程序的操作环境。通过将网络转移到 CI/CD 管道中,NetOps 有助于提高软件开发生命周期 (SDLC) 的效率,并最大限度地减少后期部署问题。

NetOps 和 DevOps 之间的主要区别

DevOps主要是软件开发人员和系统管理员的职权范围,而NetOps是受DevOps影响的网络方法。DevOps 有助于快速高效的应用程序开发,而 NetOps 支持快速有效地部署这些应用程序。

星融元Asterfusion对NetDevOps可编程网络的支持

AsterNOS的能力图NetDevOps对网络提出了软件编程、软件定义、按需定制、运营优化的要求,而开放网络的理念与架构方法恰恰能够满足这些要求。NOS作为网络设备的“灵魂”,NetDevOps要求NOS从封闭、黑盒的体系向开放、透明的体系演进。

AsterNOS是星融元基于标准的Linux、以SONiC/SAI作为内核,为云计算时代构建的新一代开放、开源、以业务为中心NOS。AsterNOS SDK是星融元为满足NetDevOps需求为AsterNOS设计的一套开放网络的开发环境,能够支持开放网络的使用者在AsterNOS之上高效地运维网络和开发自己的网络应用。

支持开放网络的使用者在AsterNOS之上高效地运维网络和开发自己的网络应用

更多有关AsterNOS SDK相关信息,请参阅:AsterNOS SDK-支持NetDevOps的开发环境 – 星融元Asterfusion

返回资源中心

对星融元产品感兴趣?

立即联系!

返回顶部

© 星融元数据技术(苏州)有限公司 苏ICP备17070048号-2