Skip to main content
开放网络的先行者与推动者—星融元
加入我们技术支持(Support)  TEL:(+86)4000989811

标签: 解决方案

小于10ms!基于SONiC+白盒AP的WiFi无缝漫游实测


关注星融元


无缝漫游(Zero-Handoff Roaming)或“零切换”,指的是通过一系列网络技术手段尽可能缩短无线终端在 AP 间的切换时间,实现零丢包,使用户在实际使用过程中完全感受不到因切换AP所带来的网络卡顿。

无缝漫游技术回顾,50ms为平均水平

无缝漫游对AP的配置和点位有一些基础性要求,例如配置为相同的SSID、加密方式、密码以及信道,且不同AP的信号覆盖范围须有一定合理的重叠。另外,相关的网络设备都需要支持快速漫游协议,即IEEE 802.11k/v/r,它们分别解决了何时漫游,漫游到何处以及如何快速重连的问题。

其中,802.11r对用户漫游切换耗时的影响最为直接。如下图所示,在经典的AP+AC组网模式下启用802.11r协议,终端漫游到目标 AP 之前就已经与新 AP 进行了初始握手,省去了重新协商的过程,重连时间会显著降低,并避免了漫游期间的延迟和丢包。

802.11r协议快速BSS切换的两种实现形式

基于快速漫游协议,业界普遍已经可以做到50ms左右的AP切换。但值得补充的是,市面上所提供的无缝漫游方案除了需要AP和AC同时支持上述标准协议以外,往往还使用了一些私有化协议以及特有的通信优化机制进一步提高体验,所以一般都会要求采用相同厂商、甚至相同型号的设备组网。

白盒硬件+开放软件,随手一测已是next level

前段时间我们分享过一篇有关无线网架构的文章,参阅:园区无线网新架构:无CAPWAP的集中式转发

文中简单讨论了经典的AP+AC架构,方案成熟、主流,但缺陷也不容忽视(大众槽点集中在运维难度、性能瓶颈以及私有化技术在网络升级和设备利旧方面带来的阻碍等等…)。为解决这些早已心知肚明的问题,园区网逐步进化出了更加精简的新架构,例如基于分布式网关的无线网、用标准VXLAN替代CAPWAP的集中式转发——两者各有千秋,但都是基于开放的软硬件实现,即:SONiC+OpenWiFi+白盒化的接入交换机和AP。

CX-M和AP

于是后台便有网友留言:白盒硬件+开放软件的组合,在无线漫游中的实际表现如何?结论已经写在了标题里。废话不多说,感兴趣的读者可以继续往下阅读测试结果。

测试概况

测试区域:单层办公空间(约180平米,有墙面硬隔断,日常办公场景存在一定网络干扰)

交换机星融元CX-M系列(CX206P),其上运行AsterNOS(企业级SONiC发行版)

AP配置:SSID-Asterfusion,射频参数设置为5G,40MHz,加密方式WPA2-PSK

测试终端:要实现无线局域网下的无缝漫游,除了基础网络设施,也需要终端的无线芯片甚至操作系统的支持。

智能手机无疑是当前无线漫游场景中的主力,目前绝大多主流手机早已标配支持快速漫游协议(802.11kvr),部分手机厂家还在OS层面提供了类似”智能WLAN选择”的增强功能(测试中不涉及该项);而PC端,直到Win10才有了相对完善的802.11kvr的协同支持。我们挑选了以下设备分别进行了测试。

终端802.11kvrWiFi5WiFi6 
华为 mate60 pro
联想win10专业版 Comfast CF-952AX

测试工具:

  • CloudCampus APP 3.23.11.1 (用于智能手机漫游)
  • IxChariot 6.7.0 + Endpoint 7.10 (用于笔记本电脑漫游)
IxChariot是针对应用层性能测试的一款测试工具。能够评估网络应用的性能和容量,得到网络在不同应用、不同参数下的吞吐量、时延、丢包、等性能情况。Endpoint 作为配套的测试端点,在网络两端都要安装。

测试1:智能手机漫游

AP

  1. 点位布置:AP1放置在机房,AP2放置在办公区
  2. 测试方法:测试机连接到无线网络,打开测试工具(CloudCampus APP),选择漫游体验,网关设置10.0.0.1。开始测试后,测试员手持机器在两个AP间随机来回走动(橙色路线)
  3. 测试结果:漫游过程中软件采集到了20次AP切换数据,漫游耗时稳定在10ms上下,平均8.7ms,丢包率为0

AP测试

测试2:笔记本电脑漫游

AP点位

点位布置:AP1放置在会议室,AP2放置在一楼办公区

测试方法:

①准备阶段:

  1. 准备笔记本电脑A(位于机房,有线连接至接入交换机,作为测试端点);查看IP&MAC信息,观察到其上运行的Endpoint服务正常运行。
  2. 准备笔记本电脑B(手持,作为漫游终端);查看IP&MAC信息,观察到其上的Endpoint服务正常运行。

②测试阶段:

  1. 在办公室,将笔记本电脑连接到Asterfusion无线网络,通过ARP表项确认终端已连接到办公室AP
  2. 开启笔记本电脑上的IxChariot软件
  3. 测试员手持笔记本穿梭在办公室和会议室之间(蓝色路线),使被测终端发生漫游(可在接入交换机输入show mac-address确认),在IxChariot软件上可测得漫游数据

测试结果:如图所示,测试过程中一共发生了5次漫游,漫游切换用时稳定在10ms左右

注:因园区网络内部情况复杂多变,存在大量可见/不可见、可控/不可控因素影响无线漫游实际效果,故以上测试结果仅对该次测试负责,不作为星融元(Asterfusion)园区网产品对外正式承诺的数据指标。

园区无线网新架构:无CAPWAP的集中式转发


关注星融元


1、从经典的AP+AC组网说起

谈及园区无线网,大家脑子里不免会蹦出同一个关键词。

没错,市面上常见的中大型企业/园区的无线网络组网方案,大多都是基于集中式网关转发的”AP+AC”模式。

AP+AC

顾名思义,该架构包括 AP 和AC两个关键角色。

  • AC,即控制AP的设备,旁路或直连部署皆可,但为尽量不影响现网,一般是旁挂在核心交换机上,统一管理AP并集中转发无线流量。
  • AP,这里特指所谓“瘦AP”,往往只提供基本的无线收发能力,在物理层传输 802.11 数据包。

CAPWAP在其中必不可少——AP和AC之间需要建立隧道用以传输管理报文和数据报文,它也是实现无线漫游的关键技术。

2、这种集中式转发架构,好用吗?

能成为经典一定有其原因。

首先,管理方便。AC可以统一管理AP和下发配置,不但能给无线用户统一做认证,流量集中了也方便与后端安全管理设备构建便捷通路。

其次,无缝漫游。有不少成熟方案可以通过设置漫游阈值来促使终端自动切换到信号更好的AP,漫游过程中信号不中断。

当然它还支持高可靠设计——都已经集中式转发了,单点故障总不能影响整个系统功能,那就部署多台AC设备,设计冗余的设备、链路和交换策略。倘若网络规模增大,大量漫游都得跨三层了?没问题,建立AC间隧道,把流量送回原AC继续转发。

总之,只要咱们苦练内功,前期部署做好网络规划,划分管理VLAN和业务VLAN,配置好业务VLAN和SSID映射等等等…在超大规模园区网络实现无线漫游,那都不是事儿!

单从技术角度来看问题确实都解决了,但局限性也不言自明:不光运维难度随着网络规模扩大而变得难以掌控,更不容忽视的是在物联网加速普及的背景之下,作为无线网络中心节点的AC极易成为整网性能瓶颈。

3、集中式转发有局限,试试分布式方案?

之前的确介绍过,请参考这篇:下一代园区网络,“分布式网关”实现更高效的无线漫游!

分布式网关

当时就有部分客户向我们反馈,如果需要新建或者全面更换一套园区网架构,毫无疑问基于分布式网关的无线方案非常吸引人,因为它足够精简高效——无AC,不挑AP,没有无线广播域过大的困扰……几乎免去了所有人工配置便可实现整网的无缝漫游。

可惜的是,这套无线方案依赖于云化后的有线网络。参考这篇:替代传统三层拓扑的云化园区网络 

那,有没有可能在不改变现网架构基础上单独升级无线网络,继续贯彻“精简高效”?

4、换个思路,我们真的需要CAPWAP吗?

CAPWAP大多为厂商的私有协议,为了改善通信,各家还在不断对其修改迭代,这便导致不同厂家产品,甚至同厂商的一些新旧产品都无法混合组网。

尽管在无线方案中扮演了非常重要的角色,但CAPWAP并非不可替代。让我们展开一点点联想:如果忽视规模和速度,无线漫游所需的条件和云中的虚拟机迁移是那么相似——在云数据中心内部,虚拟机动态迁移和多租户最广泛的实现就是VXLAN。

VXLAN本质上也是一种隧道技术,它通过在源网络设备与目的网络设备之间创建一条虚拟的隧道,透明转发用户数据,但它是更加标准化的。

改良后的园区集中式转发无线方案借助VXLAN实现极简无线漫游:AP和网关交换机之间建立的是VXLAN 隧道。AP上运行 VTEP 对用户原始数据帧进行封装和解封装,并且用不同的VNI实现网络隔离。

VXLAN

应用该方案客户只需引入一对具备一定可编程能力的“网关交换机”,将其旁挂在核心交换机上作为集中式网关,完全无需改变现有的基础网络。

这样的“网关交换机”单台拥有 3.2Tbps 的吞吐量,可支持同时接入 10K AP 或 640K 无线终端。结合高速端口与高性能的硬件转发能力,精心规划组网设计,可满足未来8至10年的扩容需求。

AP方面,我们推荐基于OpenWiFi 的白盒AP设备

APOpenWiFi是近年来全球最为火热的WiFi开源项目之一,凭借优秀的开放底层框架和强大的社区驱动模式,吸引了大量知名企业参与其中,现已有不少大规模商业部署案例。

如需升级AP,客户可以选择仅升级软件,更换硬件的成本也因消除厂商锁定变得更可控。由于设备管理采用的是标准的数据模型(uCentral),软硬件全面升级只需简单地将旧AP替换为新AP。

5、“AC”去哪儿了?

经典无线组网中的AC是一个独立的专用设备,而在基于VXLAN的新架构下,用于管理网络设备和下发配置的云原生控制器(Cloud SDK)既可以融合部署在网关交换机上,也可以灵活部署在云端,从手机、电脑上随时随地通过加密域名访问。

事实上,继续使用”AC”的概念来理解这个控制器软件是非常不准确的,无线设备的管理只是其中一部分功能。在我们完整的云化园区方案里,这套控制器软件是免费提供的标准组件,它通过与交换机上的 SONiC 开放 O&M 接口集成,使用基于 websocket 的协议可以实现整网有线无线的统一管理。

相关文章

通电即用,极简运维:星融元带您10分钟零配置启动超大型园区网络


关注星融元


为顺应数字经济发展潮流,越来越多企业选择云网融合,这给企业园区的运维人员,特别是中大型企业园区的运维人员带来新的挑战:随着企业规模扩大,系统和应用程序的复杂性也在增加,运维人员需要不断学习新技术,解决各种技术难题;7*24小时的监控和响应要求运维人员保持警惕,处理各种紧急情况;经济下行周期投资人可能考虑裁员以降低成本,将给运维团队带来更大的工作压力。

配图传统园区网络部署的痛点让这一局面愈发严峻:

1.大规模部署所需的时间和精力成本非常高

每次在园区中增加新设备或进行网络扩展时,运维人员不得不花费大量的时间和精力进行手动配置和调整,这导致整个过程低效且耗时。

2.人工配置容易出错

由于园区网络规模庞大,运维人员在手动配置过程中容易出现疏漏或错误,这可能导致网络故障或安全漏洞的产生。这种情况不仅增加了运维人员的工作负担,还对企业的正常运营产生了风险。

3.传统园区网络的运维成本高昂

企业需要雇佣大量的运维人员来管理和维护园区的网络设备,这不仅增加了人力资源成本,还需要投入大量的培训和管理资源来保证运维团队的效率和质量。

面对传统园区网络的种种难题,是否有一些数字化/智能化技术,可以减少运维人员工作量、提升效率呢?ZTP(Zero Touch Provisioning)可以解决这些问题。

ZTP(Zero Touch Provisioning,零配置部署)是指新出厂或空配置设备,在上电启动时采用的一种自动配置部署的功能。

设备运行ZTP功能,可以自动获取并自动加载配置文件,实现设备的免现场配置和部署,从而降低人力成本,提升部署效率。

星融元云化园区网络解决方案利用ZTP技术加上星融元AFC-CCN控制器,即可实现大规模自动化开局和极简化运维。

10分钟大规模网络零配置开局

传统园区网络手动配置调整的过程低效耗时,使用ZTP技术,无需人工参与配置命令行,一通上电,设备就可以自动加载配置。星融元全系列交换机支持ZTP功能,可以通过DHCP可选字段获取配置文件路径信息,从文件服务器获取配置文件,并自动加载,实现网络的零配置开局,降低方案开局配置操作的工作量,缩短业务上线时间。

结合AFC-CCN控制器即可实现大规模园区网络的统一纳管,运维人员只要进入一个后台就可以统一管理有线网络和无线网络,两套系统的时代已经过去,ZTP可以支持园区网络的安全防御,通过自动化的安全策略下发和实时监测,提供更强大的网络安全保障。

AFC-CCN

鼠标点击1-2次便可实现日常运维

传统园区网络中,要想开通信业务,需要根据业务要求配置网络设备、设置VLAN、子网、IP地址等网络参数,还需要进行设备初始化和连接测试;下发安全策略前也需要访问控制列表(ACL)、配置VPN和防火墙或者安全设备,人工操作越多越容易出错。

云化园区网络方案中无线网络的搭建由控制器独立完成,只需点1-2次鼠标就能实现日常的业务开通和下发安全策略,当园区增大、业务和用户增多,运维人员在后台便可实现“一键扩容”,保持原有网络稳定的同时还节约了购买新设备的成本。

随时随地查看网络运行状态,网络资源一目了然

星融元AFC-CCN支持网络资源可视化,园区网络整体情况一目了然;系统实时上送日志告警,一旦出现网络故障,可以进行精准定位。AFC-CCN控制器可以支持本地部署也可支持云上部署,支持在手机、电脑上随时随地通过加密域名访问控制器,即使在喝下午茶,运维人员也可以通过手机对网络状态进行实时监控。

AFC-CCN

以下视频对星融元CX系列产品的ZTP功能进行了验证,展示了一台CX交换机是如何通过ZTP功能完成自动部署的过程。

通过自动化和智能化的网络设备配置和管理,星融元云化园区网络方案利用ZTP技术+AFC-CCN控制器提高了园区网络的部署效率和一致性,让网络更加容易快速扩展/变更;适应了园区网络快速发展的需求,减少了人工操作和维护的工作量,提高了网络的稳定性和可靠性,为网络的部署、配置、管理和安全带来了许多便利和优势。

方案拓扑

随着物联网、云计算和人工智能等技术的不断进步,园区网络将面临更多的挑战和机遇。基于对网络架构的深刻理解和已在云网络中大规模部署的技术,星融元创新性地重构了传统园区网络的架构,实现了对网络的自动优化和智能决策,让园区网络的智能化发展迈上一个新的台阶,将为企业和用户带来更加高效、可靠、安全的网络体验。

相关文章

全面升级!对比SDN园区方案,云化园区方案好在哪?


关注星融元


SDN的概念提出已十几年,至今却仍不温不火,当下主流的SDN控制器方案集网络的部署、配置、分析为一体,比起传统网络更具优越性,却并未获得市场成功。

Hype Cycle for Enterprise Networking

Gartner在2021和2023发布的《Hype Cycle for Enterprise Networking(企业网络技术成熟度曲线)》中,SDN技术因未能引发大量市场兴趣,被归为obsolete“过时”,相较于SDN,SONiC在园区网络建设中如火如荼。随着SONiC的广泛普及,客户可以按需从不同的基于SONiC的服务商获得网络服务,云化园区基于开源SONiC,这和SDN园区方案有着质的区别。

下文将全面对比星融元云化园区方案和SDN园区方案。

网随人动,策略随行

  1. 云化园区无需控制器,通过交换机组网和配置即可实现网随人动和策略随行,但SDN园区方案需要依赖SDN控制器。
  2. SDN园区方案通过VxLAN实现网随人动和策略随行,涉及Underlay(物理网络)和Overlay(虚拟网络),不仅配置复杂,还涉及隧道封装和解封装,报文头开销更大,网络负担比较重,而云化园区只涉及Underlay,技术框架更简单,配置和部署更方便。

对比图

有线无线统一管理

云化园区通过一个符合TIP OpenWiFi标准的轻量级网络控制器即可实现有线无线统一管理,不再需要传统的AC控制器;SDN园区仍需要AC控制器负责AP上线,并且有线无线统一管理依赖于SDN控制器(SDN控制器调用AC控制器的API接口),方案更沉重。

对比图

流量编排

  1. SDN园区的服务链功能需要SDN控制器、Leaf交换机、Spine交换机相互配合,缺一不可,而云化园区仅需一对流量编排交换机即可。
  2. SDN园区的服务链功能在原始流量之上封装了VxLAN,又在VxLAN之上扩展了服务链字段,报文开销大,网络负担沉重,而云化园区不对原始流量做任何改动,转发和处理更高效。

对比图

业务网与可视网相融合

  1. SDN园区方案的厂商是没有可视网方案的,一般与第三方进行方案集成和合作,而云化园区可以提供整套业务网+可视网的融合方案。
  2. 由于SDN园区方案采用VxLAN,在流量采集时还需考虑如何去除VxLAN的封装,对流量采集设备要求较高,而云化园区对原始流量未封装处理,对流量采集设备没有特殊要求。
  3. SDN园区方案需要对每一个Leaf交换机做流量采集,而云化园区仅需采集若干Leaf上联的Spine即可,采集点大大减少,节省可视网建设成本。
  4. 云化园区支持基于用户过滤流量,而SDN园区方案无法实现。

对比图

控制器成本

  1. 云化园区的控制器无需占用太多的服务器资源,部署成本更低。
  2. 云化园区的控制器更轻量级,功能精简实用,部署和配置简单,运维成本较低。

对比图

成本低、配置方便、原始流量转发处理更高效……与SDN园区方案相比,云化园区方案还在技术路线和开放性方面有所突破,更符合未来园区网络发展趋势,能够更好地满足不断增长的网络需求和日益复杂的应用场景。随着云化园区方案的推广和应用,将为园区的数字化转型智能化发展提供有力支持。

对比维度SDN园区(如AD园区方案)云化园区
技术路线1、基于VxLAN构建虚拟网络
2、通过沉重的SDN控制器进行管控
1、基于Leaf-Spine的全三层组网架构
2、通过轻量的云端面板管理
开放性私有NOS和私有技术实现有线/无线均采用开源开放的系统架构

星融元新一代云化园区方案已经推出,还在等什么?来试试吧!一起推动园区网络方案的新变革!

相关文章

Sora催化算力需求暴涨,星融元为泛在算力构建开放网络


关注星融元


龙年伊始,AI领域又出重磅新闻:OpenAI发布文生视频大模型Sora,生成式AI迎来新里程碑。

从技术层面来看,Sora的进化速度近乎不可思议。2023年6月发布的Gen-2只支持4秒视频生成并且掉帧明显得像幻灯片,11月,Meta发布的视频生成大模型Emu Video可以生成512*512、每秒16帧的视频,3个月后发布的Sora已经能够做到生成任意分辨率和长宽比的视频,还能够执行一系列图像和视频编辑任务,根据文本提示创建详细的视频、通过静态图像生成视频。

用于文章的配图

Sora根据文字提示生成的视频截图

AGI行业的快速发展需要大量模型训练和推理,推动算力需求持续高涨。在实际应用中,并不是所有的计算资源都能被充分利用,在计算、数据处理等过程中,大量算力被“闲置”,此时可以考虑泛在算力,从计算、存储和网络服务三个方面提高算力利用率。

泛在算力需要稳定的网络来连接各种计算资源,开放网络的高带宽、低时延、传输稳定性和可靠性等特性为泛在算力提供更多应用场景和可能性。国内企业想乘AI技术东风,推动数字化和智能化的发展,却不知道应该选择什么厂商来提供网络服务?


星融元致力于为泛在算力构建开放网络,业务覆盖云网络、高性能计算/人工智能、企业数据中心、园区接入等领域,同时支持分布式存储、网络可视等功能,在保障规模、带宽、时延及稳定性等性能的同时极大降低成本。

以Sora为例,由于Sora基于“Patch”而非整个视频进行训练,类似于大型语言模型(LLM)中的文本标记,把所有类型的视觉数据转换为统一的表示从而进行大规模的生成式训练,这一过程需要高效处理大量数据,星融元星智AI网络解决方案轻松组建智算中心万卡网络:

  • 在不影响数据传输性能的情况下,精简网络架构,极大降低用户网络建设成本;
  • 将网络转发路径跳数降低至1跳,大大减少业务时延;
  • 简化网络结构,降低运维以及故障排查难度。

Rail-only 架构图

在网络性能方面,Asterfusion星智AI网络解决方案有以下优势:

提升了单机网络带宽

  1. 增加网卡数量,初期业务量少可以考虑CPU和GPU共用,后期给CPU准备单独的1到2张网卡,给GPU准备4或8张网卡;
  2. 提升单机网卡带宽,同时需要匹配主机PCle带宽和网络交换机带宽,星融元200G、400G、800G以太网交换机将配合网卡确保数据传输高带宽;

200G、400G、800G

应用RDMA网络(RoCE)

  1. 借助RDMA技术减少GPU通信过程中的数据复制次数,优化通信路径,降低通信时延;
  2. 通过Easy RoCE一件下发复杂的RoCE相关配置(PFC、ECN等),帮助用户降低运维复杂度;

应用RDMA网络

减少网络拥塞

  1. 减少网络侧时延,提高GPU使用效率:超低时延降至400ns;
  2. 通过DCB协议组减少网络拥塞:通过PFC、PFC WatchDog、ECN构建全以太网零丢包低时延网络。
  3. 双网分流:CPU的流量与GPU流量彻底分离开,减少不同网络流量的占用和干扰。

用于文章的配图

作为开放网络领域的先行者,星融元持续为客户提供性能优越、成本优势明显的产品和方案,助力企业实现更高效的运营与发展。依托先进技术和丰富经验,星融元将为泛在算力的发展开辟更广阔的空间,为行业带来更多的机遇和可能性。

相关文章

星融元针对LLM大模型承载网发布星智AI网络解决方案


关注星融元


人工智能是数字经济的核心驱动力,AI 大模型是人工智能的新引擎。近年来,随着 ChatGPT 等生成式人工智能(AIGC)的突飞猛进,业内领军企业竞相推出万亿、10 万亿参数量级别的大模型,还对底层 GPU 支撑规模提出了更高的要求,达到了万卡级别。然而,如何满足如此庞大规模的训练任务,对网络的规模、性能、可靠性和稳定性等方面提出了前所未有的挑战。

一、AI大模型型对智算中心网络的需求

  • 应用计算量呈几何级数增长,算法模型向巨量化发展,当前 AI 超大模型的参数目前已经达到了千亿~万亿的级别。训练这样的模型,毫无疑问需要超高算力。AI 超大模型训练使用GPU训练,互联网络需求在100Gbps~400Gbps,使用RDMA协议来减少传输时延可提升网络吞吐。
  • 在 AI 大模型训练场景下,机内与机外的集合通信操作将产生大量的通信数据量。流水线并行、数据并行及张量并行模式需要不同的通信操作,这对于网络的单端口带宽、节点间的可用链路数量及网络总带宽提出了高要求。
  • 网络抖动会导致集合通信的效率变低,从而影响到 AI 大模型的训练效率。因此在AI 大模型训练任务周期中,维持网络的稳定高效是极其重要的目标,这对网络运维带来了新的挑战。
  • 在数据通信传输过程中产生的网络时延由静态时延和动态时延两个部分构成,其中真正对网络性能影响比较大的是动态时延。动态时延包含了交换机内部排队时延和丢包重传时延,通常由网络拥塞和丢包引起。
  • 由于 AI 大模型训练中集群规模大,这进一步增大了配置的复杂度。在庞大的架构和配置条件下,业务人员能够简化配置部署,有效保障整体业务效率。

AI 大模型对网络的需求主要体现在规模、带宽、时延以及稳定性等几个方面。从当前数据中心网络的实际能力来看,完全匹配AI 大模型的需求在技术上仍然有一定的差距。

AI大模型型对智算中心网络的需求

二、传统承载网络在AI算力网络的不足

随着大模型训练对于算力需求的不断提升,智算GPU从千卡到万卡,面对万卡以上的建设需求,传统网络解决方案为三级CLOS架构,通常让一台服务器配8块GPU卡,对应的8张万卡连接到单个HB域中的8台Server Leaf上,实现同一卡号GPU在一个Server Leaf上通信。同时为了确保高速转发,每个层级要保证1:1无收敛,以128端口盒式设备为例,Server Leaf和Spine设备的端口分配为上下各64个端口,Super Spine设备的128个端口全部用于下行接入,基于这样的端口规划,整体网络规模有8个HB域,64个POD和64个Fabric,网卡接入规模为32768。

可以直观的看到,整体网络架构极为复杂,不但网络建设成本高,网络转发路径跳数多,并且后续的运维和故障排障极其困难。

传统承载网络在AI算力网络中的不足

全Full Mesh网络成本高

  • 跨 Leaf 交换机,转发路径有 3 跳,跨POD流量跳数更多,极大的增加了业务时延
  • 网络结构复杂,运维以及故障排查困难

以32768个GPU,128端口交换机组网为例:

  1. CLOS层数:3层
  2. 交换机需要:1280台=((64+64)*8)+256
  3. 光发射器数量:196608
架构两层胖树架构三层胖树架构
同GPU卡号转发条数1跳3跳
不同GPU卡号转发条数(无优化情况)3跳5跳

为了缩小技术上的差距,星融元推出星智AI网络解决方案,针对LLM大模型场景构建了一张大规模、低时延、大带宽、高稳定、自动化部署的AI承载网

三、Asterfusion星智AI网络解决方案

1、方案介绍

与传统方案相比,星智AI网络消除了跨GPU服务器不同GPU卡号之间的连接,只保留了与GPU相连的Leaf层交换机,将原本用于上连Spine的端口全部用于下连GPU,进一步提高Leaf交换机连接效率,并且这种网络架构仍然可以通过转发实现不同HB域之间的通信。

不同智算节点服务器间相同编号的网口需要连接到同一台交换机。如智算服务器 1 的 1 号 RDMA 网口,智算服务器 2 的 1 号 RDMA 网口直到智算服务器 N 的 1 号 RDMA 网口都连到 1 号交换机。

Asterfusion星智AI网络解决方案

在智算服务器内部,上层通信库基于机内网络拓扑进行网络匹配,让相同编号的 GPU 卡和相同编号的网口关联。这样相同GPU 编号的两台智算节点间仅一跳就可互通。

不同GPU编号的智算节点间,借助NCCL通信库中的Rail Local技术,可以充分利用主机内GPU间的NVSwitch的带宽,将多机间的跨卡号互通转换为跨机间的同GPU卡号的互通。

星智AI网络解决方案轻松组建智算中心万卡网络,满足用户智算中心网络建设需求的同时,也避免了传统网络在智算中心的不足。

  • 不影响性能的情况下,网络架构精简极大的降低用户网络建设成本
  • 网络只需1跳,减少业务时延
  • 网络结构简化,降低运维以及故障排查难度

以32768个GPU,128端口交换机组网为例:

  1. CLOS层数:1层(Rail Only)
  2. 交换机需要:256台
  3. 光发射器数量:65536
  4. 网络成本最大可降低:75%

2、方案优势

性能提升①:提升单机网络带宽

(1)增加网卡的数量,初期业务量少,可以考虑CPU和GPU共用,后期给CPU准备单独的1到2张网卡,给GPU准备4或8张网卡;

增加网卡数量

(2)提升单机网卡带宽,同时需要匹配主机PCIe带宽和网络交换机的带宽;

网卡速率40G100G200G400G
PCIe3.0*83.0*164.0*164.0或5.0*16
交换机Serdes4*10G4*25G4*50G8*50G

性能提升②:应用RDMA网络(RoCE)

(1)借助RDMA技术,减少了GPU通信过程中的数据复制次数,优化通信路径,降低通信时延;

借用RDMA技术(2)通过Easy RoCE技术,一键下发过去比较复杂的RoCE相关配置(PFC、ECN等),有效帮助用户降低运维复杂度;

性能提升③:减少网络拥塞

(1)减少网络测时延提高GPU使用效率:超低时延~400ns;

(2)通过DCB协议组减少网络拥塞:PFC、PFC WatchDog、ECN构建全以太网零丢包低时延网络;

减少网络用塞

随着 ChatGPT、Copilot、文心一言等大模型应用的横空出世,AI 大模型下的智算中心网络也将带来全新的升级。星融元持续投入研发,星智AI网络解决方案在一次次客户实地检测中得到认可。我们将与AI厂商通力合作,逐步推动AI 大模型下的智算中心网络关键技术的成熟与落地,针对用户场景,我们不断追求更加美好的解决方案,期盼与众多合作伙伴共同打造大规模、高带宽、高性能、低时延以及智能化的 AI 大模型智算中心网络。

背景内容参考中国移动研究院《面向AI 大模型的智算中心网络演进白皮书(2023 年)》

相关文章

AI时代,如何吃下数据传输这块蛋糕?


关注星融元


“30台AI服务器1个亿?这就是在抢钱啊!”

近日,中国移动江苏有限公司发布《中国移动智算中心(南京)2023年智算算力项目算力设备采购项目》招标公告,招标项目内容显示,需采购30台人工智能通用计算设备(训练型),预估金额10890万元(人民币/含税),单价限价363万元/台。

招标公告

从2021年底ChatGPT上线迅速引发广泛关注后,AI行业持续火爆至今,随着行业巨头纷纷下场,AI基础设备的军备竞赛如火如荼。AI训练模型需要大量数据和计算资源,这对网络基础设施提出较高带宽和低时延的要求,很多人立马会想到InfiniBand,但昂贵的方案价格、无法与其他网络设备互通互访的特性以及较长的供货周期让国内AI厂商犯难,基于Ethernet的RoCE方案成了数据传输的首选:提供媲美InfiniBand的高宽带低时延性能,加上较低的成本,网络使用RoCE方案已经成为AI厂商的必然发展趋势。

AI技术需要强大的计算资源来支撑,具有强并行计算能力的GPU能够大幅提升计算效率,缩短AI训练模型时间,配备合适的网卡能够充分发挥GPU的性能,但GPU芯片供应常年短缺,对AI厂商来说抢到GPU已属不易,更遑论挑选型号,采购GPU和网卡的流程往往同时进行,此时无法预判究竟应该配备200G还是400G的网卡。

omdia research

网卡负责处理网络通信与数据传输,无法确定网卡参数时,可以通过200G/400G RoCE的混合组网来简化管理和部署,使数据中心拥有更好的可扩展性。在混合组网的落地过程中,时常有参数流量超越线路带宽、网络丢包的风险,产生训练速度降级,GPU资源闲置率过高等问题,军备竞赛当前,应该挑选哪家厂商承担基础设施建设的重任?

目前中国市场上的交换机有多种规格,1G/10G/25G/40G/100G都比较常见,市面上200G端口的交换机凤毛麟角,少数厂家能提供200G低密度宽口或是框式交换机,在网络扩展升级的灵活性、成本效益方面都存在劣势;400G端口的交换机也较少见,一般用于高性能数据中心或大型企业网络中,因此能够提供200G/400G RoCE混合组网的厂商十分有限。

星融元作为国内新一代开放云架构解决方案的提供商,7年来始终大力投入研发,拥有众多技术创新,是业界唯一能够提供200G/400G RoCE混合组网、无缝衔接、且网络无损的开放网络厂商。

基于RoCE的分布式概念

星融元采用基于RoCE的分布式概念替换了传统机框,相比较框式交换机,星融元盒式交换机拥有高性价比、低故障率、低时延等优点,星融元200G交换机在2U盒式形态下提供64高密度端口,能够提供更大的接入能力,与400G交换机混合组网部署网络,充分满足客户需求。另外星融元“零丢包”数据传输特性保障了网络的稳定性和可靠性,让AI厂商模型运行不中断,为高性能计算集群提供了真正意义上的低时延、零丢包、高性能的网络

名称型号硬件指标数量备注
交换机Asterfusion CX664D-N/664口200G低时延交换机
服务器超聚变CPU:Intel Xeon Platinum 8469C
内存:2048G
8/
Mellanox网卡MCX755106AS-HEAT Mellanox CX-764/
BlueField-38
网卡驱动MLNX_OFED-5.8///
GPUNVIDIA H800NVIDIA Corporation Device 232464/
操作系统Ubuntu22.04///
CUDAV12.2///
OpenMPIV4.1.3///
GPU驱动V535.129.03///
NVIDIA FabricmanagerV535.129.03///
NCCLV2.18.5///

客户现场软硬件环境&性能测试指标

GPU Server-Leaf-Spine-Leaf-GPU Server

Bond RoCEv2带宽GB/sQP=0QP=128QP=300QP=1024TX_UTIL
Hash enhancement186.32300.32344.64355.2598.62%
No Hash enhancement186.84296.84338.26349.5297.13%

GPU Server-Leaf-GPU Server

Bond RoCEv2带宽GB/sQP=0QP=128QP=300QP=1024TX_UTIL
Hash enhancement187.14301.39342.91351.8498.84%
No Hash enhancement187.32297.84339.38349.3296.60%

在多次客户实地RoCE能力测试中,星融元使用Asterfusion CX-N超低时延云交换机搭建AIGC网络,完成RoCEv2吞吐性能测试、网卡Bond性能测试和NCCL all_reduce_perf测试,AIGC计算节点完成RDMA配置和性能优化,获得客户的认可。

AI对市场竞争格局的影响愈发明显,200G/400G交换机的需求越来越多,提出高带宽、低时延、大规模部署的技术要求,同时也带来了诸多市场机会,“重金求设备”便可一窥趋势。

准备好迎接AI基础设施这一波“泼天的富贵”了吗?星融元准备好了。

相关文章

星融元新一代NPB方案助力头部金融客户降低40%网络运维成本


关注星融元


为方便人们管理和监控数据中心的运营情况,通常采用可视化方案,以便管理员直观地了解数据中心的整体状态、各项指标的变化趋势以及故障的发生情况,从而及时做出调整和应对;然而传统的可视方案依靠专用的汇聚分流设备来采集、汇聚和过滤需要监控的流量,这样的方案带来了巨大的成本、极高的复杂性和频繁的维护。

为优化可视化解决方案,世界各地的工程师做了诸多尝试,其中金融行业尤甚。基于金融行业对于信息安全和数据监控的严格要求,国外客户采用先进技术降低成本和运维难度。

配图

O客户是中东欧最大的商业银行之一,A客户是西欧最大的跨国金融机构之一,金融行业数据中心作为汇聚分流器的最典型应用场景,这两家客户在多年的实践中积累了丰富的运维经验,并对可视网络的发展有着独特的见解。开放网络浪潮在全球范围内盛行的今天,O和A客户不约而同地把目光投向开放网络,期望在可视网络领域也能享受到开放网络的红利。

星融元联合海外合作伙伴,向O和A两家客户推出了新一代的可视网络解决方案:

  1. 1.标准化白盒交换机:使用基于商业交换芯片的标准化白盒交换机替代传统昂贵、复杂、不易维护的专用设备,降低客户设备购买成本和人员培训成本。借助商用交换芯片飞速发展的潮流,可视设备的端口速率也可以轻松达到200G,400G甚至800G,为数据传输提供更高带宽、更快传输速度、更高连通性和更低时延,即使在处理大规模高频交易的业务流量时,也能保障汇聚、分发和流量预处理的速度。
  2. 2.基于开源架构的软件:在SONiC容器化开源架构的基础上,实现汇聚、分流的基础功能,可以部署在任何符合SONiC标准的白盒交换机上,避免因软硬件不适配重新采购造成资源浪费。开源架构的软件
  3. Spine-Leaf组网架构:传统可视网络的部署方式下,新增采集或分发节点会对网络产生影响,不易于网络的扩展,采用Spine-Leaf组网的新一代可视网络架构,可以轻松扩展数以百计甚至千计的采集和分发节点,满足客户业务拓展需要。技术方案可参考《下一代园区网络,用Leaf/Spine架构替代传统三层拓扑》
  4. 池化深度业务处理:扣卡、网卡、交换机形态的所有DPU芯片资源池化,按不同用户流量处理需求提供所需的高级功能处理,资源利用率高且灵活,打破高级功能处理性能与单设备性能绑定的困局。资源池

通过上述改变,星融元的新一代可视网络解决方案降低了O客户和A客户40%以上的TCO,让客户真切感受到了拥抱开放网络带来的便利和好处。

提供优异服务,成就客户和同伴,星融元通过开发一系列针对金融行业数据中心不同应用场景的解决方案,获得了众多金融客户的认可。未来,星融元将继续努力,为客户提供更具竞争力的产品与解决方案,提升客户网络性能、稳定性与安全性,实现合作共赢。

相关文章

开放网络+私有云=?星融元的私有云承载网络解决方案实例


关注星融元


在全世界范围内的云服务市场上,开放网络一直是一个备受关注的话题。相比于传统供应商的网络设备,开放网络具备软硬件解耦、云原生、可选组件丰富等优势,对云服务商和超大型企业有足够的吸引力。

SONiC作为开源的网络操作系统,使得新一代网络中的高级可编程性成为现实。在Gartner 2023年发布的企业网络技术成熟度曲线中,由微软发起并开源的SONiC已经取代了往年“开放网络”的概念,并被Gartner称为“网络领域的Linux”,SONiC无疑成为了开放网络操作系统的最佳选择。包括微软、阿里巴巴在内的诸多云服务商选择在自己的生产环境中运行SONiC,以获得更高的性价比和灵活性,同时摆脱对传统网络设备厂商的依赖。

文章配图

相较于头部云服务商基于SONiC架构自研操作系统的做法,另一种更具性价比的方案备受青睐:采购支持SONiC的白盒交换机,并运行开源版本的SONiC软件,T就选择了这种方案。

T是一家全球化的通信服务提供商,为客户提供基于云的服务,帮助企业通过API建立和扩大他们的通信能力。T的网络基础设施遍及全球,基于自身的私有全球云网络,他们可以为客户提供比传统电信公司更优质、更可靠的服务。

在长期实践中,T享受了开放网络的便利,也遇到了种种挑战:

  • 首先,SONiC的开源版本迭代周期长,并且没有明确的路标可供参考。当急需某个开源版本不具备的特性时,通常需要被动等待很久,而自行开发又需要大量的研发投入,如何平衡等待时间与研发投入之间的关系成了一个问题。
  • 其次,开源版本存在不少已知或未知的bug,运维人员(通常是网络工程师)并不具备直接解决这些bug的能力,在生产环境上规避bug给运维人员增加了大量不必要的工作量。

星融元私有云承载网络解决方案

助力T客户构建自身网络

星融元的SONiC企业发行版AsterNOS凭借脱胎于SONiC的开放性及标准化能力,联合行业领先的OpenStack软件供应商Canonical形成了完整的私有云解决方案,采用全盒式CLOS架构、高性能网络Overlay、统一云管、INT遥测-全面掌握网络安全,解决了传统数据中心网络转发性能瓶颈、功能扩展受限、部署运维低效等问题。T通过采购星融元CX-N系列交换机,使用星融元私有云承载网络解决方案,攻克了种种技术难题。

全盒式CLOS架构提升接入层与汇聚层的高可靠性

星融元私有云网络解决方案采用星融元CX-N系列全盒式设备构建CLOS架构网络,单Pod最大可支持10W+虚机条目;同时还可以进行多Pod扩展,以实现更大规模的网络接入能力;结合BGP等价路由负载、MC-LAG、Monitor-Link联动等技术实现接入层和汇聚层的高可靠保护机制。

AsterNOS在开源版本的基础上对数据中心常用功能如BGP EVPN和VXLAN做了增强,并领先于开源版本提供了EVPN Multihoming能力,使T客户在接入层可靠性上多了一种更高效的选择。

全盒式CLOS架构

CX-N全开放NOS提升用户网络管控效率

CX-N系列交换机搭载的AsterNOS是星融元为云计算业务场景设计开发的一款全开放、高性能、高可靠、功能易扩展的云网操作系统。采用了标准的Linux内核、开放的容器化架构,并向最终用户提供系统集成环境与开发套件,支持用户将运营经验工具化的插件、新业务功能模块集成部署在AsterNOS之上,提升最终用户网络管控的效率以及满足新业务场景对网络功能的需求。

T使用的Prometheus + Grafana的运维组合,在过往的运维经历中和设备的相性并不很好,而AsterNOS可以将Prometheus运行在容器化环境中,从而能够更高效地获取设备的KPI指标,从而提升运维效率。

全开放NOS

星融元持续致力于开放网络领域,为客户提供标准化、开放的产品和解决方案的同时,通过丰富的研发和运维经验将客户需求落实到具体的解决方案,帮助客户更好地拥抱开放网络。

CX-N系列产品在T客户这一全球化的通信服务提供商私有云领域的成功商用,一方面为我们树立了业界标杆,也提供了持续推动开源网络发展的信心;另一方面也为云服务商的网络架构优化提供了参考:星融元致力于为客户降低TCO,提供统一纳管、高效运维的产品,可为云数据中心多业务融合、高性能计算、大数据分析等多种业务场景提供卓越的网络服务。

相关文章

互联科技:全域托管云赋能百行百业的数字化转型


关注星融元


在这个数字经济时代,云计算技术为企业提供了更加高效的业务管理机会,百行百业加速上云。对比几种云网方案,目前公有云方案存在可控性低、数据暴露风险、个性化需求难以满足、服务受限等问题;私有云方案存在建设成本高、建设周期长、弹性差、复杂度高、扩展受限等问题。互联科技作为科创型数字新基建龙头企业世纪互联(VNET.US)集团全资子品牌,推出的全域托管云方案则恰好弥补了公有云方案和私有云方案的缺点,更加灵活、弹性、可靠、安全。

互联科技全域托管云降低中小企业业务上云成本

世纪互联数据中心有限公司是全球具有重要影响力的网络空间基础设施服务提供商之一,也是中国领先的第三方中立数据中心运营商之一。作为世纪互联的全资子品牌,也是世纪互联创新推出“大定制+新零售”双引擎战略中“新零售”业务主体,互联科技致力于成为客户数字化转型全生命周期的合伙人,通过整合数据中心机柜服务、云原生服务、网络服务、运维管理服务,互联科技逐步搭建起成熟完善的全域托管云服务,并面向未来构建超互联新算力基础设施,助力数字经济快速发展。依托世纪互联近30年深耕数据中心的经验,互联科技拥有包括全国30+城市的50+数据中心“主战场”和强大网络连接能力。

托管云(Managed Cloud Services)是指一种云计算服务模式,旨在帮助IDC托管客户构建并管理其云计算基础设施,以便客户可以在获得专属云服务的同时更专注于自己的业务。“全域托管云”解决方案为客户提供企业级一站式全域IT服务,通过新模式新平台助力上云新途径。

星融元CX-N交换机助力互联科技全面加速托管云业务

为保障弹性托管云方案的数据传输和存储,支持网络的高效流转,经过多家厂商的激烈对比,互联科技选择了全开放、性能优、资源利用率高的星融元CX-N系列云网交换机,为互联科技提供托管云的承载网络。

快速集成

利用星融元交换机的开放架构,互联科技的云管系统可以通过调用星融元交换机RESTful API快速将交换机的管理和配置工作集成到云管系统当中。星融元交换机除了提供原子级RESTful API的调用,针对云网下发配置,还提供事务级RESTful API的调用,只需要简单调用运管系统,互联科技就可完成一系列的云网配置下发,大大减轻运维难度。

随时升级

以往互联科技使用传统交换机,底层网络配置变更、更换设备等操作往往只能在业务闲时进行割接操作,星融元交换机因为容器化技术及高可用架构,可以随时进行系统应用的升级。如果涉及到更换设备,也可以通过复制配置文件,快速完成设备更换。这样避免对交换机进行二次配置,减少人为配置出错的可能,同时也大大提升了效率。

方案架构图

降本增效

充分利用星融元的云网设备的特性,世纪互联可以将主机Overlay网络卸载到星融元的交换机上,这大大了减轻客户主机CPU资源占用率,客户在创造更多虚机、提升资源利用率的同时,还能够大幅降低成本。

易于扩展

同样缘于星融元开放的特性和容器化的架构,互联科技可以在星融元的交换机上部署第三方容器应用,目前通过部署Prometheus官方提供的开源Node-exporter,可以实现通过Prometheus查看和监控星融元交换机的系统状态信息。客户还可以根据自己的需要,安装其他的容器应用,来满足自己个性化的需求。

本次合作将星融元在开放网络领域的技术能力融入到互联科技全域托管云解决方案中,打造业界领先托管云数字化解决方案,赋能百行百业的数字化转型。目前通过使用星融元交换机构建的云网络,互联科技目前已经在多个数据中心部署全域托管云业务。

未来,双方将在全域托管云场景化方案建设和市场推广领域展开深入合作,为不同规模和发展阶段的企业提供更利于长远发展的互联网基础设施全生命周期服务,互联科技全域托管云业务也将会迎来飞速发展。

相关文章:星融元携手世纪互联打造全域托管云,赋能企业数字化转型!

相关文章

对星融元产品感兴趣?

立即联系!

返回顶部

© 星融元数据技术(苏州)有限公司 苏ICP备17070048号-2