科普文, 站点精选

2025-01-15

关注星融元

站点精选

SONiC交换机 PK IB交换机，是“越级碰瓷”还是“有点东西”？

2025-01-21

聊起AI、HPC或其他无损传输网络场景，RoCE or IB 无疑是个老生常谈的话题了。关于两种协议栈的区别和联系，我们之前有写过一篇详尽的文章（请参阅：RoCE与IB协议栈对比解析）。简言之：RoCE 实际上只是将成熟的IB传输层和RDMA移植到了同样成熟的以太网和IP网络上。

IB因其是最早支持RDMA的协议，起步早，技术成熟，在一整套专用软硬件体系加持下，可提供极致的低时延传输性能，但同时也因供应商唯一，导致整体TCO较高。

与之相对的，RoCEv2在互操作性和成本上的显著优势被认为更适合大规模部署，例如今年xAI公司在美国孟菲斯建设的十万卡AI集群，便是使用400GbE以太网构建的无损高速网络。

开放网络能否平替IB？

援引Amazon高级首席工程师Brian Barret的话，AWS之所以放弃IB方案主要是因为：

“要满足资源调度和共享等一系列弹性部署的需求，专用的IB网络集群如同汪洋大海中的孤岛”

既然追求标准开放与多厂商兼容已是业界共识，以SONiC为代表的开放网络在顶级大厂云的商业化部署也有目共睹了，我们不禁要问：到了性能要求更苛刻的AI/HPC场景，支持RoCE的开放网络能否担得起 “IB平替” 的期待？

或者再进一步，开放架构的力量能否赋能更广大的数据中心建设运营者？ 比如简化受人诟病的RoCE网络部署调优，提高运维诊断能力等等…或者更多可能？

铺垫有点多了，上干货！

测试背景

我们挑选了三大典型场景下的SONiC交换机（RoCE）和IB的现场实测对比结果，涉及AI训练，HPC和分布式存储环境。测试结果保真保鲜，同时也会简要附上方法步骤，希望能对各位读者有所参考价值。

AI智算场景：E2E转发测试、NCCL-TEST、大模型训练网络测试
HPC场景：E2E转发性能、MPI、Linpack、HPC应用（WRF、LAMMPS、VASP）
分布式存储：FIO工具压测读写性能

当然，正经搞对比测试不能不讲武德，跟IB正面对垒的选手绝不能是随便淘个白盒跑跑社区版软件的野生玩家。被测RoCE交换机为星融元CX-N系列，产品采用超低时延硬件平台，搭载企业级SONiC发行版AsterNOS，全端口标配支持RoCEv2，以及EasyRoCE Toolkit。

EasyRoCE 是星融元依托开源、开放的网络架构与技术提供的一系列实用特性和小工具。从前期规划实施到日常运维监控，EasyRoCE 简化了各环节的复杂度并改善了操作体验，更提供二次开发和集成空间，供网络架构师充分利用开放网络最新技术成果。

Toolkit 更新传送门：官网详情页 | 统一监控面板（UG） | 高精度流量监控（RTR）| 一键RoCE部署（ORD）

CX-N系列型号规格如下表所示：

星融元产品

测试结论

先说结论，开放架构的星融元CX-N系列交换机（RoCE）与IB交换机的端到端性能基本持平，局部超越。

AI智算场景

1、E2E转发带宽达到网卡直连速率上限，单机转发时延低至560ns

2、双机16卡运行NCCL-test （ring算法），通过两台被测交换机测得最大总线带宽与IB交换机基本一致（约195GBps），且带宽使用率与网卡直连情况一致，已达到服务器Scale-out网络传输速率上限。

3、轨道优化拓扑下，双机16卡 Llama2-7B（样本序列长度2048）的单次训练用时与网卡直连以及IB组网的测试结果一致。

HPC 场景

1、E2E时延表现与IB交换机基本持平，差异保持在纳秒级。

2、MPI基准测试，E2E表现与IB交换机基本持平，时延差异保持在纳秒级。

3、Linpack效率与使用同规格IB交换机组网结果基本相当，差异约在0.2%。

4、HPC集群内并行运行WRF、LAMMPS和VASP应用，RoCE交换机完成一次相同计算任务的平均用时与使用IB交换机组网的用时基本相当，两者差异在0.5%~3%之内。

LAMMPS WRF

VASP

分布式存储场景

采用RoCE组网的分布式存储系统读写性能（IOPS）与采用同规格IB组网持平，部分条件下优于IB。

IOPS

X-T系列：全开放、可编程、高性能的P4可编程硬件平台

面向云网智能网关、SmartToR、NFV等应用场景，采用业界领先的算网融合架构，支持全栈可编程，具备卓越的智能业务处理能力…

查看产品

2026-03-05

AsterNOS-VPP 与硬件卸载：打造下一代高性能 IPsec 网关

本文探讨10G+网络演进中IPsec加密的性能挑战。剖析AsterNOS如何利用VPP矢量处理与硬件卸载技术，打破…

查看文章

2026-01-30

EasyRoCE工具上新：RDMA会话追踪和路径还原

针对RDMA网络运维中通信路径不透明、问题定位困难等痛点，星融元推出EasyRoCE-RST工具。该工具通过解析C…

查看文章

2026-01-23

园区智网全光接入下如何实现OLT/ONU设备的统一纳管？

传统园区网络中光与无线接入层分离管理导致运维复杂。星融元推出基于OpenWiFi的ACC控制器，通过OLT Sti…

查看文章

2026-01-16

星融元完成新一轮融资，携手产业资本加速AI网络市场布局

星融元完成新一轮融资，由厦门联合、湖南财信共同投资。公司作为AI网络架构领先者，构建“云网融合、开放解耦”技术体系…

查看文章

2026-01-09

深度解析AsterNOS基于Geo-Engine的流量识别与调度

AsterNOS-VPP针对云时代IP动态变化、复用导致的传统路由策略效能问题，提供基于Geo-Engine的流量…

查看文章

2026-01-06

EasyRoCE 新年上新！基于INT的网络拥塞监控和告警工具

星融元开发的 EasyRoCE-CMA 是基于 INT 技术的拥塞监控工具。它利用纳秒级精度的 HDC 与 BD…

查看文章

2025-12-19

AsterNOS SONiC 现已支持基于YANG的网络管理新范式

传统CLI与SNMP面临效率与实时性瓶颈，YANG数据模型应运而生，支持结构化业务配置与状态管理。基于YANG的N…

查看文章

2025-12-03

即插即用零配置，数据中心带外管理网的快速上线方案

数据中心带外管理网传统需手动配置静态IP与VLAN，现可通过基于SONiC的交换机运行DHCP与TFTP服务，实现…

查看文章

2025-11-28

科技型企业办公区+自建云的混合组网和一站式融合管理

科创型企业依赖“服务器区+办公网”混合组网架构，传统MC-LAG+全三层模式运维复杂。星融元ACC控制器基于TIP…

查看文章

科普文, 站点精选

关注星融元

SONiC交换机 PK IB交换机，是“越级碰瓷”还是“有点东西”？

开放网络能否平替IB？

测试背景

测试结论

AI智算场景

HPC 场景

分布式存储场景

X-T系列：全开放、可编程、高性能的P4可编程硬件平台

对星融元产品感兴趣？

如何联系我们？

400-098-9811

产品中心

快速导航

关注星融元

AI/超算/云数据中心

园区智网

网络操作系统（SONiC）

网络可视化（NPB）

开放硬件平台

应用场景

行业应用

科普文, 站点精选

关注星融元

SONiC交换机 PK IB交换机，是“越级碰瓷”还是“有点东西”？

开放网络能否平替IB？

测试背景

测试结论

AI智算场景

HPC 场景

分布式存储场景

X-T系列：全开放、可编程、高性能的P4可编程硬件平台

AsterNOS-VPP 与硬件卸载：打造下一代高性能 IPsec 网关

EasyRoCE工具上新：RDMA会话追踪和路径还原

园区智网全光接入下如何实现OLT/ONU设备的统一纳管？

星融元完成新一轮融资，携手产业资本加速AI网络市场布局

深度解析AsterNOS基于Geo-Engine的流量识别与调度

EasyRoCE 新年上新！基于INT的网络拥塞监控和告警工具

AsterNOS SONiC 现已支持基于YANG的网络管理新范式

即插即用零配置，数据中心带外管理网的快速上线方案

科技型企业办公区+自建云的混合组网和一站式融合管理

对星融元产品感兴趣？

如何联系我们？

400-098-9811

产品中心

快速导航

关注星融元