方案亮点
~500ns 超低时延,改善长尾延迟
稳定的低时延通信(端口时延低至500ns级别),降低GPU同步等待和作业时间
先进的智能选路和负载均衡
基于 Flowlet 的自适应路由(ARS)、INT驱动的动态负载均衡(ALB)/加权多路径路由(WCMP)协同工作,避免 RoCE 网络拥塞

开放网络架构
搭载企业级SONiC(AsterNOS网络操作系统),其开放的容器化架构和丰富的管理面接口,天然支持与AI集群管理调度平台(AIOS)无缝融合
旗舰级800G交换机
2U高度内提供高密度接口,支持拆分为128x400G等不同速率规格,大幅简化拓扑,降低建网成本

200G/400G/800G 全盒式设备组网
灵活支持从边缘推理到万卡集群
- 前后向兼容的端口规格
- 支持单一SKU或混合速率组网
- 横向弹性扩容 Scale-out 网络
面向RoCE网络的部署运维工具集
EasyRoCE Toolkit
- 完全依托开源、开放的网络架构与技术
- 覆盖前期规划实施到日常运维监控全流程
- 具备二次开发与集成能力
- 签约客户免费使用,无额外收费
测试数据

IXIA AresONE-S 400G测试仪模拟双机8卡集合通信
NCCL-Test 测试
不同NCCL操作下的总线带宽均接近基准值;以All-Reduce 操作 Bidir Ring 算法为例,跨交换测试的长尾时延稳定性与基准测试一致,性能优异。

真实组网,样本序列长度为2048, Llama2-7B, 双机16卡
AI训练场景测试
使用单台星融元 RoCE交换机时,单次训练时间与IB交换机相同,且均与网卡直连时间持平。当两台交换机背靠背互联时,星融元 RoCE交换机的训练时间比IB交换机降低3.38%。
新闻动态
-
2025-08-12
-
2025-08-07
-
2025-07-15
-
2025-04-22