Skip to main content
开放网络的先行者与推动者—星融元
加入我们技术支持(Support)  TEL:(+86)4000989811

星融元AI智算训练网络

 基于业界主流的“轨道优化”组网+Clos 架构,采用高带宽低时延的数据中心RoCE交换机,构造1:1无收敛的高性能训练网,适用于绝大多数智算场景


方案亮点

图标

~500ns 超低时延,改善长尾延迟

稳定的低时延通信(端口时延低至500ns级别),降低GPU同步等待和作业时间

图标

先进的智能选路和负载均衡

基于 Flowlet 的自适应路由(ARS)、INT驱动的动态负载均衡(ALB)/加权多路径路由(WCMP)协同工作,避免 RoCE 网络拥塞

图标

开放网络架构

搭载企业级SONiC(AsterNOS网络操作系统),其开放的容器化架构和丰富的管理面接口,天然支持与AI集群管理调度平台(AIOS)无缝融合

图标

旗舰级800G交换机

2U高度内提供高密度接口,支持拆分为128x400G等不同速率规格,大幅简化拓扑,降低建网成本

灵活组网图
200G/400G/800G 全盒式设备组网

灵活支持从边缘推理到万卡集群

  • 前后向兼容的端口规格
  • 支持单一SKU或混合速率组网
  • 横向弹性扩容 Scale-out 网络
面向RoCE网络的部署运维工具集

EasyRoCE Toolkit

  • 完全依托开源、开放的网络架构与技术
  • 覆盖前期规划实施到日常运维监控全流程
  • 具备二次开发与集成能力
  • 签约客户免费使用,无额外收费

测试数据

test
IXIA AresONE-S 400G测试仪模拟双机8卡集合通信

NCCL-Test 测试

不同NCCL操作下的总线带宽均接近基准值;以All-Reduce 操作 Bidir Ring 算法为例,跨交换测试的长尾时延稳定性与基准测试一致,性能优异。

test
真实组网,样本序列长度为2048, Llama2-7B, 双机16卡

AI训练场景测试

使用单台星融元 RoCE交换机时,单次训练时间与IB交换机相同,且均与网卡直连时间持平。当两台交换机背靠背互联时,星融元 RoCE交换机的训练时间比IB交换机降低3.38%

对星融元产品感兴趣?

立即联系!

返回顶部

© 星融元数据技术(苏州)有限公司 苏ICP备17070048号-2