EasyRoCE:性能之上的智简开放新体验
EasyRoCE 是星融元依托开源、开放的网络架构与技术,为AI 智算、高性能计算等场景的RDMA 融合以太网(RoCE)提供的一系列实用特性和小工具。从前期规划实施到日常运维监控, EasyRoCE 简化了各环节的复杂度并改善了操作体验,更提供二次开发和集成空间,供网络架构师充分利用开放网络的最新技术成果。
卓越性能
- AI智算网络
- HPC集群网络
- 分布式存储
简捷部署
AI基础设施蓝图规划(AID)
提供成熟文档模版,主动引导生成AIDC网络所需配置参数;支持.xlsx和.json格式
RoCE参数自动生成(RPA)
结合AI基础设施规划(AID)信息和多场景预置模板参数,自动生成场景化的RoCE网络配置参数集合
一键RoCE部署 (ORD)
通过一条CLI或一次RESTful API 调用,完成RoCE功能的启用和相关配置参数下发
智能流控
GPU服务器内部路由规划(IRM)
自动配置服务器内部多张GPU卡与多张网卡之间的路由策略,确保参数流量的均衡性
端到端路径规划(EPS)
分析并呈现GPU集群的通信环并生成GPU服务器之间的路由规划,自动配置网络路由
主动路径规划(PPD)
结合集群架构和算法模型,主动规划网络路径并自动配置,彻底规避流量分布不均衡问题
多租户网络部署(MVD)
自动生成并配置面向不同租户的、参数/存储/管理三网逻辑一致的VPC隔离与保护策略
高精度监控(RTR)
为训练环境提供毫秒级精度的实时流量监控能力,精准定位亚秒级微突发对业务的影响;已纳入统一监控面板(UG)呈现
拥塞监控预警(CMA)
为训练环境提供纳秒级精度的拥塞监控告警能力,为业务模型与算法调优提供决策辅助;已纳入统一监控面板(UG)呈现
高效运维
EasyRoCE 现已支持在星融元AI智算/超算/通算云数据中心方案中部署应用。
100G-800G 高性能RoCE交换机
-
CX864E-N
64 x 800GE OSFP,2 x 10GE SFP+
-
CX732Q-N
32 x 400GE QSFP-DD, 2 x 10GE SFP+
-
CX664D-N
64 x 200GE QSFP56, 2 x 10GE SFP+
-
CX564P-N
64 x 100GE QSFP28, 2 x 10GE SFP+
-
CX532P-N
32 x 100GE QSFP28, 2 x 10GE SFP+
全系搭载AsterNOS,支持面向多场景优化的分布式算法
AsterNOS 是星融元数据技术有限公司推出的一款可用于电信、数据中心和企业网络的全功能开放网络操作系统(企业级 SONiC 发行版),兼容Marvell、Intel、Broadcom 等芯片平台。经过持续的开发维护和技术迭代,其便捷性、易用性和稳定性已在海内外大规模部署中得到市场验证。