近日,星融元正式加入超以太网联盟(Ultra Ethernet Consortium,UEC),该联盟是在 Linux 基金会的牵头下由多家全球头部科技企业联合成立,目标是突破传统以太网性能瓶颈,使其适用于人工智能(AI)和高性能计算(HPC)网络。
星融元加入UEC,将参与到制定以太网的下一代通信堆栈架构的进程中,推动以太网在人工智能和高性能计算领域的应用,为用户提供更高效、更强大的网络解决方案。
随着AI大模型规模的扩大以及通信模式和计算方法的多样化,传统基于 RoCE(RDMA over Converged Ethernet)的 RDMA方案存在拥塞控制算法阻碍等问题,造成运维困难;AI和HPC 对分布式计算资源的规模和有效利用需求高度相似,都对时延要求高。
UEC致力于改造以太网上的RDMA(Remote Direct Memory Access,远程直接内存访问)操作来优化AI和HPC工作负载,从物理层、链路层、传输层、软件层不断提升以太网的转发性能。超以太网传输工作组 (UEC Transport ,UET)通过多种创新来实现更高的网络利用率和更低的尾部延迟,从而减少AI和HPC作业完成时间。
针对上述问题,星融元正和UEC成员们基于端点的可靠性和拥塞控制的成熟路径,提供AI和HPC应用所需的性能,同时保留以太网/IP生态系统的优势,构建成本可控、运维简化、更易扩展的未来网络。
以下是超以太网传输工作组 (UET) 实现UEC1.0白皮书中规定的关键目标:
总之,UET通过保留IP协议、支持多路径、改进数据包排序和拥塞控制,满足不断增长的工作负载需求,为未来的AI和HPC网络提供更简单、更高效的RDMA互连。
面对AI/HPC对网络环境的高要求,星融元通过提供以太网络无损方案,支撑大规模算力集群建设:
作为领先的开放网络解决方案提供商,未来星融元将与UEC共同致力于为下一代AI和HPC网络提供优化的传输解决方案,帮助各行业用户构建AI时代中立、透明、高性价比的基础网络。