开放网络的先行者与推动者—星融元
加入我们技术支持(Support)  TEL:(+86)4000989811

全以太网超低时延HPC网络方案

HPC高性能计算提供了真正意义上的低时延、零丢包、高性能的网络。

业务痛点

HPC高性能计算对网络的诉求,高吞吐和低时延成为两个重要的关键词。同时为了实现高吞吐和低时延,业界一般采用了RDMA替代了TCP协议,实现时延的下降和降低对服务器CPU的占用率。但RDMA协议对网络丢包非常敏感,所以无损就成为网络的重要需求之一。

基于对“HPC高性能计算的网络需求”和“RDMA技术”的分析和理解,星融元Asterfusion推出了CX-N系列超低时延云交换机,为HPC高性能计算提供了真正意义上的低时延、零丢包、高性能的网络。

方案亮点

使用RoCEv2,降低传输协议时延

在业界支持RDMA的各类网络层协议中,RoCEv2 的性能较好、部署成本低、兼容性强。星融元Asterfusion CX-N系列云交换机搭建的超低时延无损以太网能够很好地承载RoCEv2,并基于RoCEv2打造一张低时延、零丢包、高性能的HPC高性能计算网络。

超低时延交换芯片,降低节点延迟

星融元Asterfusion CX-N系列云交换机从底层交换芯片到上层的各种协议栈皆面向低时延场景深度优化,可提供 Port to Port ~400ns 的转发时延,全速率下(10G~400G)转发时延相同,满足HPC场景下对于超低时延和高吞吐量网络的需求。

使用PFC高优先级队列,确保存储流量不丢包

PFC是暂停机制的一种增强,PFC允许在一条以太网链路上创建8个虚拟通道,为每条虚拟通道指定一个优先等级并分配专用的资源(如缓存区、队列等等),并允许单独暂停和重启其中任意一条虚拟通道而不影响其他。从而可为指定链路创建无丢包类别的服务。

使用ECN拥塞控制算法,消除网络拥塞

ECN(Explicit Congestion Notification,显式拥塞通知)是构建无损以太网的重要手段,能够提供端到端的流量控制,降低网络中的延迟与抖动,进而提升高性能计算集群的性能。

Asteria SDN云网控制器,保证网络万无一失

AFC将网络中的设备状态,链路情况,以及告警信息等数据按照时间、资源、性能类型分类以图表的形式展现出来。支持多项数据的统计功能,使客户对整体网络有一个全面直观的了解,全面把控网络状况。

应用场景

HPC高性能计算

HPC高性能计算,由于需要大量的运算而可用的资源有限,一台通用的计算机无法在合理的时间内完成运算工作。HPC高性能计算通过将多个单元的计算能力进行整合,能够有效地克服这些限制。

星融元Asterfusion CX-N系列超低时延云交换机构建的超低时延无损以太网,通过将RDMA运行在传统以太网上构建的网络达到了InfiniBand专用交换机的性能,帮助高性能计算方案突破网络瓶颈,为高性能计算集群提供了真正意义上的低时延、零丢包、高性能的网络。

CX-N系列云交换机和IB交换机客户现场测试对比,时延带宽等性能指标基本一致。

对星融元产品感兴趣?

立即联系!

返回顶部

© 星融元数据技术(苏州)有限公司 苏ICP备17070048号-2