HPC高性能计算对网络的诉求,高吞吐和低时延成为两个重要的关键词。同时为了实现高吞吐和低时延,业界一般采用了RDMA替代了TCP协议,实现时延的下降和降低对服务器CPU的占用率。但RDMA协议对网络丢包非常敏感,所以无损就成为网络的重要需求之一。
基于对“HPC高性能计算的网络需求”和“RDMA技术”的分析和理解,星融元Asterfusion推出了CX-N系列超低时延云交换机,为HPC高性能计算提供了真正意义上的低时延、零丢包、高性能的网络。
为存储集群引入RDMA技术,能够提高存储节点带宽,降低延迟、抖动和CPU的消耗。在几类RDMA网络中,RoCEv2的性能较好、部署成本低、成熟案例多,在全闪分布式存储中引入RoCEv2可以有效降低传输协议的处理时延。
星融元Asterfusion CX-N系列云交换机,具备业界领先的超低时延能力,可满足分布式存储这种时延敏感型应用,对“集群规模庞大、IO路径较长的存储网络”提出的超低时延需求,可大幅降低存储业务在网络转发上的时延,提升分布式存储的性能。
为缓解分布式存储网络中一对多的流量模型带来的丢包问题,使用PFC(Priority-based Flow Control,基于优先级的流量控制)为不同队列的流量提供逻辑隔离,让存储业务使用高优先级队列,降低存储流量丢包率,保障存储业务的稳定性。
为了消除分布式存储网络中的拥塞情况,使用ECN(Explicit Congestion Notification,显式拥塞通知)进行网络拥塞控制,避免报文重传,降低网络延迟与抖动,进而提升存储集群的性能。
AFC将网络中的设备状态,链路情况,以及告警信息等数据按照时间、资源、性能类型分类以图表的形式展现出来。支持多项数据的统计功能,使客户对整体网络有一个全面直观的了解,全面把控网络状况。
HPC高性能计算,由于需要大量的运算而可用的资源有限,一台通用的计算机无法在合理的时间内完成运算工作。HPC高性能计算通过将多个单元的计算能力进行整合,能够有效地克服这些限制。
星融元Asterfusion CX-N系列超低时延云交换机构建的超低时延无损以太网,通过将RDMA运行在传统以太网上构建的网络达到了InfiniBand专用交换机的性能,帮助高性能计算方案突破网络瓶颈,为高性能计算集群提供了真正意义上的低时延、零丢包、高性能的网络。