在一个计算和存储分离的部署场景中,推荐部署2张Spine-Leaf架构的物理网,存储后端网将单独使用一张物理网,以保证分布式存储集群能够快速无阻塞地完成多副本同步、故障后数据重建等任务,而存储前端网和业务网则共用一张物理网。
另外,存储节点对网络接入侧的可靠性要求相对较高,因此存储集群中的节点,一般推荐使用双归方式接入。
– 整网采用RoCEv2,通过PFC、ECN、DCBX保障业务无损,提供与IB性能媲美的无损以太网络。
– 超低时延存储网络可提高业务并发量,加快数据传输速度,提升业务响应效率,抢占市场先机。
– AsterNOS的业务级RESTful API和EasyRoCE功能,让客户能以更低的技术门槛和运维成本,在传统以太网上实现超低时延、零丢包、高性能的网络传输。
Port to Port 400ns的转发时延(Full Feature);L2&L3的转发时延相同;全速率下(10G~400G)转发时延相同。
在设备的配置运维方面,我们实现了业务级的命令行封装,增加RoCE的操作视图,实现一条命令行部署,让RoCE网络配置和运维变得简单易用。
当网络有异常时,再到具体设备上使用“EasyRoCE”的“show roce”命令,把RoCE相关的调试信息组织起来集中展示,简化排障流程、提高排障效率。
在整网运维层面,开发了容器化的监控采集前端roce_expoter,将RoCE业务相关网络指标采集给开源监控方案Prometheus,为运维团队提供一个开箱即用的RDMA网络监控方案。
该公有云用户作为中国TOP3云计算服务市场的重要参与者之一,为政府、企业和个人用户提供安全可靠的云计算解决方案。2022年需要对存储业务区域进行扩容,进一步提升网络服务质量。
整网采用RoCEv2,通过PFC、ECN、DCBX保障业务无损,提供与IB媲美的性能和无损网络
超低时延提高业务并发量,加快数据传输速度,提升业务响应效率,抢占市场先机
更低的技术门槛和运维成本,可以在传统以太网上实现超低时延、零丢包、高性能的网络传输