星智AI网络—基于LLM大模型的Rail Only网络

Asterfusion星智AI网络解决方案

与传统方案相比，星智AI网络消除了跨GPU服务器不同GPU卡号之间的连接，只保留了与GPU相连的Leaf层交换机，将原本用于上连Spine的端口全部用于下连GPU，进一步提高Leaf交换机连接效率，并且这种网络架构仍然可以通过转发实现不同HB域之间的通信。

轻松组建智算中心万卡网络

在不影响数据传输性能的情况下，精简网络架构，极大降低用户网络建设成本；
将网络转发路径跳数降低至1跳，大大减少业务时延；
简化网络结构，降低运维以及故障排查难度。

以32768个GPU，128端口交换机组网为例：

CLOS层数：1层（Rail Only）
交换机需要：256台
光发射器数量：65536
网络成本最大可降低：75%

方案优势

提升单机网络带宽
1. 增加网卡的数量，初期业务量少，可以考虑CPU和GPU共用，后期给CPU准备单独的1到2张网卡，给GPU准备4或8张网卡；
2. 提升单机网卡带宽，同时需要匹配主机PCle带宽和网络交换机带宽，星融元200G、400G以太网交换机将配合网卡确保数据传输高带宽。
网卡速率 40G 100G 200G 400G

PCIe 3.0*8 3.0*16 4.0*16 4.0或5.0*16

交换机Serdes 4*10G 4*25G 4*50G 8*50G
应用RDMA网络（RoCE）
1. 借助RDMA技术减少GPU通信过程中的数据复制次数，优化通信路径，降低通信时延。
2. 通过Easy RoCE一件下发复杂的RoCE相关配置（PFC、ECN等），帮助用户降低运维复杂度。
减少网络拥塞
1. 减少网络侧时延提高GPU使用效率：超低时延~400ns；
2. 通过DCB协议组减少网络拥塞：PFC、PFC WatchDog、ECN构建全以太网零丢包低时延网络；
3. 双网分流： CPU的流量与GPU流量彻底分离开，减少不同网络流量的占用和干扰;

型号为CX532P-N数据中心交换机产品图

CX-N系列超低时延云交换机

星融元Asterfusion自主开发的面向数据中心网络…

AsterNOS

以SONiC为内核的AsterNOS，源自开源，超越开…

Sora催化算力需求暴涨，星融元为泛在算力构建开放网络

泛在算力需要稳定的网络来连接各种计算资源，开放网络的高带宽、低时延、传输稳定性和可靠性等特性为…

星融元针对LLM大模型承载网发布星智AI网络解决方案

人工智能是数字经济的核心驱动力，AI 大模型是人工智能的新引擎。近年来，随着 ChatGPT …

AI时代，如何吃下数据传输这块蛋糕？

近日，中国移动江苏有限公司发布《中国移动智算中心（南京）2023年智算算力项目算力设备采购项目…

开放网络+私有云=？星融元的私有云承载网络解决方案实例

CX-N系列产品在T客户这一全球化的通信服务提供商私有云领域的成功商用，一方面为我们树立了业界…

更多资料请前往资源中心

对星融元产品感兴趣？

立即联系！

返回顶部

如何联系我们？

400-098-9811

产品中心

快速导航

关注星融元

知乎

Github

© 星融元数据技术（苏州）有限公司苏ICP备17070048号-2

→
需求表单 Contact Form
400-098-9811