Skip to main content
开放网络的先行者与推动者—星融元
加入我们技术支持(Support)  TEL:(+86)4000989811

站点精选

2025-04-17

关注星融元

站点精选

51.2T 800G AI智算交换机软硬件系统设计全揭秘

2025-04-17

在 AI、HPC 与云计算基础设施飞速演进的当下,性能瓶颈不再源于算力,而是网络系统中的每一个微秒延迟与每一瓦能耗。

为应对这一挑战,星融元推出了旗舰级产品:CX864E-N 64x800G 超低时延 RoCE 交换机

该产品具备业界领先的560ns端口转发时延和基于 SONiC 的开放网络架构,为下一代 AI 智算网络提供极致性能保障和灵活的方案集成空间。

近期国内外展会上,CX864E-N已吸引了大量客户与行业专家的关注。对此,我们决定不再“藏着掖着”,而是大方展示我们的技术实力与设计理念 —— 星融元将一直以坦诚、开放的态度与客户和同行共同推动开放网络的行业进步。

800G

CX864E-N 早在去年已实现量产并成功部署于多家头部互联网企业与云服务提供商的数据中心,并且交付周期已缩短至约2周,在性能、交期与成本的多维度比较中名列前茅。

CX864E-N 硬件外观概览

设备前面板

在2U高的前面板上,排布着64个800G OSPF 端口,其前后向兼容性可确保从现有的 100GE/200GE/400GE 网络无缝过渡到更高级的800GE,保护历史投资。

800G

在管理口方面,CX864E-N 提供RJ45 MGMT、USB2.0接口及RJ45 Console。

另外,CX864E-N 还提供两个额外的 10G SFP+ 端口,专门用于增强带内网络遥测 (INT) 等管理功能。这一考虑至关重要,因为 800G 交换机上的每个端口都承担着相当大的工作负载,如出现问题,影响会显著放大,因此需要更精准、实时的通信监控。(当然,客户也还可以根据其他网络需求灵活运用这两个端口)

800G

面板右侧还有6个LED指示灯,其中靠近RJ45口的两个分别为:

  • LINK/ACT灯,指示 MGMT接口的link及数据通讯状态
  • SYS灯,指示整机系统的运行状态;

面板右侧竖排四个指示灯从上到下依次为:

  • BMC状态指示灯(BMC)
  • 电源指示灯(P)
  • 风扇状态指示灯(F)
  • 设备定位指示灯(L)

前面板分布着横、纵向排列的三排小型进风孔。外部冷空气正是通过这些气孔进入机箱内部,与风冷系统协同工作,有效提升整体散热效率。

设备背部

CX864E-N 设备背部配备了4个风扇模块以及2个电源模块,为系统提供稳定、高效的散热与供电保障。所有风扇与电源均支持热插拔,无需中断系统运行。电源模块集中布局于设备左侧,单个功率为 3200W。

800G800G

您可能会问:市面上的800G交换机大多有6到8个风扇,而CX864E-N仅有4个,散热如何保证?关于这个问题我们会在下一个部分来解答。

CX864E-N 内部硬件

让我们揭开这台高性能交换机的盖版,从左至右,依次探索这款设备的核心构造,深入了解其内部硬件设计。

800G

散热板

首先看到的是大面积覆盖的散热板(已拆出放置),这是我们采用了 3D真空腔均热板技术的高效风冷散热模块。

800G

相比部分厂商选择的水冷方案,该散热设计在整机满配功耗高达 2180W 的极限工况下,依然能够稳定满足系统运行需求,同时将整机功耗控制在业内较低水平,能效表现出色。在该负载条件下,风扇仅需以约 60% 转速运行便可维持散热系统的正常运作,有效控制噪音水平,避免对运行环境造成干扰。

ASIC 模块

800G

散热板下即是 Marvell Teralynx 10 ASIC 模块(以下简称“TL10”), 安装在 OSFP 接口背后,是整机网络交换处理能力的核心。TL10是一颗基于 5nm 工艺、单芯片架构的可编程交换芯片,提供51.2 Tbps的吞吐能力。

TL10 的超低时延性能是其最大亮点之一,可将端到端时延控制在约 560 纳秒,在同类芯片中表现极为出色。对于 AI 模型训练、推理以及大规模并行计算任务,低延迟意味着更快的同步、更高的吞吐、更低的能耗浪费,从而提升整个集群效率。

  • 大容量片上缓存(200+ MB):显著提升 RoCE 传输性能,能够有效缓解网络拥塞引发的数据排队与等待问题。相比竞品采用的外置 HBM 方案,片上缓存在功耗、访问延迟以及成本控制方面具备显著优势。
  • 先进的带内遥测(INT)功能
  • Flowlet 调度机制:通过引入 Flowlet 级别的负载均衡策略,TL10 在高吞吐场景下依然可保持稳定的数据分发效率。该机制显著降低了对缓存资源的依赖,仅需约 200MB,即可满足复杂网络环境下的调度与拥塞控制需求。
  • 高 Radix 架构(512×100GbE):支持网络大规模横向扩展,助力数据中心从传统三层架构向扁平化两层架构演进,显著减少网络设备数量与布线复杂度,提高整体网络效率与可靠性。
  • 领先的能效比:在面向大规模 AI 训练集群的实际部署中,TL10 相较于同类方案可节省超过 1MW 功耗,在每瓦带宽和计算密度方面处于业界领先水平,显著降低长期运营成本(TCO)。

800G

文末我们将展示基于 TL10 芯片设备的实际延迟测试结果。

电源模组

在ASIC上方是斜向排列的一组电源模组。它们为核心的 ASIC 芯片提供稳定电力支持。值得一提的是,这种非平行布局经过优化,可有效提升电源完整性,为高速数据传输保驾护航。

800G

PTP模块

电源模组上方为 PTP(精确时间协议)模块,支持高达10ns 的PTP与SyncE精度。该模块为可选功能,采用可插拔设计,客户可按需定制,灵活部署。下图是PTP模块已安装与未安装状态的实物图对比。

800G

800G

COMe 模块

长方体组件正是我们的 COMe 模块,基于 x86 架构,搭载 Intel Xeon 处理器,具备强大的计算性能,能够支持 INT-based Routing 等高级网络功能。上面运行我们自研的基于 SONiC -based AsterNOS 操作系统,为交换机提供稳定、高效的控制平面核心,确保整机在复杂网络环境下的灵活调度与可靠运行。

800G

BMC 模块

COMe模块右侧是BMC模块,它同样采用可插拔设计,客户可根据需求升级BMC模块,解锁更高性能与更丰富的管理功能。

800G

NVMe 插槽

COMe 模块左侧是两个全长 2280 的 NVMe 插槽,以及一个兼容 2280 和 2242 尺寸的 M.2 SATA 插槽,为用户提供灵活的本地存储扩展能力。

此外,两个 2280 NVMe 插槽还可选配最多两颗 Hailo-10 AI 加速引擎,支持实时、低延迟且高能效的边缘 AI 推理计算,满足多种智能和AI应用场景的部署需求。

800G

风扇

整机后部配备 4 个可热插拔风扇模块,构成高效简洁的风冷系统。这里也回答了之前的问题,在满负载运行(2180W)下,这套散热方案已完全能够稳定运行,无需塞入额外的风扇来控制温度,大大降低了功耗与系统复杂度。更少的组件,意味着更高的可靠性与更低的运营成本。

800G

其他补充

CX864E-N 整机内部仅使用了一根线缆,其他连接均通过高性能连接器实现板间互联,避免了因复杂线缆引起的信号干扰和维护难题。相比一些友商使用多根线缆的做法,这种设计更可靠,也更利于长期稳定运行。

800G

CX864E-N的PCB采用全球领先的制造工艺,并选用业内已大规模量产的顶级高性能板材,结合Vippo、盲孔(Blind Hole)、背钻(Back Drill)等先进技术工艺,全面满足112G高速SerDes在信号完整性(Signal Integrity)、损耗(Loss)、串扰(Crosstalk)等方面的严苛技术要求。

CX864E-N 软件概述

星融元 CX864E-N交换机搭载企业级 SONiC 发行版 —— AsterNOS。我们致力于打造业界领先的企业版 SONiC,助力客户构建高性能、智能化的网络系统,从控制面到数据面构建起软硬一体的协同架构。

AsterNOS架构图

加速 AI 网络,释放超算潜能

作为超以太网联盟(UEC)的早期成员,Asterfusion 借助超级以太网技术,将网络利用率提升至 90% 甚至更高,全面加速 AI 网络部署与数据中心演进。

解锁AI数据中心潜力:网络利用率如何突破90%?

星融元 CX864E-N RoCE交换机通过 Flowlet 负载均衡、基于 INT 的智能路由与 WCMP 等先进技术,实现 AI 训练与推理网络超过 90% 的利用率。这不仅显著提升 AI 工作负载效率,同时有效降低数据中心建设与运营成本

  • 全功能交钥匙解决方案:AsterNOS 基于社区 SONiC 构建,强化了 EVPN 多归属、RoCEv2、Ansible 自动化 等企业特性,专为复杂部署环境而设计。与自研的开放网络硬件深度适配,提供真正即插即用的一体化解决方案。
  • 更快的版本发布节奏与响应机制:相比社区半年一版的发布频率AsterNOS 实现了季度新版本发布,确保客户需求与问题能被快速响应与解决。
  • 专业支持团队,灵活定制服务:超过 120 名SONiC软件研发工程师,为客户提供专业、灵活的服务支持,包括定制功能开发、问题定位优化以及全方位的技术咨询。
  • 双模式CLI风格,提升用户体验:除了 Linux 风格的 Bash CLI,AsterNOS 还基于 Klish 实现了 Cisco 风格的命令行界面,帮助网络工程师更轻松上手,降低学习曲线。

560ns 超低转发时延、64×800G OSFP 高密度接口、TL10单芯片架构、超大片上缓存、板间无缆互联、定制级 PTP和AI 模块、每一行走线,每一个模块、都是星融元面向 AI 工作负载与低延迟网络的工程化答案。

附录:相关测试数据

800G-test
800G-test

800G-test

对星融元产品感兴趣?

立即联系!

返回顶部

© 星融元数据技术(苏州)有限公司 苏ICP备17070048号-2