Skip to main content
开放网络的先行者与推动者—星融元
加入我们技术支持(Support)  TEL:(+86)4000989811

标签: 公司动态

揭秘超以太网联盟(UEC)1.0 规范最新进展(2024Q4)


关注星融元


近期,由博通、思科、Arista、微软、Meta等国际顶级半导体、设备和云厂商牵头成立的超以太网联盟(UEC)在OCP Global Summit上对外公布其最新进展——UEC规范1.0的预览版本。让我们一睹为快吧!

UEC 1

UEC 旨在提出一种“升级版”的以太网通信协议栈用以应对AI智算、HPC等领域对RDMA网络的性能挑战——当前大规模计算节点互联场景下主要有InfiniBand和基于以太网协议的RoCE两大技术路线。有关IB和RoCE协议栈的详尽对比可参阅:

高性能网络传输:RoCE与IB协议栈对比解析

相比较为封闭的IB架构,以太网在互操作性和带宽成本上的优势已在市场层面得到了广泛认可,尤其是大规模的AI算力中心场景。当前全球TOP500的超级计算机中RoCE和IB的占比相当,以端口带宽总量计算,IB占比为39.2%,RoCE已达48.5%。

尽管IB和RoCE在高性能传输的拥塞控制、QoS皆有应对设计,但也暴露出一些缺陷。例如乱序需要重传、不够完美的负载分担、Go-back-N问题,DCQCN 部署调优复杂等等。

面向GPU Scale-out网络的UEC 1.0 规范从软件API、运输层到链路层以及网络安全和拥塞控制皆有涉及,较传统RDMA网络有了大量改进,我们将挑出重点介绍。UEC2

什么是超级以太网系统

一个超级以太网系统的组成如下。一个集群(Cluster)由节点(Node)和网络(Fabric)组成,节点通过网卡(Fabric Interface)连接到网卡,一个网卡中可以有多个逻辑的网络端点(Fabric End Point,FEP)。网络由若干平面(Plane)组成,每个平面是多个FEP的集合,通常通过交换机互联。

UEC 3

超以太网协议栈概览

UEC4

▣ 物理层与传统以太网完全兼容,可选支持FEC(前向纠错)统计功能

▣ 链路层可选支持链路层重传(LLR),并支持包头压缩,为此扩展了LLDP的协商能力

▣ 网络层依然是IP协议,没有变化

▣ 传输层是全新的,作为UEC协议栈的核心数据包传输子层(Packet Delivery)和消息语义子层(Message Semantics)。包传输子层实现新一代拥塞控制、灵活的包顺序等功能,消息语义子层支持xCCL和MPI等消息。可选支持安全传输。另外,在网集合通信(In Network Collective,INC)也在这一层实现

 软件API层。提供UEC扩展的Libfabrics 2.0

物理层

UEC 1.0规范下的物理层与传统以太网(符合IEEE802.3标准)完全兼容,支持每通道100Gbps和200Gbps速率,在此基础上实现800Gbps和更高的端口速率。

另外可选支持物理层性能指标统计功能(PHY metrics)。这些指标基于 FEC 码字进行计算,不受流量模式和链路利用率的影响。估计算法基于FEC错误计数器的数据,从而得出不可纠正错误率(UCR )和数据包错误平均间隔(MTBPE)。这些指标衡量了物理层的传输性能和可靠性,用于上层的遥测和拥塞控制等。为了支持新的 UEC 链路层功能,UEC规范中也对协调子层(RS)进行了相应的修改。

链路层

UEC链路层最大的变化是引入了LLR(Link Level Retry)协议。它可以让以太网不依赖PFC,实现无损传输。

LLR 机制是基于帧的。每个帧都分配了一个序列号,接收端成功接收这一帧后,检查帧的序列号是否符合预期,如果正确,发送确认消息(ACK),如果发现帧乱序或者丢失,则发送否定确认消息 (NACK)。发送端具有超时机制,用于保证在 NACK 丢失时重传。

传输层:UET,新一代协议栈的核心

前文提过,传统的RDMA网络传输层(包括IB和RoCE)在多路径传输、负载分担、拥塞控制以及参数调优等方面存在着不足之处。随着AI/HPC集群规模增长,网络的确定性和可预测性越来越困难,需要全新的方法来解决。

UEC传输层(UEC Transport Layer,简称UET)运行在IP和UDP协议之上, 支持实现以下几大技术目标:
▣ 支持高达 100 万个 GPU/TPU 的算力集群
▣ 往返时间低于 10μs
▣ 单接口带宽800Gbps及以上
 网络利用率超过85%
 

选择性重传(Selective Retransmit)

传统传输协议,如TCP需要严格的传输顺序,并采用了Go-Back-N机制。而一个RDMA消息通常包含多个数据包,只要有一个数据包错误,则从这个数据包起的所有数据包都要重传。这让偶尔的传输错误被放大,加剧了网络拥塞。UEC采用选择性重传机制,仅传输错误的数据包。
 

乱序交付(Out-of-Order Delivery)

UET不仅支持有序传输,也支持无序传输。这是因为现代网络中通常有多路径存在,同一个流的数据包经过不同路径传输,就可能造成乱序。如果还要求严格的顺序传输,就无法利用多路径来实现负载分担。此外,选择性重传也需要无序传输的支持。为了实现无序传输,需要接收方有更大的数据包缓冲区,从而将乱序的数据包组成一个完整的RDMA消息。

UET支持四种传输方式:
▣ ROD (Reliable Ordered Delivery)
– 需要拥塞控制、有序、可靠、无重传(依旧采用Go-Back-N)
▣ RUD (Reliable Unordered Delivery) 
– 需要拥塞控制、无序、可靠、无重传
▣ RUDI (RUD for Idempotent Operations)
– 可选拥塞控制、无序、可靠、重传
▣ UUD (Unreliable Unordered Delivery) 
– 可选拥塞控制、无序、不可靠、重传

包喷洒(Packet Spraying)

包喷洒是一种基于包的多路径传输。由于传统传输协议不支持无序传输,同一个数据流必须按照同一个路径传输,否则就会造成乱序,引发重传。而在AI/HPC应用中,存在大量的“大象流”,它们数据量大、持续时间长,如果能使用多路径传输一个流,将显著提高整个网络的利用率。

由于支持了RUD,UET就可以将同一个流的不同包分散到多个路径上同时传输,实现包喷洒功能。这让交换机可以充分发挥ECMP甚至WCMP(Weighted Cost Multi- Pathing)路由能力,将去往同一目的地的数据包通过多条路径发送,大幅度提高网络利用率。

拥塞控制(Congestion Control)

UET 拥塞控制包含以下重要特性,由端侧硬件和交换机配合完成,有效减小了尾部延迟。

▣  Incast管理。它用于解决集合通信(Collective)中下行链路上的扇入问题。AI和HPC应用经常采用集合通信在多个节点之间同步信息,当多个发送者同时向一个接收者发送流量,就会产生Incast拥塞

▣  速率调整加速。现有的拥塞控制算法,在发生网络拥塞后调整速率的过程较长,而 UET 可以快速上升到线速。方法是测量端到端延迟来调节发送速率,以及根据接收方的能力通知发送方调整速率。

▣  基于遥测。源自网络的拥塞信息可以通告拥塞的位置和原因,缩短拥塞信令路径并向终端节点提供更多信息,从而实现响应速度更快的拥塞控制。

▣  基于包喷洒的自适应路由当拥塞发生时,通过包喷洒技术将流量重新路由到其它路径上,绕过拥塞点。

端到端的安全

UEC在传输层内置安全。它是基于作业(Job)的,可以对整个作业的流量进行端到端的AES加密,充分利用 IPSec 和PSP(Packet Security Protocol)的能力,减小安全加密的开销,提供可扩展安全域,并且可以由硬件卸载。
 

在网计算(In Network Collectives)

在网计算最早应用在HPC集群,业界主要有两个思路,一是基于网卡的,二是基于交换机。

UEC V1.0 的目标是后者,即将集合操作卸载到各级交换机上完成,避免过多的收发次数,降低节点交互频率和处理时延开销,减少约一半数据传输量,从而加速All-Reduce操作。

在部署实现上,目前AI智算领域唯一大规模商用的案例仅有英伟达的SHARP(在ASIC层面实现的硬件加速),以太网设备厂家仍处在探索阶段,例如将算力内置于交换机或外接,甚至P4可编程都是可能的思路方向。

 

软件层:Extended Libfabrics 2.0UEC 5

硬件升级:支持UEC的交换机和网卡

UEC在规范中定义了支持超级以太网交换机的架构,可以看到大体是继承了SONiC的架构。这部分的主要关注在于控制平面上支持INC和SDN控制器;数据平面升级了SAI(Switch Abstraction Interface)API调用硬件提供的INC等能力。

UEC 6

UEC同样定义了网络端点(Fabric End Point)的软硬件架构。在硬件层,网卡升级支持UEC功能。在操作系统内核态,实现网卡驱动。在用户态,基于libfabric扩展实现INC管理等功能,支持上层的xCCL/MPI/SHMEM等应用。

UEC 7

总的来说,UEC v1.0规范重构了数据中心以太网以完全替代传统的RDMA网络,用更高的性能、更低的成本实现稳定可靠、具有百万节点的AI/HPC集群。

 

星融元RoCE交换机与UEC

作为UEC成员单位,星融元提供的超低时延RoCE交换机(CX-N系列)全系采用高性能的标准白盒网络硬件,搭载为生产环境深度调优的企业级SONiC发行版——多项 Easy RoCE 特性,全面兼容现有规范并提供灵活、广大的升级空间,未来将平滑演进与新一代以太网标准保持同步。
星融元产品

产品动态 | 星融元 AsterNOS 可用于 Celestica 品牌白盒交换机


关注星融元


星融元 AsterNOS 是一款可用于电信、数据中心和企业网络的全功能开放网络操作系统(企业级 SONiC 发行版),兼容Marvell、Intel、Broadcom 等芯片平台,其便捷性、易用性和稳定性已在海内外的大规模部署中得到市场验证。

经过严格的软硬件兼容性测试和调优,AsterNOS 将可在天弘集团(Celestica,以下简称“天弘”)DS3000(基于Broadcom Trident III 交换芯片的 40GbE/100GbE 白盒交换机)和 DS2000(基于 Broadcom Trident III 交换芯片的 10GbE/25GbE 交换机)上使用,以上两款交换机将加入AsterNOS硬件兼容列表,为数据中心客户提供完整的交换机软硬件一体系统。
硬件规格

AsterNos适配软件特性

AsterNOS在多平台充分验证的云网能力

开放网络架构正成为未来网络的主流趋势——越来越多的云数据中心选择采用软硬件解耦的网络解决方案。这一转变不仅是技术上的进步,也是市场对成本效益和灵活性迫切需求的反映。

开放架构的网络操作系统(NOS)与通用白盒硬件的结合,使网络运营者和管理者能够根据实际需求自由配置云网架构,显著降低新应用在现有网络中的部署成本,提高运营效率。星融元所提供的开放网络操作系统(AsterNOS) 针对数据中心Underlay和Overlay网络场景进行了大量特性增强,其容器化的软件架构使得云网络能够迅速适应不断变化的业务需求,缩短新服务的部署周期,并提升网络可靠性。

凭借AsterNOS丰富的数据中心功能集以及在网络虚拟化和管理方面的深度优化,基于星融元交换机(或其他兼容的白盒硬件)构建的云网络架构可轻松扩展至数以万计的计算和存储节点,并通过REST API以及各类Exporter实现与云管平台的无缝集成,让网络真正融入云计算。

AsterNOS基于多芯片平台的丰富功能集

AsterNOS基于多芯片平台的丰富功能集

随着市场对高效、灵活和可扩展网络解决方案的需求不断增长,AsterNOS的应用前景将更加广阔,成为推动行业创新与发展的重要力量。从成熟的云计算行业到前沿领域的AI智算,或是更加通用普及的企业园区网络,经过充分验证的AsterNOS都将帮助用户充分利用开放网络技术所带来的所有优势。

天弘(Celestica)是一家从事电子专业制造服务的加拿大跨国公司,总部位于多伦多,在航空航天、互联与信息技术、健康医疗科技、工业、半导体制造设备、智能化可再生能源各领域,与行业的全球科技领先企业合作,为其最复杂的挑战提供解决方案。作为设计、制造、硬件平台和供应链解决方案的领先者,天弘从绘制电路板到全面的生产和售后服务,为产品开发的每一个阶段带来全球专家技术和洞察力。

 
如何购买星融元AsterNOS + 天弘数据中心交换平台的开放式交换机组合?
请访问 https://asterfusion.com/asternos-hcl-celestica/

现场直击!看星融元如何探索开放网络新境界


关注星融元


2024年9月25日,备受瞩目的PT Expo(中国国际信息通信展览会)在北京盛大开幕。本届展览会围绕“推动数实深度融合,共筑新质生产力”的主题,全方位呈现了信息通信技术在多个领域的创新应用和突破。

作为开放网络架构解决方案的先锋,星融元在此次展会上大放异彩,成为众多行业客户和专业人士关注的焦点。


PT EXPO 与客户交流

PT EXPO 与客户交流

一站式高性能AI智算网络

PT EXPO 与客户交流

PT EXPO 与客户交流

面向AI智算中心和云计算数据中心,星融元推出CX-N系列交换机,帮助客户构建超低时延、灵活可靠、可按需横向拓展的数据中心网络,为AI/ML高性能计算、云计算等领域的客户提供了卓越的网络服务。该系列交换机,最高可支持51.2T 交换容量、64 x 800G 高密接口,堪称是展会上屈指可数的存在,吸引了一众算力、大模型等AI行业的目光。

新一代云化园区网络架构

PT EXPO 与客户交流

PT EXPO 与客户交流

展会现场,星融元展示的“可以DIY的CX102S-DPU开放智能网关”产品和同系列的园区交换机赢得了众多企业园区客户的青睐,该系列是星融元面向新一代云化园区网络推出的Spine/Leaf层产品,支持丰富的二、三层网络功能和多样化的接入安全特性,同时提供8口、16口、24口、48口 PoE 供电能力,为用户搭建一张更精简高效、更安全可靠、更弹性灵活的云化园区网络

面向RoCE场景的可视化监控平台

PT EXPO 与客户交流

PT EXPO 与客户交流

在实际应用场景中,一方面需要实现更加灵活开放的网络基础设施,另一方面,也需要搭建一套更简洁、更低时延的监控平台;为此,基于星融元交换机开放的软硬件架构和带内网络遥测(INT)能力,为客户定制了一套面向RoCE场景的可视化监控平台,简洁易用,无需客户自行开发。

P4可编程网络解决方案

PT EXPO 与客户交流

PT EXPO 与客户交流

面向智能网关、NFV、教育科研等应用场景,星融元自主研发的X-T系列硬件平台也吸引了众多客户纷纷驻足。

星融元X-T系列采用了P4可编程交换芯片,支持全栈可编程,为客户提供了开箱即用、灵活敏捷的开发环境,以及高密度的端口接入能力。

目前,受传统大厂生产供货的影响,P4 ASIC供应格局有所波动,但星融元基于扎实的业务积累和技术创新,仍能满足客户关于P4交换机的需求,并提供全面专业的服务支持。


本次展会上,星融元凭借领先的技术实力和深厚的行业积累,深受广大客户的关注和认可。未来,星融元也将持续深耕,携手众多合作伙伴,为企业客户提供更加共享开放的网络解决方案,共创开放网络的无限可能。

PT Expo前瞻:星融元让开放网络新基建触手可及


关注星融元


当前,AI、大模型产业蓬勃发展,对通信的要求也越来越高,带动着网络通信基础设施向更加开放、高效的方向探索,PT Expo(中国国际信息通信展览会)作为展示ICT行业最新技术成果和未来趋势的重要平台,再度成为全行业的焦点。

9月25日至27日,这场被誉为“ICT市场的创新基地和风向标”的盛会将在北京举行,星融元作为开放网络的先行者与推动者,将携最新开放网络解决方案亮相PT展,展会现场,将展出AI以太网交换机CX-M系列云化园区交换机,以及面向RoCE场景的监控方案演示,为您揭开新一代智能化网络基建的神秘面纱。

星融元PT Expo邀请函海报

超低时延AI以太网交换机

51.2T 交换容量, 64 x 800G 高密接口,面向AI智算中心场景设计,具有业界领先的超低延迟和高可靠性。

算网一体化开放智能网关-CX102s-DPU

仅有半机架宽的通用开放计算平台,搭载了DPU扣卡和企业级SONiC,同时具备8口PoE++供电能力…小身材大能量,更多可能由你定义!

面向RoCE场景的监控方案:

基于星融元交换机开放的软硬件架构和带内网络遥测(INT)能力,为客户提供简洁易用的毫秒级可视化监控平台。

未来,星融元也会持续投入建设数“智”新基建,携手合作伙伴,助力各行各业构建更加智能化的开放网络平台。

更多精彩内容,展会现场等您解锁!

产品动态 | 星融元 AsterNOS 现已可用于智邦白盒交换机


关注星融元


星融元 AsterNOS 是一款可用于电信、数据中心和企业网络的全功能开放网络操作系统(企业级 SONiC 发行版),兼容Marvell、Intel、Broadcom 等芯片平台,其便捷性、易用性和稳定性已在海内外大规模部署中得到市场验证。

经过严格的软硬件兼容性测试和调优,AsterNOS 现可在智邦大陆科技(Accton Technology,以下简称“智邦”) AS7726-32X(基于Broadcom Trident III 交换芯片的 40GbE/100GbE 白盒交换机)和 DCS6500-48Z8C(基于 Broadcom Trident III 交换芯片的 10GbE/25GbE 交换机)上使用,以上两款交换机从即日起将正式加入AsterNOS硬件兼容列表,适配软件版本为R0406P01。

Accton 硬件规格

型号料号交换芯片/类型交换容量10G/25G40G/100GAsterNOS版本可用性
AS7726-32XF0LCH7632011STrident 3/BCM568703.2Tbps-32R0406P01可用
DCS6500-48Z8CF0PMX7656003STrident 3/BCM568732.0Tbps488R0406P01可用

AsterNOS在多平台充分验证的云网能力

传统网络多采用特定品牌提供的封闭系统,伴随厂商锁定风险,网络的扩展性和适应性受到极大限制。云计算时代下,灵活多变的数据中心业务需求驱动开放网络在全球范围内快速兴起。从最早的Google、AWS、Meta等顶级云服务商开始,到如今越来越多的云数据中心选择了软硬解耦的网络方案——开放架构的NOS+通用的白盒硬件,使网络运营者和管理者可根据实际需求完成云网架构的自由配置,让新应用在现网的落地成本大大降低。

星融元 AsterNOS 针对数据中心Underlay和Overlay网络环境进行了大量特性增强,其容器化的软件架构使云网能够跟上不断发展的业务需求,缩短部署新服务的时间,同时提高了网络作为数据中心三大基础设施之一的稳健性。

凭借 AsterNOS 丰富的数据中心功能集以及在网络虚拟化和管理方面的深度优化,采用星融元交换机(或其他兼容的白盒硬件)所构建的云网架构可轻松扩展至数以万计的计算和存储节点,并通过 REST API 让网络无缝融入云管平台。

更多信息请参阅:AsterNOS的软件特性和能力

无论是在公有云、私有云、混合云还是AI/ML智算中心,用于承载核心业务还是实现边界互联,经过充分验证的 AsterNOS 将会提供更高程度的可扩展性和模块化的解决方案,帮助您充分利用开放网络技术带来的所有优势。

智邦成立于1988年,为国际级网络通讯设备领导厂商,其产品线涵盖云计算与IT基础设施、交换机、无线网络、网络存储等软硬件设备,为数据中心/智算网络、运营商、企业等提供了丰富可靠的网络应用和解决方案。星融元作为开放网络领域的先行者和推动者,以其在开放网络软件的积淀与智邦的硬件制造能力强强联合,将为广大数据中心用户提供更加灵活多样的产品和方案选择。

如何购买?

关于星融元AsterNOS+智邦白盒的软硬件组合购买方式和更多详情,请访问:
https://asterfusion.com/asternos-hcl-accton/

星融元与智邦签署战略合作协议,将推出联合解决方案


关注星融元


近日,星融元与智邦大陆科技(以下简称“智邦”)正式签订战略合作协议,双方拟结合所长,推出开放网络联合解决方案,为最终用户提供完整的交换机软硬件一体系统,即,在智邦开发的基于Broadcom交换芯片的白盒交换机硬件平台上运行星融元开发的 AsterNOS 网络操作系统

AsterNOS以SONiC为内核、依托容器化的系统架构,支持开放的网络生态和灵活的选择方式:除了在星融元自研的开放白盒交换机上以一站式的整机+服务形式交付,亦可支持独立的软件形态交付,稳定运行在第三方的主流品牌白盒交换机硬件之上。

更多信息详询:400-098-9811

——
AsterNOS 设备模拟器(vAsterNOS 社区版)已开放免费下载,欢迎试用! “vAsterNOS” 获取直达链接 https://asterfusion.com/d-vasternos/

星融元荣获 2024 DPU & AI Networking Awards 创新引擎奖


关注星融元


近日,由中国通信学会信息通信网络技术专业委员会支持、江苏省未来网络创新研究院主办的 2024 DPU & AI Networking创新大会在北京盛大举行。星融元(Asterfusion)荣获大会年度 “创新引擎” 奖。

立足于开放网络技术,星融元以“为泛在算力构建开放网络”为愿景,凭借先进的软硬件开发能力,以及系列化产品+方案的一站式交付能力,在数据中心(含超算、AI智算中心)网络以及新一代园区网络领域做出了大量突破和创新。

针对AI智算中心网络场景,在业界领先的超低时延特性(100G-800G)之上,星融元实现了UEC(超以太网联盟)兼容的负载均衡解决方案,妥善解决了AI网络中高发生率、长时间的大象流造成的负载均衡问题;此外,还将DPU网卡的能力应用于AI网络,利用DPU灵活的可编程特性以及高性能的数据面转发能力实现了对RoCE的支持,并改善报文转发逻辑。通过与CX-N系列超低时延交换机的负载均衡优化相结合,实现整网RoCEv2报文的有序、无损、高速率转发。

星融元期待与上下游伙伴共建生态,一同探索各类前沿网络技术在AI、云计算、企业园区等场景的落地,持续赋能AI+产业应用,为各行各业带来创新变革。

星融元发布 51.2T 800G 以太网交换机,赋能AI开放生态


关注星融元


IB与以太之争

以太网替代IB趋势明显。据相关报告:2024年TOP500的超算中,采用以太网方案占比48.5%,InfiniBand占比为39.2%,其中排名前6的超算中已有5个使用以太网互联。

开放系统战胜封闭系统仅是时间问题。我们已经看到,以太网借助其与生俱来的开放性迅速弥合了与InfiniBand的差距,如采用RoCEv2技术路线的星融元CX732Q-N(400G)超低时延交换机,已在多次严格的现场测试中表现出与InfiniBand交换机相当的性能。

以太网走向800G时代

从GPT-1到GPT-4,模型参数数量已从1.1亿增长到5000亿,甚至可能超过万亿。

然而,在部署超算集群的算力中心,先进芯片和先进算力并不对等,算力芯片只提供算力,而先进算力其实遵循着“木桶效应”——算力、存储和网络三个核心环节,出现一个短板会使整个系统的性能出现巨大的下滑。正因如此,800G以太网的推出势在必行。

近年来IEEE(电气电子工程师协会)、OIF(光网络互联论坛)等标准组织相继制定了400G网络的标准,为800G网络的发展奠定了基础。

800G 以太网发展大事记

年份主要事件
2022首款 51.2T 交换芯片发布;网络行业迎来了重要的里程碑。这些交换芯片将支持64个800Gb/s端口,标志着800G以太网发展进入实体化落地阶段。与此同时,首批800G光模块的验证也在此期间开始。
2023标准发布和开发验证;IEEE发布了IEEE 802.3df标准的第一版,该标准定义了800G以太网的物理层规范。与此同时,OIF还发布了224 Gb/s标准,为800G和1.6T系统构建112 Gb/s和224 Gb/s通道提供了指导方针。
2024-2026预计将确认800G以太网的物理层标准,进一步完善和测试规范,以确保网络设备的互操作性和高性能。

星融元超低时延800G以太网交换机

CX864E-N是一款行业顶尖规格的单芯片盒式以太网交换机,专为AI训练/推理、高性能计算(HPC)和云计算/存储的需求设计,具有业界领先的低延迟和高可靠性,是AI时代下智算中心的首选。它拥有 51.2T 的超大交换容量和 64x800G 的端口密度,可构建超大规模数据中心,并在更优的投入成本下提供与 InfiniBand 网络相当的端到端性能。
CX864E-N符合UEC(超以太网联盟)标准,具有丰富全面的 API,便于与数据中心和HPC集群的无缝集成,其作为厂商中立的网络设备亦可兼容其他主流厂商的GPU和网卡硬件。

产品亮点

  • 单芯片51.2T 高密端口以太网交换机,极简的硬件设计,在2RU 空间可提供 64x800G OSFP 或 128x400G/512x100G
  • 全端口支持RoCE(基于融合以太网的RDMA)以及用于简化无损以太网配置管理的Easy RoCE
  • 行业速度最快的交换机,兼容400G和800G,800GE 端口转发延迟低于 560 纳秒
  • 满流量负载下64x800G SR8 端口的最大 TDP 为 2200W
    200+MB 的大型片上缓冲区可实现更好的 RoCE 无损以太网性能
  • 10ns PTP 和 SyncE 性能,支持严格时间同步的 AI 并行计算
  • 先进的 INT(带内网络遥测)提供更加实时精确的数据包延迟、丢包和路径数据,助力实现更先进的拥塞控制算法
  • 搭载企业就绪的SONiC 发行版 AsterNOS,提供一站式的开放网络解决方案;功能容器化软件架构让操作系统更加强大、可靠,且易于二次开发和定制
  • 兼容来自业界主流供应商的异构 GPU 和 SmartNIC
  • 线速可编程,平滑支持不断演进的 UEC(超以太网联盟)标准

系列化交换机产品,构建中立、开放的一站式高性能AI网络

星融元成立于2017年,是国内领先的互联软硬件解决方案提供商。自成立以来,星融元上百名SONiC 研发专家组成的专业团队一直专注于打造世界上最好的SONiC 网络操作系统——最终成果便是 AsterNOS。基于此,星融元推出了1G-800G的系列化交换机,全面覆盖从PoE接入到大规模AI训练的网络互联场景。

经过多年的技术积淀和迭代,星融元已在国内外AI算力中心、云服务商、垂直行业、园区网等多场景头部客户实现落地,为移动云、国家电网、人民银行等海内外上千家客户提供完整网络互联方案,并在年初以第一名身份中标中国移动2023-2024年白盒交换机集采。

面向新时代下的新需求和新挑战,星融元仍将积极拥抱开放生态,持续为用户构建中立透明、易于运维、高性价比的AI基础网络。


图片星融元vAsterNOS(设备模拟器)现已发布,可运行在GNS3、EVE-NG等网络虚拟软件中体验命令行操作及部分功能特性,您可前往以下平台免费下载镜像!

星融元官网 http://asterfusion.com/d-vasternos/

GNS3平台 http://www.gns3.com/asterfusion-vasternos

欢迎广大开放网络/SONiC技术爱好者加入官方交流群,获取用户指导手册和其他一手资料,更有vAsterNOS相关技术人员在线答疑。(Q群号:801700146,验证消息:姓名+所在公司/组织+联系电话或工作邮箱)

AI产业的未来:绿厂筑高墙,谁可通罗马?


关注星融元


偶然读到一篇很有意思的文章。

配图

原文:https://www.economist.com/business/2024/05/19/can-nvidia-be-dethroned-meet-the-startups-vying-for-its-crown

透过文章,可以看到人们都在通过什么样的方法试图与英伟达争夺人工智能未来的天下。

  • 有人在做整片Wafer级的超超超超超超超超级GPU,可以提供90万个核心和120万GB的内存(你没看错,小编也没有手抖,的确是8个“超”字、90万和120万GB;英伟达的GB200封装了1颗Grace CPU和2颗Blackwell GPU,就叫做Superchip了,那这个Wafer级的芯片前面用8个“超”字也不为过吧)
  • 有人在GPU的设计中对标了具体的应用场景(例如自然语言处理),继而采用了特殊的架构(例如时序指令集计算机架构),因此让这种GPU能够不再被内存墙困住
  • 也有人正在将GPU中与图形处理相关的一些逻辑剔除掉,只保留并增强与大语言模型相关的功能,从而让这种通用GPU(GPGPU)功耗更低、性能更强,更适合今天的GenAI应用

……

无论通往罗马的道路有多少条,无论穿越这些道路上有多么艰辛,但,这些旅程早晚都会终结在另外一堵墙之前:英伟达构筑的CUDA!

多么让人沮丧的结局啊!那为何还要开始这段旅程呢?为了回答这个问题,先来看看下面这张图片:

配图

数字最枯燥,但是也最说明问题:2025财年第一财季,英伟达的收入为260.44亿美元,其中,净利润为148.81亿美元,净利率为57.14%(这个净利率数字基本可以让99.99%的做硬件的公司哭死过去好几回)!

看看穿着黑色机车夹克的黄教主在最近几次演讲中痛陈他和历史上的英伟达所经历过的压力、危机、屈辱、挣扎、另辟蹊径、奋起反抗和其他所有的罄竹难书的过往,就会发现——今天,我们如果用“天下苦NVIDIA久矣”这样的话语来引导和宣泄情绪,是多么的不公平、反智商和“盲目仇富”啊!英伟达的3万亿市值、高得难以置信的净利率、干一月等于别人干三年的收入,都是用那些不堪的过往换来的,岂是短短一句情绪宣泄可以对冲掉的!?

说到这里,对于这篇文章所描述的这些人和事,就可以给出结论了:

世上只有一种英雄主义,就是在认清AI和GPU的真(xian)相(zhuang)之后,依然热爱并坚持探索“如何用新的方法搓出新的GPU”,从而为人(gong)类(si)的(de)科(fa)技(zhan)进(zhuan)步(qu)贡(geng)献(duo)力(li)量(run)!

那么,我们最终能够穿越高墙抵达罗马吗?答案是毋庸置疑的:能!破高墙者,唯有开放生态。

历史的发展已经不厌其烦地证明了一件事情:只有开放才能有生命力,才能可持续发展。看看网络设备领域和C记、计算芯片领域和I记、存储领域和E记、公有云领域和A记,哪一个不是如此!?

面对今天雨后春笋般长出来的GPU公司,提问题的正确方式应该是:几年之后,它们会开始让人们追忆N记在GPU领域的辉煌?而不是它们能不能、会不会让人们追忆N记!

说到这里,小编的脑海中突然又浮现出一行字:交换芯片领域和B记……[偷笑]

AI不等于GPU芯片,AI是一个生态,一个从最底层基础设施到最上层各种应用的生态;正如GPU芯片需要多家参与的开放格局,AI生态也需要多家参与的开放共建。

配图

作为国内为数不多深耕于开放网络软硬件产品的科技公司——星融元就是这个开放AI生态的坚定推进者与参与者之一。

2024年7月4日-7日,第七届世界人工智能大会(WAIC)即将在上海世博展览馆盛大举行,欢迎广大合作伙伴、媒体朋友、开发者、开放网络技术爱好者前来 H2-E516 展位体验、交流,共同探讨围绕中立开放的AI网络的生态合作,以及其他更多、更场景化的AI以太网部署思路

星融元与超云AI PaaS平台完成兼容性互认证


关注星融元


近日,星融元与超云数字集团有限公司(以下简称“超云”)AI PaaS 平台完成了联合测试,顺利完成产品兼容性互认证。

AI PaaS 互认证书

此次双方共同针对产品的功能、性能、兼容性方面进行了严格的测试,测试结果显示:星融元全系列RoCEv2协议低时延交换机(25G/100G/200G/400G/800G)与超云AI PaaS平台完全兼容,稳定运行,可为各类信息化应用提供保障。

超云数字技术集团有限公司是由中国电子(CEC)、云基地(CLOUD VALLEY) 联合注资成立的国家高新技术企业、工信部专精特新 “小巨人”企业,是一家专注于数据中心产品及服务的本土制造商。公司产品覆盖智能计算、信创整机、私有云及云服务等领域,服务于互联网、金融、电信、制造、教育、能源及公共服务等多个行业。超云AI PaaS 平台可随时创建AI训练环境和训练任务,推动业务流程服务自动化,借助GPU虚拟化等技术灵活配置资源以满足不同场景需求,实现资源共享和统一管理,提高资源利用率。

超云AI PaaS 平台

星融元数据技术有限公司(Asterfusion)是行业领先的开放网络解决方案提供商,多年来专注于为各行业客户提供基于通用、解耦、高性能的硬件和SONiC软件框架的全场景一站式网络解决方案。面向AI时代下的新需求和新挑战,星融元持续为用户构建中立透明,易于运维、高性价比的基础网络。

无缝与上层业务/管理平台对接

  • 中立开放:规避“全栈方案锁定” 风险;网络对业务彻底开放,可无缝融入AI/ML业务平台,支持现有系统(如K8s,Prometheus等)的重用
  • 一站式AI/ML网络:系列化的开放网络方案适用于计算、存储、管理、云业务等多种场景,提供高度一致的部署与运维体验
  • 灵活组网,弹性扩展:提供前后向兼容的200G/400G/800G网络,灵活支持单一SKU或混合速率规格组网方案,规模可从边缘推理扩展到万卡集群
  • 400ns超低转发时延:端到端时延与IB网络相当,结合高可靠设计,大幅提升AI业务效率
  • 全线标配RoCEv2/Easy RoCE:全端口支持RoCEv2,无额外license收费;此外更开发了简化无损以太网配置与管理的Easy RoCE功能,帮助用户快速部署和高效监控AI/ML网络
  • 全面兼容超以太网联盟(UEC)规范:智能负载均衡技术现已支持UEC当前规范,未来将平滑演进,与新一代AI以太网规范保持同步

星融元 星智AI – 一站式AL/ML网络

未来,星融元将与超云开展更深层次的合作,为用户带来更高性能的AI智算服务和应用体验,共同助力AI驱动的新质生产力在各行业落地发展。

相关文章

对星融元产品感兴趣?

立即联系!

返回顶部

© 星融元数据技术(苏州)有限公司 苏ICP备17070048号-2