Skip to main content
开放网络的先行者与推动者—星融元
加入我们技术支持(Support)  TEL:(+86)4000989811

标签: 产品特性价值

传统大厂停产P4交换芯片后,你该怎么办?


关注星融元


P4(Programming Protocol-Independent Packet Processors)是一种开源的、数据面的高级编程语言。P4和基于P4的芯片平台(Tofino)自诞生以来便引起了学术界与工业界的广泛关注,其产业生态建设与落地应用更是在各大知名企业及初创公司的推动下得到了不断深化。

但就在今年8月,Intel宣布Tofino产品即将停产,最后停产的订单日期截止到10月30日,这将为Tofino产品的生命周期画上一个句号。

Tofino

这无疑给已经部署P4的企业、以及对网络可编程有需求的企业造成了相当大的困扰:如何在波动的供应格局中保持业务连续性、如何选择能够支持长期战略的解决方案,以确保能够在快速变化的环境中站稳脚跟。

星融元为您的网络可编程之路保驾护航

目前,星融元对于搭载Tofino芯片的可编程硬件平台(X-T系列)拥有充足的库存,保证未来三年内为客户提供稳定的产品供应和全方位的服务支持,为客户业务运行的稳定性、连续性保驾护航。

并且,Tofino芯片自2016年推出至今,已有超过8年的历史。在这8年的时间里,芯片设计理念、制造技术以及相关领域都经历了日新月异的发展和变革。星融元着眼于技术发展的最前沿,将为客户提供更高性能的替代选择:

更大的芯片资源:用于设计路由表、访问控制列表(ACL)、计数器和共享报文缓存;

更高编程效率:100%利用TCAM和SRAM,无需头疼调优;

更专业的支持能力:用全栈开放网络的软硬件技术和产品部件做好服务。

“P4+DPU”的创新组合,构成了星融元P4可编程硬件平台全栈可编程能力的核心,能够在智能网关、NFV、教育科研等众多应用场景中,满足全开放、可编程、高性能的业务需求。

P4可编程硬件平台产品开箱图

星融元X3-T硬件平台架构

多样化的应用场景

01 面向负载均衡与资源分配的应用

星融元P4可编程硬件平台通过使用P4语言来实现数据平面的自定义,非常适合于实现负载均衡和资源分配。它能灵活地处理网络流量,优化数据中心内部的服务器负载,以及实现高效的流量工程。例如,在数据中心网络中,P4交换机可以根据实时流量动态调整资源分配策略,优化网络性能,确保关键业务流量的优先处理。

02 数据中心互联的云边界网关

星融元P4可编程硬件平台可作为数据中心互联的边界网关设备,为集团的多个数据中心之间、以及集团数据中心与各分公司数据中心站点之间互通搭建一个大二层的网络,并且满足网络中不同部署位置对交换机所提出的不同需求。同时,P4可编程交换机还可以实现流量控制、访问控制、数据包过滤等功能,保护数据中心网络的安全性和稳定性。

P4可编程交换机在云边界网关的应用示意

P4可编程硬件平台在云边界网关的应用示意

03 打造数据中心智能化网络

星融元可编程硬件平台为客户提供了实时、精确且全面的INT(Inband Network Telemetry)和vINT(virtual INT)网络遥测数据。这些数据如同网络的脉搏,为智能化网络的运行、优化和修复提供了强有力的数据支持。
通过对INT数据的深入分析,设备能够洞察网络的每一个角落,预测并解决潜在的性能瓶颈,确保网络的顺畅运行。这种以业务为中心的数据分析方法,不仅提升了网络的运行效率,还增强了对潜在问题的诊断能力,为用户打造一个高度可靠、智能和自适应的网络环境。

带内网络遥测数据的应用示意

带内网络遥测数据的应用示意

最佳实践

在电商领域,星融元助力中国一家TOP电商平台实现了后端系统处理能力的重大突破。原先,客户日常海量交易上云后向后端交易系统的分发是由运行在服务器上的软件分发网关来实现的,但在传统的架构中,由于x86服务器的处理限制,平台需要大量服务器来运行交易分发网关软件,这不仅占用了宝贵的机房空间,还增加了运营成本。

用于开放算网平台X-T系列的应用场景

客户将自研的分发网关软件移植到星融元X-T平台后,通过X-T平台线速的数据平面处理能力和灵活的控制平面可编程能力,仅用2台X-T设备就完成了之前20~30台服务器的工作量,显著提高了数据处理效率和系统稳定性,同时也大幅降低了能耗和维护成本。

未来,星融元将基于坚实的技术积累和不断的创新,持续为客户提供技术领先的、易于部署的开放网络解决方案;并与众多合作伙伴携手,不断探索P4可编程网络的更多可能性!

星融元发布 51.2T 800G 以太网交换机,赋能AI开放生态


关注星融元


IB与以太之争

以太网替代IB趋势明显。据相关报告:2024年TOP500的超算中,采用以太网方案占比48.5%,InfiniBand占比为39.2%,其中排名前6的超算中已有5个使用以太网互联。

开放系统战胜封闭系统仅是时间问题。我们已经看到,以太网借助其与生俱来的开放性迅速弥合了与InfiniBand的差距,如采用RoCEv2技术路线的星融元CX732Q-N(400G)超低时延交换机,已在多次严格的现场测试中表现出与InfiniBand交换机相当的性能。

以太网走向800G时代

从GPT-1到GPT-4,模型参数数量已从1.1亿增长到5000亿,甚至可能超过万亿。

然而,在部署超算集群的算力中心,先进芯片和先进算力并不对等,算力芯片只提供算力,而先进算力其实遵循着“木桶效应”——算力、存储和网络三个核心环节,出现一个短板会使整个系统的性能出现巨大的下滑。正因如此,800G以太网的推出势在必行。

近年来IEEE(电气电子工程师协会)、OIF(光网络互联论坛)等标准组织相继制定了400G网络的标准,为800G网络的发展奠定了基础。

800G 以太网发展大事记

年份主要事件
2022首款 51.2T 交换芯片发布;网络行业迎来了重要的里程碑。这些交换芯片将支持64个800Gb/s端口,标志着800G以太网发展进入实体化落地阶段。与此同时,首批800G光模块的验证也在此期间开始。
2023标准发布和开发验证;IEEE发布了IEEE 802.3df标准的第一版,该标准定义了800G以太网的物理层规范。与此同时,OIF还发布了224 Gb/s标准,为800G和1.6T系统构建112 Gb/s和224 Gb/s通道提供了指导方针。
2024-2026预计将确认800G以太网的物理层标准,进一步完善和测试规范,以确保网络设备的互操作性和高性能。

星融元超低时延800G以太网交换机

CX864E-N是一款行业顶尖规格的单芯片盒式以太网交换机,专为AI训练/推理、高性能计算(HPC)和云计算/存储的需求设计,具有业界领先的低延迟和高可靠性,是AI时代下智算中心的首选。它拥有 51.2T 的超大交换容量和 64x800G 的端口密度,可构建超大规模数据中心,并在更优的投入成本下提供与 InfiniBand 网络相当的端到端性能。
CX864E-N符合UEC(超以太网联盟)标准,具有丰富全面的 API,便于与数据中心和HPC集群的无缝集成,其作为厂商中立的网络设备亦可兼容其他主流厂商的GPU和网卡硬件。

产品亮点

  • 单芯片51.2T 高密端口以太网交换机,极简的硬件设计,在2RU 空间可提供 64x800G OSFP 或 128x400G/512x100G
  • 全端口支持RoCE(基于融合以太网的RDMA)以及用于简化无损以太网配置管理的Easy RoCE
  • 行业速度最快的交换机,兼容400G和800G,800GE 端口转发延迟低于 560 纳秒
  • 满流量负载下64x800G SR8 端口的最大 TDP 为 2200W
    200+MB 的大型片上缓冲区可实现更好的 RoCE 无损以太网性能
  • 10ns PTP 和 SyncE 性能,支持严格时间同步的 AI 并行计算
  • 先进的 INT(带内网络遥测)提供更加实时精确的数据包延迟、丢包和路径数据,助力实现更先进的拥塞控制算法
  • 搭载企业就绪的SONiC 发行版 AsterNOS,提供一站式的开放网络解决方案;功能容器化软件架构让操作系统更加强大、可靠,且易于二次开发和定制
  • 兼容来自业界主流供应商的异构 GPU 和 SmartNIC
  • 线速可编程,平滑支持不断演进的 UEC(超以太网联盟)标准

系列化交换机产品,构建中立、开放的一站式高性能AI网络

星融元成立于2017年,是国内领先的互联软硬件解决方案提供商。自成立以来,星融元上百名SONiC 研发专家组成的专业团队一直专注于打造世界上最好的SONiC 网络操作系统——最终成果便是 AsterNOS。基于此,星融元推出了1G-800G的系列化交换机,全面覆盖从PoE接入到大规模AI训练的网络互联场景。

经过多年的技术积淀和迭代,星融元已在国内外AI算力中心、云服务商、垂直行业、园区网等多场景头部客户实现落地,为移动云、国家电网、人民银行等海内外上千家客户提供完整网络互联方案,并在年初以第一名身份中标中国移动2023-2024年白盒交换机集采。

面向新时代下的新需求和新挑战,星融元仍将积极拥抱开放生态,持续为用户构建中立透明、易于运维、高性价比的AI基础网络。


图片星融元vAsterNOS(设备模拟器)现已发布,可运行在GNS3、EVE-NG等网络虚拟软件中体验命令行操作及部分功能特性,您可前往以下平台免费下载镜像!

星融元官网 http://asterfusion.com/d-vasternos/

GNS3平台 http://www.gns3.com/asterfusion-vasternos

欢迎广大开放网络/SONiC技术爱好者加入官方交流群,获取用户指导手册和其他一手资料,更有vAsterNOS相关技术人员在线答疑。(Q群号:801700146,验证消息:姓名+所在公司/组织+联系电话或工作邮箱)

这款国产高性能DPU智能网卡,即将开源!


关注星融元


云数据中心的优化方向:从传统网卡升级到DPU架构的智能网卡

我们知道,各类智能网卡在服务器集群中的大规模部署,可以进一步降低数据中心建设和运营成本,更好地将服务器资源货币化。但仅从网卡层面来看,这个方案还存在不少优化空间。

  • OVS卸载不完全。传统的智能网卡仅负责OVS转发面卸载,但控制面仍是主机CPU处理,所以需要去定义Host CPU的控制面和卸载到网卡上的数据面业务之间的传输接口和协议,实现起来比较复杂,定位问题困难;
  • 虚拟网络功能卸载到网卡的难度大,很多网络功能(例如vLB,vNAT等)仍然在服务器上运行;
  • 无法实现存储加速和扩展,造成了服务器的性能瓶颈;
  • 部分传统网卡根本不具备编程能力,或者对芯片的编程难度大且生态缺失,开发门槛高,难以满足多样且多变的云业务需求。

全开放架构的DPU的智能网卡——星融元 Helium 系列

 Helium EC2004YHelium EC2002P
网络接口4 x 25GE SFP282 x 100GE SFP28
主机接口PCIe x 8 Gen4.0PCIe x 16 Gen4.0
管理口1 x Console Micro USB, 1 x GE RJ451 x Console Micro USB, 1 x GE RJ45

大Server中的小”Server”,帮助卸载服务器CPU负载

Helium 系列智能网卡采用DPU架构,集成了24核ARM和多样化的硬件加速协处理器,性能足够高,可以直接在网卡上运行各种网络功能虚拟化功能,释放宝贵的服务器资源。

Helium的典型业务性能数据参考:

  • 纯转发:100Gbps线速转发(128字节包)
  • OVS卸载性能:80Gbps
  • 5G UPF性能:80Gbps
  • IPsec性能:50Gbps

大Server中的小"Server",帮助卸载服务器CPU负载

高度开源的软件架构, 打造开放兼容、自主可控的生态系统

在通用的高性能硬件平台之上,星融元还提供了一套开放的软件开发环境——标准Linux内核+容器化架构,以及额外的DPDK/VPP开发套件(包含了最佳网络和安全处理所需的所有库和 API)。客户可以不考虑底层支撑框架直接开发上层应用;原先跑在x86上的DPDK应用和其他应用仅需简单编译便可移植到Helium DPU智能网卡上,并且按需组合使用。

标准Linux内核+容器化架构,以及额外的DPDK/VPP开发套件

支持存储加速和远端云盘挂载,满足服务器灵活扩展存储的需求

支持SPDK软件加速、NVMe-oF(TCP)卸载,可缩短存储I/O路径、提高存储读写性能

大幅降低数据中心整体建设和运营成本

以某客户场景为例。在保证总接入用户数量的前提下,引入Helium智能网卡的建设方案相对于纯2U服务器的建设方案在机架空间占用、总功耗、成本上都具有明显优势。其中机架空间节省超过2/3,总功耗节省超过1/2,建设成本节省8万,同时机架平均每U接入的用户数有3倍以上的提升。

Helium DPU智能网卡上的应用性能表现

1、Open vSwitch(OVS)的全卸载

Helium智能网卡采用高性能DPU芯片,具备独立的CPU和内存,可轻松实现百万级流表以及OVS控制面和转发面的全卸载,无缝融入虚拟网络。

包长(字节)流量数最大性能(Gbps)
6410K7
12810K14
25610K19
51210K21
51264K20
5122M18
102410K25

2、硬件加速的网络功能虚拟化(NFV)卸载,性能远超x86服务器软件模拟

通过以下数据可以发现,在提供了更低转发时延和更高流新建会话数的情况下,Helium DPU智能网卡的功耗仅为服务器的1/6,购买成本节省超过1/3。

Helium DPU智能网卡与当前市面上的智能网卡对比

对比FPGA架构智能网卡

 FPGA架构智能网卡Helium DPU 智能网卡
开发难度开发难度较高,需厂商高度支持标准Linux+容器化架构,额外的DPDK软件开发套件,易开发易移植
处理性能集成了多核CPU,但核数有限(最高规格为16核,一般厂家平均为4或者8核),无法承载复杂的控制面功能24核ARM处理器,多种硬件协处理器加速,可支持复杂的控制面业务卸载
采购成本FPGA架构核心器件的成本普遍较高,尤其是支持大容量内存的产品内存可以扩展至64G,千万级会话表,性价比高
功耗对比同规格的产品,功耗偏高同规格的产品,功耗偏低

对比其他SoC架构的智能网卡

  • 采用DPU架构的Helium智能网卡相比于普通的SoC架构网卡集成度更高,性能更强
  • 更多的ARM核、更高的内存,支持复杂的控制面业务卸载以及千万级会话表项
  • 更开放的生态,提供DPDK、VPP开发套件,标准的Linux操作系统,容器虚拟化环境,契合用户自定义的业务需求,覆盖更宽泛的应用场景。

当前,我们在Helium DPU 智能网卡上已经完成了多种场景的功能验证,包括OVS、NVMe-oF(TCP)、LVS、5G UPF、SSL卸载等,保证了高质量、高可靠、高性能的用户体验。

5G UPF卸载

SSL卸载

卸载OVS同时集成第三方应用

关于Helium DPU智能网卡的开源工作

秉承开源开放的理念,星融元现已将Helium DPU智能网卡的产品资料和相关代码开放给生态内广大客户和合作伙伴,期待与您一同探索更多开放网络的应用场景。

开源地址:https://github.com/asterfusion/Helium_DPU

相关文章

开源DPU如何加速数据中心网络/安全/存储应用?


关注星融元


数据中心场景下,是什么在侵占服务器的业务算力?

后摩尔定律时代,数据中心服务器算力的增长跟不上带宽的增长,原本用来处理业务的算力被大量浪费在处理网络数据和基础设施业务上(OVS、NFV),通过CPU软件模拟的方式性能已经无法满足需求,服务器性能已经达到瓶颈,市面上不少客户可能会考虑两个选择:

  1. 增加服务器数量;
  2. 为服务器增加一块智能网卡,用于网络业务卸载。显而易见,增加服务器数量需要消耗的成本远大于购买智能网卡需要的成本。

DPU智能网卡实现CPU负载卸载

传统的智能网卡上,首包的处理在CPU上,流表下发到网卡芯片里依旧占用了CPU的资源,并且需要为卸载的业务定义接口和相关的协议,实现起来比较复杂,定位问题难。

而DPU架构的智能网卡上,可以实现全卸载,相互之间没有太多业务接口,定位问题清晰。相当于有专门的计算资源来处理智能网卡相关的控制面,可实现控制面+转发面的全卸载,并且对比FPGA或SoC架构的网卡,DPU的处理性能处于绝对优势。

以云网关接入为例。在保证总接入用户数量的前提下,引入DPU架构智能网卡的建设方案相对于纯2U服务器的建设方案在机架空间占用、总功耗、成本上都具有明显优势。其中机架空间节省超过2/3,总功耗节省超过1/2,建设成本节省8W,同时机架平均每U接入的用户数有3倍以上的提升。

云网接入的数据表

DPU架构的智能网卡——星融元Helium DPU智能网卡现已开源!

Helium DPU 智能网卡的特色

  • 开源开放的生态:通用处理器 + 标准的Linux系统(可适配多版本),并且还提供了全开源的软件开发环境,可以轻松搭载任何基于Linux的自研应用,高度灵活、自主可控
  • 性能&功耗:对比其它网卡厂家采用FPGA或SoC架构的产品,Helium智能网卡采用集成度更高的DPU架构,做OVS或NFV的处理性能处于绝对优势;另外同等性能或更高性能下,Helium智能网卡的功耗更低;
  • 大量的应用场景验证:包括OVS卸载(控制面数据面全卸载)、5G UPF(信令面用户面全卸载)、DPVS卸载、SSL加解密卸载等场景

Helium DPU 智能网卡硬件架构

  • 高性能DPU芯片:24个ARMv8.2核、众多硬件加速协处理器
  • 业务接口:4 x 25GE、2 x 100GE
  • 高速连接:PCIe Gen3.0/4.0 x 16
  • 内存:16GB,可扩展至64GB
  • 存储:64GB EMMC 5.1

Helium DPU 智能网卡的一站式软件开发环境

  • 标准Linux底层基座操作系统(可以定制更换,包括Linux、CentOS、Ubuntu、Debian、中标麒麟等)
  • 标准容器虚拟化环境
  • 开放的库和API(DPDK套件(19.11、20.11、21.11)、VPP、其它网络和安全开发工具)

Helium DPU 智能网卡典型业务性能数据参考

  • 纯转发:128字节数据包100Gbps线速转发
  • OVS卸载性能:80Gbps
  • 5G UPF性能:80Gbps
  • IPsec性能:50Gbps

开源地址:GitHub – asterfusion/Helium_DPU: Helium DPU

实例1:Open vSwitch(OVS)卸载到Helium DPU 智能网卡,同时集成第三方应用

Open vSwitch(OVS)卸载到Helium DPU 智能网卡

  • 可以在网卡上安装各种容器应用功能
  • 同时打通各容器之间、以及容器与VM之间的数据通道

实例2:Helium DPU 智能网卡卸载SSL加解密引擎

Helium DPU 智能网卡卸载SSL加解密引擎

  • 内置硬件加解密引擎
  • SSL加解密:29K TPS;10~20Gbps

实例3:Helium DPU 智能网卡卸载eBPF

Helium DPU 智能网卡卸载eBPF

  • eBPF功能卸载至智能网卡,智能网卡上携带的ARM处理器单独实现一个后端,将中间的eBPF字节码编译成ARM处理器体系结构的指令码,载入网卡RAM(智能网卡包含DRAM,因此MAP也可以被卸载),智能网卡从网卡RAM里载入eBPF程序并运行
  • eBPF处理以后的数据报文以及元数据和统计信息返回给主机应用

实例4:Helium DPU 智能网卡完全卸载5G UPF

Helium DPU 智能网卡完全卸载5G UPF

  • UPF全部功能(信令面和用户面)卸载至智能网卡,与MEC Host无缝融合
  • UPF与MEC逻辑隔离,互不影响,MEC无需重新架构即可获得高性能

相关文章

开源的DPU “Helium”,给性能不足的服务器安上“外挂”!


关注星融元


数据中心为什么需要智能网卡?

CPU的算力发展跟不上算力需求,所以人们考虑可以将一部分原本CPU承载的功能卸载到其他专用硬件上去处理(比如网卡),从而释放CPU算力,让其专注于处理关键的(创造经济效益的)用户业务。

但这反过来对于用来卸载CPU的硬件提出了更高要求——不仅仅需要收发流量等转发面的功能了,我们还需要网卡承担起更多元化的功能,把传统网卡转变为“智能网卡”。

传统网卡与智能网卡对比图

智能网卡在数据中心的应用广泛于网络加速、存储加速和安全加速

  • 网络加速:如OVS卸载/VXLAN终结、TCP卸载、GRE/GTP等隧道封装/解封装、可靠UDP、5G UPF加速等;
  • 安全加速:如IPSec、SSL、XDP/eBPF、vFW/vLB/vNAT、DPI、DDoS、压缩/解压缩等;
  • 存储加速:如RDMA卸载、NVMe-oF等。

DPU智能网卡加速后示意图

将智能网卡升级成DPU架构后有什么提升?

传统的智能网卡上,首包的处理在CPU上,流表下发到网卡芯片里依旧占用了CPU的资源,并且需要为卸载的业务定义接口和相关的协议,实现起来比较复杂,定位问题难。而在DPU架构的智能网卡上,可以实现全卸载,相互之间没有太多业务接口,定位问题清晰。相当于有专门的计算资源来处理智能网卡相关的控制面,可实现控制面+转发面的全卸载。

对比市面其他架构的智能网卡

ASIC架构FPGA架构SoC(多核 + ASIC)
性价比高低延时
低功耗
高灵活性
控制面、转发面同时卸载
可编程性差
开发周期长
可编程,但开发复制性高
开源生态不完善
价格高
功耗较高

DPU的架构是把多核处理器+ASIC做到一个芯片上(SoC 是把他们集成到板上,虽然DPU集成度更高但本质上架构类似))

  • 采用通用CPU,易于编程和移植
  • 容器化的部署环境,需要卸载的不同功能放在不同的容器里,就像一个小服务器,可以同时实现多种功能

开源的DPU智能网卡——星融元 Helium DPU智能网卡

当前,秉承着开放网络的理念,星融元已将Helium智能网卡的产品资料和代码开源,诚邀各位合作伙伴共同打造智能网卡行业生态!

Helium智能网卡采用高性能DPU架构设计,提供全开放的软件开发环境,可针对云数据中心、HPC、边缘计算等场景中客户原本跑在x86服务器上的的虚拟网络和虚拟网络功能进行卸载和加速处理,为客户提供更高性能体验的同时降低总体拥有成本。

高性能DPU架构设计图

以NFV(如vFW)为例,对比x86服务器:

通过以下数据可以发现,在提供了更低转发时延和更高流新建会话数的情况下,Helium智能网卡的功耗仅为服务器的1/6,购买成本节省超过1/3。

 处理性能转发时延流心间会话数功耗
2U机架式服务器
2 x Intel Xeon Gold 5118
24核
60G200μs12W350W
Helium 智能网卡
24核
60G100μs15W60W

以云网关接入为例:

在保证总接入用户数量的前提下,引入Helium智能网卡的建设方案相对于纯2U服务器的建设方案在机架空间占用、总功耗、成本上都具有明显优势。其中机架空间节省超过2/3,总功耗节省超过1/2,建设成本节省8W,同时机架平均每U接入的用户数有3倍以上的提升。

接入环境设备配置机架空间总功耗平均每U接入用户注释
1.44Tbps
流量接入
24 x 2U服务器48U,2个42U标准机柜8400W6000单2U服务器典型功耗按350W计算;
单4U服务器典型功耗按500W计算;
Helium智能网卡典型功耗为60W;
单流量牵引交换机典型功耗为430W;
各产品购入成本均取该规格对应的市场均价;
3 x 4U服务器
24 x Helium 智能网卡
1 x 流量牵引交换机
14U,1个42U标准机柜3390W20671

产品特性

  • 4*SFP28接口或2*QSFP28接口,100Gbps典型混合业务处理能力
  • 高性能DPU芯片,24核ARM处理器,集成加解密、压缩解压缩、虚拟化、数据包处理、流量整形协处理引擎
  • 主机侧提供DPDK和VPP开发套件;网卡侧运行标准Linux + 容器虚拟化环境,并提供DPDK和VPP开发套件
  • 大容量状态表和ACL表,最大64GB内存配置,支持千万级会话表
  • 提供PCIe*16 Gen3.0/Gen4.0,支持PCIe在线升级
  • 独立的管理网口

应用场景

  • 网络加速:OVS卸载/VXLAN终结、TCP卸载、GRE/GTP隧道封装/解封装、可靠UDP、5G UPF等
  • 存储加速:NVMe-oF(TCP)、压缩/解压缩等
  • 安全加速:IPSec、SSL、XDP/eBPF、vFW/vLB/vNAT、DPI、DDoS防御等
  • 客户自研场景下个性化应用的开发和移植

相关文章

技术分享-P4可编程平台+DPU的负载均衡实现思路


关注星融元


在选择硬件还是软件负载均衡方案时,务必根据实际的场景去考量。我们总结衡量负载均衡性能的关键指标,主要有以下几条:会话表项容量、新建并发处理数量、转发性能。

硬件负载均衡的优势:高性能,功能全面,打包提供安全功能

在定制处理器上运行的独立负载均衡服务器。硬件负载均衡一般都支持全局负载均衡并提供全面的、复杂的负载均衡算法,功能强大;并且基于专用的处理器,吞吐量也能做到很高,可以支持单机百万以上的并发。此外硬件负载均衡往往具备防火墙、防DDOS等安全功能。

硬件负载均衡的问题:昂贵、灵活性差、扩展性差、无法被云平台统一管控

支持硬件负载均衡的专用设备是一个封闭的盒子,当需要进行动态扩容/网络改造时会非常不灵活。举个例子,目前有很多上云的业务希望用云管平台统一管理起来。但是如果是用封闭的硬件负载均衡方案,就无法做到灵活的统一管控。另一个更为实际的因素,价格。专用硬件负载均衡设备价格昂贵,大多数用户负担不起。以F5 的设备为例,一台比较低端的设备在市场价格可达到 30 万左右,如果还需要进行高可靠部署,成本就是翻倍的。

IB交换设备图

软件负载均衡的优势:可在标准硬件上运行,低成本,良好的扩展性

软件负载均衡的问题:性能差、部分情况配置复杂、部署在服务器上大量消耗了服务器性能

显而易见,性能上达不到专用硬件的性能。在做这种软件负载均衡的情况下需要考虑各种各样的接口,业务的配置,这会是非常复杂的情况。并且所有基于软件的负载均衡实现方式都需要部署在我们服务器上,也就意味着消耗服务器 CPU 的性能,造成了我们各种各样的一个厂商成本上升。

基于P4+ DPU可编程平台的的负载均衡实现思路

1、P4+DPU的可编程开放硬件平台(需配合用户自研负载均衡软件)

  • 可提供千万级的会话表项和百万级的高并发
  • 相比专用的负载均衡设备,在设备成本上有非常大的缩减
  • 管理平面、控制平面和数据平面全部可与CloudOS对接

P4+DPU的可编程开放硬件平台

P4+DPU的可编程开放硬件平台的转发过程

负载均衡实现概要

有一个新请求过来,设备首先会去查表,如果命中就直接走硬件的快速转发;如果没有命中就会把请求上送到智能业务处理卡(GHC卡),由其进行转发。与此同时它还会把相关信息发送给CPUCPU会生成详细的会话表项,并把表项的摘要下发到交换芯片中,交换芯片在数据流下次进来的时候直接转发,从而实现智能快速转发和慢速转发的结合。

在实际的负载均衡场景中,往往存在着非常定制化的开发需求。X-T系列硬件平台可提供一款针对开放、可编程网络构建的底层操作系统(AsterNOS-Framework,它作为一站式的综合开发环境,以轻量化的SONiC为内核,将三种异构硬件单元(x86/ARM/P4 Switch ASIC)融合成一个完整的网络系统,可为开发者大大缩短开发周期。

相关链接:https://asterfusion.com/product/x3-t/

2、Helium DPU网卡(Server in Server,卸载服务器上的软件负载均衡)

  • 高性能DPU芯片,多核ARM64、集成多个硬件加速协处理器,拥有百G级的网络连接能力
  • 智能网卡的外挂扩展内存可解决四七层负载均衡对会话表容量的要求
  • 卸载OVS+负载均衡释放服务器集群性能,降低服务器集群压力

卸载服务器上的软件负载均衡

除了标准的Linux以外,Helium DPU网卡还可提供底层基座操作系统FusionNOS-Framework和DPDK开发套件,客户可以此为基础,直接开发上层应用程序。基于x86开发的各种DPDK应用、VPP应用和一般Linux驱动应用,仅需要简单编译就可以迅速移植到Helium DPU网卡上。

提供底层基座操作系统FusionNOS-Framework和DPDK开发套件

各种DPDK应用、VPP应用,仅需简单编译就可以迅速移植到Helium DPU网卡

相关链接:https://asterfusion.com/product/helium_dpu/

相关文章

低时延特性媲美Infiniband交换机,星融元发布200GE和400GE新款型


关注星融元


CX-N系列是星融元自主开发的超低时延以太网云交换机,可为云数据中心的高性能计算(HPC)集群、AI大数据分析、高频交易、Cloud OS融合等多种业务提供高性能的网络服务,亦可部署于云化园区网络、运营商网络等多种场景。

超低时延以太网云交换机

  • Port to Port 时延最低可达400ns
  • 搭载功能完备的企业级SONiC发行版 – AsterNOS
  • 支持RoCEv2协议以及各项网络拥塞控制技术,提升
  • 带宽利用率并减少网络传输的延迟、抖动,帮助构建高性价比的无损以太网
  • 全盒式设备,组网灵活易扩展
  • 支持零配置部署和上线,简化运维工作量,降低整体运营成本

星融元硬件与网络操作系统的架构优势

新增200GE/400GE款型

充分满足下一代数据中心高带宽需求

超低时延交换机新增机型及规格

  • 采用业界主流的最新一代低时延可编程芯片,对芯片进行重编程优化
  • 新算法重构上层软件协议,在控制面保持低时延特性
  • 单个盒式交换机提供更多的200GE/400GE接口速率,承担更大的业务吞吐量
  • 精简网络中的交换机数量,降低整体功耗,可将更多资源用于计算和存储业务
  • 促进网络扁平化,TOR交换机之上的跳数更少,延迟更小
  • 配合星融元带内网络遥测(Inband Network Telemetry)方案,实时、精准监测网络运行状态,保障网络稳定运行

性能媲美IB的平价替代之选

真实场景测试:超低时延以太网交换机 VS. Infiniband交换机

以下是在分布式存储网络场景下的对比测试,参与测试的设备同为32x100G规格。对比各项测试结果,我们可以明显看到:星融元的CX532P-N的整体性能优于Mellanox的SB7700,时延更低。

测试结论

在本次存储场景测试中,CX532P-N交换机各项特性可超越Infiniband交换机(SB7700),而作为通用以太网硬件的CX-N系列,成本仅为专用设备的50%左右。

相比建设高性能计算或存储专网,采用CX-N系列构建多网合一的融合增强型以太网可大大降低运维难度和成本投入。

存储场景测试测试结果

测试环境-硬件

存储场景测试环境-硬件

测试环境-软件工具

存储场景测试环境-软件工具

相关文章

积极响应客户反馈,SONiC交换机全面支持思科风格命令行


关注星融元


今天,我们不谈产品也不谈方案,想先给大伙分享一个客户「不成功案例」 。

配图

来简单说说背景吧。正如诸位所见,近些年越来越多的新锐科技企业都开始有了业务上云的需求。云成为了支撑业务运转的生产力工具,云上的数据更是企业的宝贵的核心资产。

出于多方面因素,不少公司放弃了公有云方案,考虑构建一个弹性扩展、自主可控的私有云。但这无疑向云基础设施提出了严苛要求。例如云网络,就得具备低时延,高可靠、易扩展等特性才能轻松承载大批量的AI分析业务等等……当然,还需兼顾到自主建云的性价比。


D公司是国内一家创新文化浓厚的互联网科技企业,在业务上云的需求驱动下他们决定“取法乎上”——跳过所谓的”传统网络转型阶段”,直接对标海内外的云计算大厂,通过采用早已在头部大云中规模部署的SONiC方案,将开放开源的网络技术快速应用到自己的数据中心。
于是,专精于此的星融元很自然地进入到D公司的视野当中。

取得联系后,星融元的CX系列产品顺利部署到客户现场,并且最终的测试结果也十分喜人:CX系列交换机完全可以满足客户理想中的云网络需求!

不料,客户在最后关头犹豫了!
然后给星融元发了一张“好人卡”。
“你们的产品真的很好,但……”

D公司后来也解释了他们的顾虑:原生SONiC的命令行是Linux/Python风格的,而公司内部运维团队的技术能力都是建立在Cisco风格命令行基础之上。这一来所产生的学习成本,让他们不得不重新思索开放网络这件事。

寥寥几句,却引发了星融元产品和研发团队的深刻反思。
做一款最好用的企业级SONiC发行版一直是我们的使命和目标。这些年来,我们一直领先社区为AsterNOS开发了丰富的软件特性,适配了几乎所有主流商用交换芯片,并为网络自动化提供了全量的操作编程API,让AsterNOS变得更为强大、稳定……但相较而言,对于SONiC NOS在人机交互层面存在的巨大提升空间,的确显得重视不足。

意外的挫败令人无比遗憾,但也将市场的真实需求摆到了我们跟前:D公司运维团队现状绝非个例,当前IT基础设施建设转型变革的道路上,多的是这般 「心向往之而身不可至 」的尴尬。让更多的网络工程师轻松地把SONiC用起来,是推动开放网络从概念阶段走向方案落地当中不可或缺的一环。

于是星融元快速启动了针对AsterNOS命令行风格的开发工作。

KLISH(Kommand Line Interface SHell) 是一个在 Unix 系统上实现 Cisco 方式的命令行接口框架。基于SONiC开放解耦的灵活架构,开源的 Klish 已被集成到sonic-mgmt-framework 容器中作为命令行界面工具,通过AsterNOS所提供的API,我们可以很快地完成这项工作并适配到不同硬件平台。

KLISH是一个在Unix系统上实现Cisco方式的命令行接口框架

话说回来,这正是星融元开放网络技术的价值所在:当现有功能满足不了需求时,基于AsterNOS的API,我们能以传统时代下难以想象的效率,为客户开发出新的APP来解决他们的问题。Cisco风格命令行仅仅是APP之一。

不过这可能也是让公司里“某老年工程师”最失落,也最兴奋的事。

早年间,他带着几十个工程师为华为VRP1.0进行命令行设计实现和改造,还定义出过华为VRP第一个特性路标规划。但现在作为App进行开发的Klish命令行居然不需要那么多人去改造整个OS,更没有机会把一个个类似的独立需求放进路标规划里……甚至客户完全就可以自己动手写新App来解决问题——AsterNOS能让Python/Golang程序员在容器里开发一个新应用来增强和扩展交换机,就像写个Android App一样简单、快速。

AsterNOS已经可以同时支持两种命令行模式(Cisco风格/Klish)。

如今,版本更新后的AsterNOS已经可以同时支持两种命令行模式:标准的Linux Bash和传统商用交换机风格(Cisco风格/Klish)。

基于SONiC的AsterNOS在操作上变得更符合传统网络工程师的使用习惯。我们的工程师只需登录交换机敲上两行代码,便可进入到Klish界面快速开始工作(文末有录屏演示?)。

无论是园区还是云数据中心,只要是在星融元的交换机上,广大网络工程师都可以继续用他们早已熟稔于心的操作完成部署,为客户大大降低了因软件平台切换而导致的效率损耗。目前,AsterNOS对Cisco风格命令行的支持已经覆盖了90%以上的常用功能,而且该项工作还在不断推进。今后星融元所有交换机都将优先支持Cisco风格。


将一次错失客户的遗憾转变为积极响应市场需求的动力,并实现了产品快速升级迭代。这一切的背后是星融元在开放网络领域多年技术积累所带来的满满信心,以及围绕客户需求长期投入的不变决心。

附录:

AsterNOS对Klish命令行的支持情况
(部分展示,持续更新中)

仅需两步!在SONiC交换机上使用Cisco风格命令行

SONiC交换机上使用Cisco风格命令行

1 admin@sonic:~$ sudo config cli-mode cli
2 admin@sonic:~$ sudo sonic-cli
3 sonic# configure terminal

切换回Bash模式?Just Exit !

退出界面视图,回到标准Linux Bash模式

退出界面视图,回到标准Linux Bash模式(部分命令可支持混配,详情请询售前)

1 sonic# exit

相关文章

新品抢先看!星融元将SONiC引入云化园区网络


关注星融元


传统的园区网络架构方案下,网络中不同层级承担不同的网络功能,且都需要运维人员来进行接入和控制。随着园区内企业规模不断扩大、用户数目增多,网络规模和功能随之激增,最终导致了网络部署和管理难度越来越大。
– 手机、PC、IoT、安防需求各不相同;移动办公、虚拟团队、智慧园区要求更复杂
– 终端数量、带宽及其交互不断增多,东西向流量的持续增长迫使网络连接能力不断扩容
– 蠕虫、木马,黑客攻击等系统风险每天都在发生,需要新增各种安全防护能力
网络扩容、新业务开通、定位广播风暴、增加访问策略、解决WiFI掉线….广大园区网络工程师们每天都在为这些大事小事操碎了心。


以上种种问题,究其根源是传统层级化的网络架构已经跟不上复杂多变的业务需求。传统园区网亟待升级,新一代的云化园区需要更加精简高效的网络支撑。

众所周知,搭载着SONiC的交换机已在谷歌、微软等全球最先进的数据中心广泛应用,以SONiC和SAI代表的开放网络技术正在为IT行业带来巨大变革。
星融元是全球第一家把SONiC跑在园区接入层的开放网络解决方案供应商。
在绝大多数人的固有认知里,接入交换机往往意味着“低端型号”、“纯二层交换机”,或者…能通就行。而星融元却“一反常规”,给定位于园区接入/汇聚层的产品搭载了全功能的企业级SONiC发行版——AsterNOS
AsterNOS继承了开源Linux内核的内生安全和SONiC开放架构带来的扩展性,兼具商业版本的稳定性和易用性。凭借AsterNOS所提供的强大软件功能,仅搭配三、五款硬件便足以搭建起从接入层到核心层的完整网络架构,实现从中小企业办公室到跨楼栋的大型园区场景全覆盖。
这背后自然是有一套解决方案可以聊聊的,但今天先卖个关子,让我们重点关注一下星融元今年新推出的这款CX-M系列园区交换机本身。

软件能力:全功能的SONiC

完备的二、三层网络功能

支持多种IP路由协议,构建园区高弹性的IP Fabric

CX-M系列支持静态路由和OSPFv2/v3、BGP4/4+、ISIS等多种动态路由协议,满足IP网络的基本互联互通;此外还可支持更加灵活的策略路由,以及ECMP(等价多路径路由)以增加园区网络中路由可靠性,提高实际可用的传输带宽。

提供网络虚拟化功能,满足云化园区多租户使用场景

随着园区网络承载的业务越来越多,规模越来越大,根据职能部门的业务需求独立建设专网的思路已不再适用。当前网络虚拟化技术在云中的应用已经相当成熟,为云带来的便利在园区同样适用——通过VXLAN/EVPN 对园区物理网络做资源抽象,我们可以在CX-M系列组建的一张物理网络上创建多个虚拟专网,应用于不同的业务,例如办公、研发、IoT等等……实现一网多用和灵活部署,此外还可通过设备所提供的API对接管理平台,实现跨楼栋和区域的统一自动化运维管理。

园区全网无缝漫游和业务随行

CX-M支持ARP to Host技术,当终端设备通过无线AP连接到园区网络时,对应接入层的CX-M交换机会将其转为32位主机路由上线。当设备发生网络漫游,切换到了新的AP,CX-M又会借助分布式的算法在全网更新路由和其他安全认证信息,使原本的业务流得以快速转到正确路径。
漫游全程,终端的IP地址和安全策略都保持不变,网络切换无感知,原有业务不中断。这意味着,哪怕是在手机视频会议中跨楼层移动办公,您都不会感觉到任何卡顿。

为语音、视频、上网等数据流提供差异化服务,带来流畅互联体验

在办公地点分布广、人员分散的大型园区网络中,语音业务数据流对传输质量的要求高于普通的上网数据流。CX-M系列支持Voice VLAN功能,以MAC地址和VLAN ID两种方式识别语音业务数据流,并提高其传输优先级,保障语音业务服务质量。此外,CX-M也同样支持优先级映射、流量监管、流量整形、队列调度等QoS策略,在有限带宽的情况下为园区内的关键业务提供端到端的服务质量保证。

丰富实用的园区安全特性

  • 支持DHCP/ND Snooping,可抵御仿冒DHCP服务器、网关以及合法用户的各种网络攻击
  • 多种园区认证方式(802.1x 认证/MAB)配合IP源防护(IPSG)、动态ARP检测等技术,多重关卡防范外部非法接入
  • 值得一提的是,采用CX-M可构建一个全三层的园区网,每个接口就是一个广播域,终端之间二层隔离,因二层广播机制而产生的安全风险都将不复存在

硬件设计:全面贴合园区场景

CX-M系列园区交换机全系共11个款型,面向园区网络真实部署场景设计,并且全系采用开放解耦的通用硬件,成本和供货期更加可控。

  1. 搭载数据中心级的可编程交换芯片,为不断扩张的园区网络提供灵活的大表项空间;使用交换芯片内置处理器作为管理CPU,一定程度上可为客户降低组网成本
  2. 考虑到未来园区发展趋势,CX-M提供25G/100G的上行接口,天然适应WiFi 6时代带来的高带宽流量;24口/48口的高密度下行接入,有助于简化网络部署复杂度
  3. 绿色节能的元器件选型配合智能的端口/风扇节能机制,CX-M系列整机满负载情况下功耗最低仅63W

特殊款型举例:

园区交换机特殊款型展示图

部署价值:全三层组网,CX-M系列切实为您降本增效

传统组网与星融元云化园区交换机组网对比图

相关文章

为什么都叫智能网卡,Helium却牛X得很?


关注星融元


伴随着云和虚拟化技术在数据中心乃至整个通信领域的快速发展,在x86上基于Kernel架构实现的OVS(Open vSwitch)和各种虚拟化网络功能,转发性能无法保证,且需要耗费大量的计算资源。

传统网卡:在x86上基于Kernel架构实现的OVS和各种虚拟化网络功能

后来,DPDK出现了,性能有了大幅提升,但处理过程仍依赖于未针对数据传输进行优化的服务器和标准网卡,仍然存在性能瓶颈和占用计算资源的问题。

传统网卡:DPDK的出现,性能有了大幅提升
那么,应用功能需求与软件实现上的矛盾,如何解决呢?于是乎,基于硬件实现的智能网卡现身江湖了。

基于硬件实现的智能网卡,解决应用功能需求与软件实现上的矛盾

智能网卡应用非常广泛,从网络加速、存储加速到安全加速。

  • 网络加速如OVS卸载/VXLAN终结、TCP卸载、GRE/GTP等隧道封装/解封装、可靠UDP、5G UPF加速等;
  • 安全加速如IPSec、SSL、XDP/eBPF、vFW/vLB/vNAT、DPI、DDoS、压缩/解压缩等;
  • 存储加速如RDMA卸载、NVMe-oF等。

Helium横空出世

通用的高性能硬件平台

Helium是Asterfusion自主研发的基于高性能SoC芯片(24核ARM集成各类硬件加速协处理器)的25GE以太网智能网卡,可以提供高达100Gbps典型混合业务处理能力,助力客户构建高性能、智能化、可编程的业务网络,充分释放宝贵的计算资源,节约建设成本。

星融元Helium DPU智能网卡 全开放的软件架构

全开放的软件架构—-大x86 Server中的小“ARM Server”

云时代的大背景下,对于整个 IT架构虚拟化的需求越来越高,对于网络功能的要求也越来越多,这就要求网络架构更加开放。

基于Asterfusion全开放的软件架构,可以为客户打造一个开放、兼容的网络生态系统,客户原来跑在x86服务器上的各种DPDK应用和普通应用仅需要简单编译一下就可以迅速移植到Helium智能网卡上,客户可以依据自己网络的实际功能需求,灵活进行功能组合,以满足不同环境下的部署需要,就好像人们根据自己的喜好在手机上安装各种APP一样的方便快捷。

可以依据自己网络的实际功能需求,灵活进行功能组合

软硬一体的一站式综合开发环境

Asterfusion为客户提供了软硬一体的一站式综合开发环境,除了通用的高性能硬件平台外,还提供了底层基座操作系统FusionNOS-Framework,客户可以不用考虑底层支撑框架,直接开发上层应用程序即可,从而可以加速开发和移植进度,满足快速演进的市场需求。

软硬一体的一站式综合开发环境

Helium应用实践验证

Helium智能网卡可以广泛应用于网络加速、存储加速、安全加速等领域,Asterfusion基于该智能网卡也进行的丰富的应用场景验证实践,如云网功能卸载(OVS/VXLAN)、5G UPF、SSL卸载、网络可视化等领域。

云网功能卸载加速

Helium智能网卡可以支撑多种云网卸载实现模式,客户可以根据自己的需要进行灵活的选择和部署,最大程度上提高了服务器资源的利用效率,为最终用户业务应用带来切实的性能提升。

云网功能卸载加速

5G UPF

Helium智能网卡支持UPF功能(信令面和用户面)全卸载,实现与MEC Host的无缝融合,UPF功能全卸载,保证了UPF与MEC之间的逻辑隔离,互不影响,UPF不再依赖服务器的通用处理器,不需要考虑VNF与边缘云的兼容性和适配问题,可以有效减少核心网的安全隐患、降低UPF在边缘场景中与MEC共平台部署难度。

Helium智能网卡支持UPF功能(信令面和用户面)全卸载

云网功能卸载同时,集成虚拟化网络功能应用

Helium智能网卡在卸载云网功能的同时,可以基于容器环境加载各种第三方的VNF功能,同时可以为外部网络、虚拟机、VNF容器之间提供灵活的流量调度能力。

云网功能卸载同时,集成虚拟化网络功能应用

Helium特点小结

Helium DPU网卡的特性

  • 高性能:高达100Gbps典型混合业务处理能力
  • 易移植:x86上DPDK应用都能便捷移植
  • 多场景:云网卸载/VNF卸载/UPF/安全/存储等

相关文章

对星融元产品感兴趣?

立即联系!

返回顶部

© 星融元数据技术(苏州)有限公司 苏ICP备17070048号-2