开源的DPU “Helium”,给性能不足的服务器安上“外挂”!
数据中心为什么需要智能网卡?
CPU的算力发展跟不上算力需求,所以人们考虑可以将一部分原本CPU承载的功能卸载到其他专用硬件上去处理(比如网卡),从而释放CPU算力,让其专注于处理关键的(创造经济效益的)用户业务。
但这反过来对于用来卸载CPU的硬件提出了更高要求——不仅仅需要收发流量等转发面的功能了,我们还需要网卡承担起更多元化的功能,把传统网卡转变为“智能网卡”。
智能网卡在数据中心的应用广泛于网络加速、存储加速和安全加速
- 网络加速:如OVS卸载/VXLAN终结、TCP卸载、GRE/GTP等隧道封装/解封装、可靠UDP、5G UPF加速等;
- 安全加速:如IPSec、SSL、XDP/eBPF、vFW/vLB/vNAT、DPI、DDoS、压缩/解压缩等;
- 存储加速:如RDMA卸载、NVMe-oF等。
将智能网卡升级成DPU架构后有什么提升?
传统的智能网卡上,首包的处理在CPU上,流表下发到网卡芯片里依旧占用了CPU的资源,并且需要为卸载的业务定义接口和相关的协议,实现起来比较复杂,定位问题难。而在DPU架构的智能网卡上,可以实现全卸载,相互之间没有太多业务接口,定位问题清晰。相当于有专门的计算资源来处理智能网卡相关的控制面,可实现控制面+转发面的全卸载。
对比市面其他架构的智能网卡
ASIC架构 | FPGA架构 | SoC(多核 + ASIC) |
---|---|---|
性价比高 | 低延时 低功耗 | 高灵活性 控制面、转发面同时卸载 |
可编程性差 开发周期长 | 可编程,但开发复制性高 开源生态不完善 价格高 | 功耗较高 |
DPU的架构是把多核处理器+ASIC做到一个芯片上(SoC 是把他们集成到板上,虽然DPU集成度更高但本质上架构类似))
- 采用通用CPU,易于编程和移植
- 容器化的部署环境,需要卸载的不同功能放在不同的容器里,就像一个小服务器,可以同时实现多种功能
开源的DPU智能网卡——星融元 Helium DPU智能网卡
当前,秉承着开放网络的理念,星融元已将Helium智能网卡的产品资料和代码开源,诚邀各位合作伙伴共同打造智能网卡行业生态!
Helium智能网卡采用高性能DPU架构设计,提供全开放的软件开发环境,可针对云数据中心、HPC、边缘计算等场景中客户原本跑在x86服务器上的的虚拟网络和虚拟网络功能进行卸载和加速处理,为客户提供更高性能体验的同时降低总体拥有成本。
以NFV(如vFW)为例,对比x86服务器:
通过以下数据可以发现,在提供了更低转发时延和更高流新建会话数的情况下,Helium智能网卡的功耗仅为服务器的1/6,购买成本节省超过1/3。
处理性能 | 转发时延 | 流心间会话数 | 功耗 | |
---|---|---|---|---|
2U机架式服务器 2 x Intel Xeon Gold 5118 24核 | 60G | 200μs | 12W | 350W |
Helium 智能网卡 24核 | 60G | 100μs | 15W | 60W |
以云网关接入为例:
在保证总接入用户数量的前提下,引入Helium智能网卡的建设方案相对于纯2U服务器的建设方案在机架空间占用、总功耗、成本上都具有明显优势。其中机架空间节省超过2/3,总功耗节省超过1/2,建设成本节省8W,同时机架平均每U接入的用户数有3倍以上的提升。
接入环境 | 设备配置 | 机架空间 | 总功耗 | 平均每U接入用户 | 注释 |
---|---|---|---|---|---|
1.44Tbps 流量接入 | 24 x 2U服务器 | 48U,2个42U标准机柜 | 8400W | 6000 | 单2U服务器典型功耗按350W计算; 单4U服务器典型功耗按500W计算; Helium智能网卡典型功耗为60W; 单流量牵引交换机典型功耗为430W; 各产品购入成本均取该规格对应的市场均价; |
3 x 4U服务器 24 x Helium 智能网卡 1 x 流量牵引交换机 | 14U,1个42U标准机柜 | 3390W | 20671 |
产品特性
- 4*SFP28接口或2*QSFP28接口,100Gbps典型混合业务处理能力
- 高性能DPU芯片,24核ARM处理器,集成加解密、压缩解压缩、虚拟化、数据包处理、流量整形协处理引擎
- 主机侧提供DPDK和VPP开发套件;网卡侧运行标准Linux + 容器虚拟化环境,并提供DPDK和VPP开发套件
- 大容量状态表和ACL表,最大64GB内存配置,支持千万级会话表
- 提供PCIe*16 Gen3.0/Gen4.0,支持PCIe在线升级
- 独立的管理网口
应用场景
- 网络加速:OVS卸载/VXLAN终结、TCP卸载、GRE/GTP隧道封装/解封装、可靠UDP、5G UPF等
- 存储加速:NVMe-oF(TCP)、压缩/解压缩等
- 安全加速:IPSec、SSL、XDP/eBPF、vFW/vLB/vNAT、DPI、DDoS防御等
- 客户自研场景下个性化应用的开发和移植