科普文
智算与云网融合的关系是什么?
2024-08-28
在了解智算与云网融合的关系之前,我们首先需要明确智算和云网融合各自的含义。
AI智算的概念
智算即人工智能计算,主要面向人工智能应用,提供人工智能算法模型训练与模型运行服务的计算机系统能力,代表了人工智能领域的飞速发展。它主要用于处理复杂、高维、动态、非结构化的数据和问题。智能计算融合了计算机科学、数学、物理、统计学等多学科知识,并广泛应用于大数据分析、智能机器人、自动驾驶、智能家居、智能城市、智能医疗、金融科技等多个领域。智算不仅提升了计算能力,还为各行各业带来了智慧的变革,成为推动科技进步的重要引擎。
云网融合的概念
而云网融合顾名思义包含云与网两个方面。云即云计算,包括计算能力、存储能力以及相关的软硬件。网是通信网,包括接入网、承载网、核心网等电信网络的方方面面。站在技术的角度,就是在云计算中引入网络的技术,通信网中引入云计算的技术,进而实现计算资源、网络资源和服务资源的无缝对接和高效协同。云网融合的核心技术可概括为“云调网、网随云”,重心是资源的调度。
智算与云网融合的关系
回到标题,那么二者的关系是什么呢?上文提到智算能够处理复杂的数据和任务,满足各种应用场景的需求,无疑智算的发展离不开强大的算力支持,而云网融合则为智算场景提供了强大的算力基础。云网融合通过软件定义网络(software defined network,SDN)和网络功能虚拟化(network functions virtualization,NFV)技术来构建高效的计算网络,将分散的计算资源、存储资源和网络资源进行统一管理和调度。
软件定义网络(software defined network,SDN)
SDN是一种异于传统的网络体系架构,理论上它将网络控制平面与数据转发平面分离,通过集中式的控制器对网络进行管理和控制,使得网络管理变得更加灵活且可编程管理,具有开放性和可编程性。被人们所熟知的框架结构为:应用层、控制层和数据层。
但在现实应用中,SDN往往与理论上存在差异。市场中很多已落实的商业SDN产品的数据转发平面与控制平面并不完全分离。随着SDN的不断发展,网络架构逐渐多样化。
图3中的(2a)为传统SDN架构,数据平面和控制平面完全分离。然而图3中的架构(3)才是当前市场上许多软件定义产品的一部分——基于SDN的Overlay架构。Overlay网络是在使用网络虚拟化在物理基础设施之上建立连接的逻辑网络。也有一些方案采用的是图3中的(2b)架构,例如 SD-WAN,控制整个网络的组件集中在控制器上,但控制平面保留在设备上,以便设备可以相对独立地运行。
对于SDN,我们了解其本质即可,提出SDN是为了灵活网络配置,高效率网络管理以及动态流量调控等。SDN本身不是产品,它更像是一种理念,最终产品形态还是取决于具体的解决方案。
网络功能虚拟化(network functions virtualization,NFV)
NFV是将传统上依赖于专用硬件设备的网络功能(如路由、防火墙、负载均衡等)从硬件中解耦,通过虚拟化技术转变为可在通用服务器上运行的软件,这些软件实体被称为虚拟网络功能(Virtual Network Functions,VNF)。
NFV架构的核心模块包括以下3个组成部分:
(1)虚拟化基础设施(Network Function Virtualization Infrastructure, NFVI)。包括计算和存储网络资源,用于承载网络功能的虚拟化实例。
(2)虚拟化网络功能(Virtual Network Functions,VNF)。能将传统的网络功能设备抽象为可在虚拟化基础设施上部署和管理的虚拟实例。
(3)虚拟化管理和编排(Network Function Virtualization Management and Orchestration, NFV-MANO)。负责虚拟网络功能的生命周期管理、资源编排和自动化操作,以实现对整个NFV环境的统一管理和控制。 NFV的架构使得传统的专用网络设备能够以软件的方式在通用服务器上运行,从而提高了网络功能的灵活性、可扩展性和可编程性,为传输网络的优化提供技术支持。
NFV在云网融合场景中的优势 :
(1)灵活性和可编程性。传统专用网络设备的功能和配置较为固定,难以适应快速变化的业务需求。采用NFV可以将网络功能以软件的形式部署在通用服务器上,实现对网络功能的灵活配置和编程控制,更好地满足不断变化的业务需求。
(2)资源利用率提升。通过NFV实现了计算资源、网络资源和服务资源在同一物理设备上的共享,提高了硬件资源的利用率。在智算场景中,这种共享机制可以确保计算资源的高效利用。
(3)成本降低。NFV可以降低网络部署和运维的成本。传统的专用网络设备需要大量硬件设备和人力资源进行部署和运维,而采用NFV可以通过软件定义和自动化操作简化网络运维流程,降低网络部署和运维的总成本。
(4)快速部署和创新。NFV可以加快新网络功能的部署速度和缩短创新周期。通过软件定义和自动化编排,可以大幅缩短网络新功能的上线时间,加快业务创新和服务交付的速度。
总结
综上所述,云网融合通过SDN和NFV技术为智算提供了强大的算力支持和资源共享机制,在服务层面也实现协同,而智算则通过引入智能算法和模型反向推动云网融合平台的创新和发展。
智算新时代的云网设备支撑
Asterfusion CX-N交换机帮助用户构建超低时延、 灵活可靠、按需横向扩展的数据中心网络,为AI/ML、高性能计算、分布式存储、多业务融合、云计算等场景提供卓越的网络服务。
-
业界领先超低时延:单机转发时延(400ns)低至业界平均水平的1/4~1/5,将网络时延在AI/ML应用端到端时延中的占比降至最低,帮助大模型的训练大幅度降低训练时间、提升整体效率。
-
云网融合,灵活开放:支持REST架构的Cloud OS、DevOps平台、第三方应用都能自动化地管理、调度星融元数据中心网络。同时,开放的RESTful API协同第三方云网控制器,简化网络管理和运维难度。将网络完全融入到云计算软件定义、弹性调度、按需扩展、自动运维的世界中。
-
低投资,高可靠:CX-N全系列数据中心交换机标配RoCEv2、BGP EVPN、VXLAN、容器网络能力,400G/200G标配智能负载均衡能力。用户无须为此类高级特性额外增加网络建设成本的同时还能构建高可靠、可独立升级的数据中心网络,帮助用户获得更高的ROI(投资回报率)。
2024-08-28
0成本5分钟!利用开源大模型搭建本地专属AI知识库
我们想让一些企业内部私有数据也进入到大模型推理分析的过程,让其更好服务于日常业务,但出于信息安全等考量,私有数据显…
2024-07-04
星融元发布 51.2T 800G 以太网交换机,赋能AI开放生态
CX864E-N是一款行业顶尖规格的单芯片盒式以太网交换机,专为AI训练/推理、高性能计算(HPC)和云计算/存储…
2024-02-21
Sora催化算力需求暴涨,星融元为泛在算力构建开放网络
泛在算力需要稳定的网络来连接各种计算资源,开放网络的高带宽、低时延、传输稳定性和可靠性等特性为泛在算力提供更多应用…
2024-02-05
星融元针对LLM大模型承载网发布星智AI网络解决方案
人工智能是数字经济的核心驱动力,AI 大模型是人工智能的新引擎。近年来,随着 ChatGPT 等生成式人工智能(A…
2024-01-02
开放网络+私有云=?星融元的私有云承载网络解决方案实例
CX-N系列产品在T客户这一全球化的通信服务提供商私有云领域的成功商用,一方面为我们树立了业界标杆,也提供了持续推…