Skip to main content
开放网络的先行者与推动者—星融元
加入我们技术支持(Support)  TEL:(+86)4000989811

基于INT与Flowlet的自适应路由:提升数据中心性能的关键

2025-10-17

自适应路由交换是一种智能的网络数据转发技术。它能够让网络设备(如路由器、交换机)实时地根据当前网络的状况(如链路拥堵、故障),自动地、动态地为数据包选择一条最优的传输路径。

深入理解:与传统方式的对比

自适应路由交换也可以称为“动态路由交换”,为了更好地理解“自适应”,我们先来了解一下什么是静态路由交换。

静态路由交换

工作方式:网络管理员手动配置好固定的路径。比如,命令数据从A到B必须经过路径C ( A -> C -> B)

  • 优点:不消耗设备计算资源。
  • 缺点:不灵活。如果路径中的C点发生故障或者严重拥堵,数据包依然会“固执地”试图走这条路径,导致通信中断或延迟,直到管理员手动修改配置。

它是构建中小型网络或特定网络区域的经典、可靠且低成本的方法。但在大型、动态的网络中,通常会被动态路由协议所取代或补充。

自适应路由交换

工作方式:网络设备之间会运行动态路由协议(如 OSPF, BGP 等)。这些协议会让设备互相通信,告知彼此自己所连接的链路状态、带宽、延迟等信息。每个设备都会根据这些信息,建立一个“网络地图”。

  • 优点:灵活、智能、高可靠性,容错率高当某条链路中断时,设备能立刻从“地图”上发现,并在毫秒级内自动将数据流转发到其他可用路径。可以同时利用多条路径来传输数据,避免单条链路拥堵,提升整体网络效率。
  • 缺点:配置相对复杂,设备需要消耗计算资源来运行路由算法和交换信息。

自适应路由交换的关键机制都有哪些?

网络状态感知

只有准确感知网络状态,才能实现自适应的路由选择。

队列深度:交换机会持续监控其输出端口的队列长度。队列长度是衡量拥塞程度的最直接、最简单的指标。

  • 链路利用率:通过监控端口在特定时间窗口内的实际流量与理论带宽的比值来衡量。这有助于了解链路的负载情况,为路由决策提供依据。
  • 带内网络遥测(INT):这是一种先进的感知机制。数据包在传输过程中会“携带”路径上各节点的状态信息,如延迟、队列深度等。http://asterfusion.com/a20250424-int-based-routing/
  • 显式拥塞通知(ECN):当交换机队列超过设定的阈值时,它会在经过的数据包头部打上标记。这是一种间接的、端到端的感知机制,通过这种方式,发送端可以根据拥塞情况调整发送速率,避免进一步加重拥塞。https://asterfusion.com/blog20250923-ecn/

总的来说,网络状态感知通过以上几种方式,为自适应路由交换系统提供了全面、准确的网络状态信息。

路由决策

根据感知到的信息决定数据包的走向。

  • 集中式决策:一个中央控制器收集全网信息,计算最优路径,并将流表下发给交换机。
  • 分布式决策:每个交换机基于本地信息和来自邻居交换机的有限信息(如通过PFC暂停帧或特定信令传递的信息),自主地做出路由决策不需要依赖中央控制器。

负载均衡

它是决定如何将流量分配到不同路径上的关键部分,通常有以下几种方式:

解锁AI数据中心潜力:网络利用率如何突破90%?

  • 逐流负载均衡:传统的 ECMP 路由通常采用逐流负载分担机制,其核心是基于数据包的特征字段(例如 IP 五元组等信息)作为计算因子去进行哈希运算,根据哈希值选择转发链路。
  • 逐包负载均衡:逐包的负载均衡技术则是将数据包均匀地负载到各条链路上,又被形象地称为“数据包喷洒”(Packet Spray)。问题在于逐包负载均衡无法保证报文依照原有时序到达接收端。
  • Flowlet负载均衡:不同于传统负载均衡的逐流负载分担或逐包负载分担,基于子流的负载均衡不光是对数据流进行分割以实现更精细均匀的负载分担,而且保持了报文到达的时序性。是目前最主流的先进机制。

如何为每个Flowlet选择“最佳”路径?

Flowlet

这就是INT发挥作用的地方了。

与传统通过SNMP轮询或NetFlow采样不同,INT直接将测量指令和数据嵌入到正在转发的数据包中。

  • 数据包在进入网络时被“植入”一个INT头部。
  • 当该数据包经过每个支持INT的网络设备(交换机)时,设备会将自己的信息(如入口/出口时间戳、队列深度、链路利用率等)写入到这个数据包的INT头部中。
  • 最终,接收端或网络边缘设备可以将这些信息收集起来,形成一个精确的、逐跳的路径状态视图。

工作流程示例

  1. 主机A开始向主机B发送一个TCP流。
  2. 第一个数据包被标记INT,它经过路径 Switch1 -> Switch2 -> Switch4,并在INT头中记录了这条路径上各交换机的队列深度。
  3. INT信息被发送到控制器。控制器发现Switch2到Switch4的链路队列很长。
  4. 此时,TCP流出现了一个短暂的间隙(Flowlet边界)。
  5. 当下一个数据包(属于第二个Flowlet)到达Switch1时,控制器已经计算出一条新的、不拥塞的路径:Switch1 -> Switch3 -> Switch4。
  6. Switch1将所有属于第二个Flowlet的数据包都转发到Switch3。
  7. 后续的Flowlet会重复此过程,始终选择当前最优的路径。

配图

高效、无损的自适应路由:基于INT的Flowlet 负载均衡技术

技术优点缺点
自适应路由动态避障,高网络利用率容易导致数据包乱序,损害TCP性能
Flowlet细粒度负载均衡,天然避免乱序路由决策依赖准确、及时的网络状态信息
INT提供精确、实时、逐跳的网络状态信息增加数据包开销,需要硬件支持
CX-N系列RoCE交换机 支持基于INT的Flowlet非常先进的数据中心网络负载均衡技术,它巧妙地结合了三者的优势:
  • 利用 Flowlet 解决了自适应路由的乱序问题。
  • 利用 INT 为Flowlet路由提供了精准、及时的决策依据。
最终实现了高效、无损的自适应路由,显著提升了大规模数据中心网络的性能。

对星融元产品感兴趣?

立即联系!

返回顶部

© 星融元数据技术(苏州)有限公司 苏ICP备17070048号-2