Skip to main content
开放网络的先行者与推动者—星融元
加入我们技术支持(Support)  TEL:(+86)4000989811

标签: 解决方案

下一代园区网络,“分布式网关”实现更高效的无线漫游!


关注星融元


移动化办公时代下WiFi漫游已经成为了日常,你有没有遇到过网络断连导致业务中断的情况?这往往是因为我们在移动过程中,所属的IP子网发生了变化,终端不得不获取新的IP地址以适应新的网关,甚至我们还需要为此重新进行繁琐的安全认证…

为提升用户体验,实现WiFi无缝漫游,市面有以下两种常见的方案思路:

  1. 尽可能将需要漫游的区域规划在一个二层网络里,但是二层网络越大越不安全;
  2. 在新旧网关之间建立隧道,通过集中的网关控制器把漫游后的终端流量传输到原来的网关来转发,而这又导致复杂的配置和低效的流量转发路径,影响了漫游性能。

借鉴云网”分布式网关”概念,提升园区网络体验

早期的数据中心也多是采用集中式的网关,即:整个数据中心由几个大交换容量的设备作为网关来实现跨三层的流量转发。

随着市场需求变化以及各种新兴网络技术不断涌现,分布式网关的实现方式逐渐兴起——将三层网关分散部署到更靠近终端的接入层/边缘层。这种优化后的架构天然适应SDN(软件定义网络)的先进技术理念,在转发路径、网络运维、表项容量和网络安全等方面优势明显,成为了未来数据中心发展的主要方向。

云和园区的网络模型对比图

当我们对比云和园区的网络模型可以发现:尽管迁移/移动的规模和速度等方面有一定差异,但云中的虚拟机和容器的迁移过程与园区内的无线终端漫游高度相似,都同样要求移动后的终端的IP/MAC不能发生变化。

云网中的分布式网关设计为传统园区网络架构创新提供了一个很好的思路。

更多云化园区建设新思路》

星融元新一代云化园区网络:分布式网关设计

一个子网的网关以分布式的形式存在于每一台接入交换机上

星融元云化园区网络在全三层IP路由组网的基础上借鉴了云网中分布式网关的概念:一个子网的网关以分布式的形式存在于每一个接入交换机上。这可以充分利用每一个接入交换机的能力,让所有的跨子网转发动作在最近的交换机上完成,网关功能不再成为压垮网络中某一台设备的潜在风险,同时大幅度提升整网的转发效率。

园区漫游的集中式网关方案对比分布式网关方案:

 集中式网关(隧道转发)分布式网关
转发路径业务报文经过隧道封装,经由集中式网关统一转发业务报文在本地接入交换机上转发
运维部署部署时需要大量手动配置(例如AP分组规划,单独的SSID/VLAN等)较为复杂,日后维护起来难度大开局一次性配置分布式网关信息即可,无需其他额外操作
可靠性过于集中的网关功能有压垮设备的风险,一旦出现故障,影响面大网关功能分散到所有接入交换机上;但设备发生故障对业务影响小
扩展性承载着关键性的网关业务,需要高性能大容量的设备,也容易成为限制网络规模迅速扩展的瓶颈接入层交换机仅需存储本地表项,对设备容量要求不高,更容易扩展接入规模

高效转发路径,流量”不兜圈子”

传统的集中式网关方案与星融元的分布式网关方案对比图

传统的集中式网关方案中,终端发生跨VLAN的AP漫游后需建立隧道,将漫游后的业务报文发回原先的网关处理,导致转发路径长,效率较低。(图仅作流量示意,实际AC多为旁路部署)

在星融元的分布式网关方案中,每个接入交换机上都同时运行着相同的多个子网的网关,终端无论漫游到哪个AP,业务报文都可直接在本地接入交换机以最短路径完成漫游后的转发,无需到某个集中式网关上“兜圈子”,效率更高。并且,这种毫秒级的网络切换对于正在运行的上层业务不会有任何影响。

极简网络配置,开局”一步到位”

终端IP地址始终不变是实现无缝漫游的必要条件之一。星融元的园区方案中全网采用了统一的分布式网关,终端上线后,接入层的分布式网关会将它的IP/MAC信息以及安全控制策略在全网同步。

正因为终端漫游后接入的交换机上已经预先配置了网关信息,并且自动学习和同步了终端的IP/MAC信息,所以一旦感知到发生终端漫游便可快速响应,并将漫游后产生的表项变化在全网自动更新。

网络管理员所要做的,仅仅是在网络初始化时一次性配置好所有分布式网关的信息,运行过程中无需再有任何动态调整。

附:无线漫游数据参考,来自客户现场实测(采用上述分布式网关方案),网络切换时延约10ms,丢包0

原文地址:小于10ms!基于SONiC+白盒AP的WiFi无缝漫游实测

AP测试

更多关于星融元云化园区网络解决方案的创新亮点,请持续关注星融元官方公众号:星融元Asterfusion

相关文章

下一代园区网络,用Leaf/Spine架构替代传统“接入-汇聚-核心”三层架构


关注星融元


当前,大多数的园区网络采用三层拓扑结构的层次化模型设计,将复杂的网络设计分成几个层次,各层承担了某些特定的功能。

传统网络“接入-汇聚-核心”三层架构

但随着云计算和物联网技术的快速发展,传统三层拓扑架构的缺陷逐渐暴露。以下几点问题最为广泛也格外突出。

  1. 扩展性差:网络的扩展能力依赖于框式设备的纵向扩展能力。若要适应大规模园区的网络需求,需要使用高性能的汇聚/核心层设备。
    然而,框式设备采购成本高,且需要预先规划好网络规模。规模偏小,浪费了高性能的交换机资源;而当网络规模继续扩大,不菲的扩容价格又让用户陷入了两难境地。
  2. 网络利用率低:传统架构中存在多设备多路径冗余设计。为防止环路,汇聚层和接入层之间通常会运行防环协议(例如STP),此时接入交换机的上联链路中实际承载流量的只有一条,一半的端口和线路处于闲置状态。虽然后来出现了堆叠、MC-LAG等技术,但因技术原理复杂,又给运维部门带来了额外的工作量和故障风险。
  3. 网络体验不佳:随着园区内的东西向流量增多,传统网络架构下,大量流量报文需经由核心层转发。转发层数过多增加了时延,导致最终用户使用体验变差。

成熟应用于数据中心的Leaf/Spine架构能否引入园区?

答案是肯定的。

Leaf/Spine架构也称为分布式核心网络,它来源于交换机内部的 Switch Fabric,因此也被称为 Fabric 网络架构。这种先进的网络架构可以提供高带宽、低延迟、非阻塞的端到端连接,更因其可扩展性、高可靠性和高性能备受大型数据中心、云计算数据中心青睐。

我们已经从八个维度论证了云中的开放网络相关技术应用到园区的可行性。

相关阅读:
星融元:开放网络将从云走向园区 (中国云网络峰会现场分享)

对比传统的“接入-汇聚-核心”的园区网络架构,Leaf/Spine架构更为扁平,易于横向扩展,同时也缩短了东西向的通信路径,降低通信延迟。这种架构下,我们完全可以采用全盒式的单芯片交换机来搭建更高效、更精简的下一代园区网络。

“Leaf/Spine”架构,如何助力新一代园区网络建设?

一个三级/四层的Leaf/Spine架构的园区网络组网模型

一个三级/四层的Leaf/Spine架构的园区网络组网模型:

楼层内,接入层交换机作为Leaf,楼层汇聚交换机作为Spine,构成第一级网络

楼栋内,楼层汇聚交换机作为Leaf,楼栋汇聚交换机作为Spine,构成第二级网络

园区内,楼栋汇聚交换机作为Leaf,园区汇聚交换机作为Spine,构成第三级网络

01、更优秀的横向扩展性

随着园区规模的从小到大,采用Leaf/Spine架构的网络能够从一级横向扩展至多级,容纳从几十个到几十万个不等的园区接入终端,新扩展的模块(新接入的楼层或楼栋)都与原有网络架构完全一致。

园区网络采用Leaf/Spine架构的网络能够从一级横向扩展至多级

02、100%的带宽利用率

天然无环路,不增加运维难度

Leaf/Spine网络架构下,各节点都是具备L3功能的交换机,搭建起的是一个全三层的IP Fabric。

IP这种协议在设计之初就充分地考虑了环路规避、多路径转发、高可靠、多路径等因素,无需再引入STP或配置更为复杂的堆叠和MC-LAG——结合BGP路由和ECMP的负载平衡设计,园区网络中所有的物理线路理论上来说都可被充分利用,在不增加运维难度前提下实现100%的带宽利用率和端口使用率。

园区网络中所有的物理线路充分利用,天然无环路

03、更贴合园区网络业务发展趋势

满足海量终端接入和交互,更高质量的网络通信

随着物联网(IoT)和各类移动办公业务的兴起,接入层压力剧增,园区各处分布着海量的传感器、监控设备和智能终端接入网络,产生了巨大的东西向流量。

传统的三层园区网络架构下,东西向的L3流量不论是不是在一个接入交换机下,都需要走到具有L3功能的核心交换机才能完成转发。(如下图左)

而在Leaf/Spine的组网模型中(如下图右),Leaf和Spine层各节点采用Full-mesh连接,流量转发途经设备更少(两层Leaf/Spine网络内,终端间通信最多3跳)。并且因为路由结构的设计,所有的网络通信会充分利用所有的物理线路,因此网络通信质量是高性能、高可靠且可以预测的。

为了应对未来园区网络规模的持续增长,无论是链路流量被打满了还是接入端口不够用,去对应地增加Spine或是Leaf节点都不会是一件复杂的事。

传统网络和园区网络的组网模型对比

04、简化网络运维工作

精简网络架构,运维更简单更可靠

如前所述,Leaf/Spine网络架构中的二层域已经被压缩在了接入层以下。所以,在实际运维管理时,管理员只需根据不同的业务需求设置不同的L3子网进行隔离,无需再去配置维护各种复杂STP、全局VLAN、广播抑制等L2功能。与此同时,全三层的网络环境也从根源上杜绝园区广播风暴以及各种依靠二层广播机制传播的网络病毒。

结合上文可以看到,把复杂的园区网络架构简化成全三层的IP Fabric后,网络的可靠性和健壮性是不降反升的。例如:基于L3网络天然的高可靠、多路径能力,我们可以采用可靠度更高、运维管理更简单的”云化集群”方案替代堆叠组方案。

相关阅读:
下一代园区网络,何必再有“堆叠”?

传统网络与园区网络堆叠组方案的对比图

园区网络能从云网络近十年的高速发展中吸收的经验和成果还有很多。

除了Leaf/Spine架构,在星融元的云化园区网络解决方案中,我们还应用了Arp-to-Host、分布式网关等云数据中心领域先进的技术理念,对园区的底层网络架构进行了全面变革。

相较于传统组网方案

星融元的全三层横向扩展组网方案,可以降低园区建设运营成本40%以上。

更多方案内容:云化园区网络解决方案

将云计算领域的先进网络技术应用到新一代园区网络,还会给广大用户带来哪些全新体验和实用价值?

  • “不依靠CAPWAP隧道实现更高效的园区无缝漫游?”
  • “仅需2-3套配置模板文件的极简运维如何做到?”
  • ……

相关文章

星融元的超低时延交换机CX-N,让Infiniband交换机不再是唯一的选择


关注星融元


近期与同事去某物理所技术交流,满机房的都是IB交换机,十分壮观。

然而,客户这次叫我们来,目的却是想换掉他们,一台不留。客户无奈地说,IB 交换机的时延方面,没得说,但是”想买到“太难了,由于IB 交换机只支持IB 通信协议,所以每当有扩容的需求时,也只能继续选择IB 交换机,但IB 交换机太难买到,尤其是去年全球供货市场都紧张的情况下,更是遥遥无期,今年市场供应好了很多,客户反应说,依旧要6个月起步,根本等不起!此外,一旦交换机出点什么问题,想找售后,更是根本找不到,相隔两个大陆,一个太平洋的距离让客户对”及时响应“也只能是想想罢了,价格贵还能忍,但是想用的时候没有供应,绝对不能忍!

  1. 因此,经过长时间的被动与折磨,客户果断寻求替代厂家及其产品,在国内,能够平替IB 交换机的厂家便是星融元及其研发的超低时延交换机。
  2. 目前,星融元的低时延交换机CX-N共有五个系列,覆盖10G、25G、100G 、200G 、400G,可满足不同规模的建网需求。星融元是一家国内厂商,能够用户提供7X24小时的专家现场服务,只需要一个电话的时间,与IB交换机售后困难形成鲜明对比。不仅如此,星融元的低时延交换机还具备以下特点:
  3. 价格低廉,平均只要IB 交换机的一半成本。
  4. 交货周期短,能够及时满足客户的使用需求,不会耽误项目推进。
  5. 使用的是TCP协议,可实现网网互通。
  6. 最重要的是时延方面与IB相差无几。星融元交换机使用RoCEv2,降低传输协议时延,采用的是超低时延交换芯片,降低网络转发时延。我们曾在HPC 场景下,用星融元的CX-N与IB 交换机做过实际对比,数据相差无几,考虑到星融元设备价格的优美,其高性价比的特色不言而喻。

用户用星融元的CX-N低时延交换机替换了IB 交换机,不但解决了之前的掣肘,且节约了大量的成本,一举多得。

当今,数据中心算力正在成为新的生产力,数据中心向算力中心演进,为了满足大算力的需求,HPC 高性能计算成为常态。计算集群规模不断扩大,HPC 高性能计算的计算节点之间交互对网络性能的要求越来越高,目前明确提出低时延需求的业务有四类:第一是金融和电子交易类用户,特别是大家耳熟能详的从事期货等产品高频交易的电子交易类用户;第二是基于TCP协议的高清视频类业务,包括4K/8K高清视频直播和点播业务、高清视频会议、以及未来的虚拟现实(VR)等实时性要求极高的大带宽业务;第三是部分云业务,特别是虚机迁移、数据热备份和实时性要求比较高的云桌面、云支付等业务;第四是5G移动网络的传送承载业务,目前5G网络对传送承载层预留的时延指标非常苛刻,需要一些低时延传输新技术加以保障。

高性能计算、分布式存储等场景提供低时延以太网组网图

相关文章

新型数据中心建设中的“第三张网”——独立的流量采集网



关注星融元


在数字化技术日益普及的今天,计算力成为核心生产力,数据中心随之成为数字化时代的“新基建”,新型数据中心已经成为国家经济发展的重要命脉和关键基础设施。同时,数据中心面临的网络安全威胁也越来越多,运维精细化要求也在不断提高。

在这样的大背景下,政府、金融、电力、运营商、互联网等重点行业的数据中心除了部署串接的安全设备外,也部署了大量的旁路监测系统,如网络性能分析系统NPM、应用性能分析系统APM、回溯分析系统、网络流量分析系统NTA、安全态势感知系统、入侵检测系统、APT攻击检测系统、防病毒系统、数据库审计系统等。

不同类型的旁路监测系统往往来自不同的厂商,传统的部署方案往往采用各自独立的“点”状部署模式,形成一个个“安全烟囱”,不仅给信息资源的共享造成极大阻碍,也降低了各监测系统的工作效率,增加了建设和运维成本。

传统的分散“点”状部署模式

图1:传统的分散“点”状部署模式

传统的分散“点”状部署模式面临的问题主要体现在:

  1. 流量采集困难随着监测系统的增多,每个监测系统都需要业务网络交换机做流量镜像,而交换机镜像口一般不超过2个,从而导致新监测系统无法接入;并且随着镜像流量的增加,对业务网络交换机的性能也会有较大的影响。
  2. 扩展性较差由于各自独立的部署模式,当新增加前端监测链路或后端监测系统时,都需要重新进行网络规划,变成“拉链工程”。
  3. 资源无法复用各监测系统独立部署探针,完成去隧道、分片重组、去重、SSL解密等预处理需求,其中不少预处理功能需求是重叠的,从而造成重复建设和成本增加。
  4. 流量调度困难分散的部署模式,无法做到统一的流量调度,无法应对“护网行动”等紧急流量调度要求。

部署模式全新升级,痛点难点逐个击破

随着网络规模的扩展,传统“点”状部署模式正逐渐被抛弃,取而代之的是网络架构上的全新升级,通过建设统一的流量采集网,实现流量的统一采集、统一处理、统一分发。流量采集网的定位是统一的大数据采集和预处理平台,是继业务网络、管理网络之后部署的又一张专用网络,即“第三张网”。流量采集网的基本架构如下图所示:

星融元流量采集网的基本架构

图2:星融元流量采集网的基本架构

流量采集网采用CLOS网络架构,用户可根据采集点数量、流量规模、后端系统数量等灵活地调整网络规模,实现系统的平滑收缩/扩容。基于上述的流量采集网架构,该方案具备如下优势:

  1. 清晰的部署平面网络架构上进行了全新的设计,分成业务网络、流量采集网、监测系统三个清晰的部署平面,不同平面之间互不干扰,最大程度保障业务网络健壮性和安全性。
  2. 统一的流量采集每个监测点位的流量只需统一采集一次,之后可按需智能分发给各种监测系统,节约业务网络交换机的镜像口,降低对交换机的性能影响。
  3. 全采全监,按需调度流量采集尽量覆盖所有网络节点,实现全网无死角监控,让安全威胁无所遁形,全网覆盖,按需输出,针对不同的监测系统提供定制化的数据源。
  4. 一次建设,弹性扩展前端新增监测链路或后端增加监测系统时,仅需在流量采集网开通相应端口即可,无需重新的网络规划设计;基于CLOS架构,支持平滑的流量监控网的横向扩展,整体系统架构无需变动。
  5. 资源整合,降本增效流量采集网统一完成去隧道、分片重组、去重、SSL解密、打时间戳、报文截短等后端监控系统不擅长处理的预处理功能,替代各监测系统独立部署的各种探针,实现资源整合,降本增效。
  6. 集群管理,灵活调度借助于集群管理系统,实现统一的策略下发,为用户屏蔽复杂的策略分解和集群内的流量选路过程,实现了真正意义上的全网策略统一下发和灵活的流量调度,满足“护网行动”等紧急流量调度需求,提升了运维管理效率。

星融元提供的图形化管理界面

图3:星融元提供的图形化管理界面

相关文章

园区网络无线漫游的实现策略之分布式网关设计


关注星融元


什么是无线漫游?

无线漫游是指终端在不同AP覆盖范围之间移动且保持用户业务不中断的行为。

实现WLAN漫游的两个AP必须使用相同的SSID和安全模板(安全模板名称可以不同,但是安全模板下的配置必须相同),认证模板的认证方式和认证参数也要配置相同。

跨三层的无线漫游场景示意图

园区网络的无线漫游策略是为了解决什么问题?

在跨三层的无线漫游场景中,因为所在的IP子网发生了变化,终端不得不获取新的IP地址以适应新的网关,这势必会造成终端网络的断联。

  • 避免漫游过程中的认证时间过长导致丢包甚至业务中断。
  • 保证用户授权信息不变。
  • 保证用户IP地址不变。

传统的园区网络中最常见的无线漫游解决方案

方案1:尽可能将需要漫游的区域规划在一个二层网络里,由于同在一个子网,所以不需要再建立隧道去处理漫游后的数据报文流量,而是本地直接转发

方案2:通过在新旧网关之间建立隧道,把漫游后的终端流量通过隧道传输到原来的网关进行转发

方案1:同一子网下直接转发

AC只对AP进行管理,业务数据都是由本地直接转发

用户的数据报文到达AP后,不经过CAPWAP的隧道封装而直接转发到上层网络。AC只对AP进行管理,业务数据都是由本地直接转发
优势:数据流量不经过AC,AC负担小
问题:二层网络越大越不安全,这样的园区漫游有相当大的限制条件

方案2:建立capwap隧道转发

AC不但进行对AP管理,还是AP流量的转发中枢

业务数据报文由AP统一封装后到达AC实现转发,
AC不但进行对AP管理,还是AP流量的转发中枢。
用户的数据报文经过CAPWAP隧道封装后再由AC转发到上层网络。

优势:数据流和管理流全部经过AC,可以更容易对无线用户实施安全控制策略。
问题:复杂的配置和低效的流量转发路径。

转发模型特点
二层漫游直接转发由于二层漫游后漫游终端仍然在原来的子网中,所以漫游后接入的AP和AC对二层漫游用户的流量转发和平台新上线的用户没有区别,直接在本地完成直接网络转发,不需要通过隧道转发回原网关中转
二层漫游隧道转发由于二层漫游后漫游终端仍然在原来的子网中,所以漫游后接入的AP和AC对二层漫游用户的流量转发和平台新上线的用户没有区别,直接在本地完成直接网络转发,不需要通过隧道转发回原网关中转
三层漫游直接转发原AP和原AC之间的业务报文不通过CAPWAP隧道封装,无法判定他们是否在同一个子网内,此时设备默认报文需返回到原AP进行中转
三层漫游隧道转发原AP和原AC之间的业务报文通过CAPWAP隧道封装,此时可以将他们看作在同一个子网内,所以报文无需返回原AP,可直接通过原AC中转到上层网络

新一代云化园区:基于分布式的网关设计,高效实现园区无缝漫游

云化园区网络在全三层组网的基础上借鉴了云网中分布式网关的概念,即:在每一台接入交换机上运行统一的分布式网关,实现对上层业务无感知的终端无缝漫游。分布式网关的另一个好处是实现了终端(一般为服务器)通过网卡配置Bond双上行到不同的Leaf,无需堆叠和MC-LAG。

园区网络分布式的网关设计

  • 当移动终端发生漫游时,分布式网关的作用尤为重要,因为漫游后的接入Leaf上已经配置了网关信息,并且自动学习和同步了漫游终端的IP/MAC信息,因此漫游后的终端可以高性能的接入网络(所发信息无需再到一个“集中的网关”上去兜圈子),并且漫游过程中业务不断连(即确保不丢包,因为漫游后的接入Leaf上已经有了该漫游终端的所有信息);
  • 对于网络管理员来说,只需要在网络初始化时一次性配置好所有分布式网关的信息即可,无需在运行过程中动态调整,从而进一步降低运维的复杂度。

相关文章

新一代云化园区网络架构,根除网络广播风暴难题


关注星融元


广播风暴(broadcast storm)简单的讲是指当广播数据充斥网络无法处理,并占用大量网络带宽,导致正常业务不能运行,甚至彻底瘫痪,这就发生了“广播风暴”

当一个数据帧或包被传输到本地网段 (由广播域定义)上的每个节点就是广播;由于网络拓扑的设计和连接问题,或其他原因导致广播在网段内大量复制,传播数据帧,导致网络性能下降,甚至网络瘫痪。二层广播风暴问题会导致灾难性的网络故障。然而广播风暴的产生存在很多原因:

广播风暴产生的原因1:网段划分不合理

当网段划分不合理,很多设备处于同一个网段内,网络充斥了大量ARP、DHCP广播包,便很容易在园区二层域产生广播风暴,影响到正常的网络通信。

广播风暴产生的原因2:冗余设计造成的网络环路

交换机之间为了冗余、带宽提升或错误连接难免会产生一个封闭的物理环路;环路时,数据包会不断的重复传输,引发广播风暴。

广播风暴产生的原因2:网络病毒

一旦机器被感染依靠二层广播扩散的网络病毒,就会损耗大量的网络带宽,引发广播风暴。

广播风暴常见的解决方式

  1. 综合运用排除、替换和网线插拔等方法,一步一步地定位引发广播风暴的故障点,查出原因定向解决;
  2. 在交换机上开启广播风暴抑制功能(这需要交换机本身支持),避免因硬件损坏或链路故障导致的网络瘫痪;
  3. 在二层网络中应用破环技术,比如运行生成树协议(STP),通过一定的算法在逻辑上破坏网络中存在的环路
  4. 在局域网内部署防病毒服务器,并保持病毒库版本的实时更新。

新一代云化网络架构,极限压缩二层域避免广播风暴

借鉴云数据中心网络的发展经验,对园区网络进行云化改造是大家一致认同的解决方案。在星融元的云化园区网络解决方案下,我们选择用当前数据中心广泛应用的,极具扩展性的Spine-Leaf网络架构来搭建园区的全三层IP路由网络。

区别于传统园区的“接入-汇聚-核心”三层结构,在这种创新的全三层IP路由网络中,我们将L2的工作范围限制在接入终端和其所连接的接入层交换机端口之间。即在确保以太网能正常工作的前提下,最大限度地压缩L2区域,彻底消除以太网广播在网络中的传播,从而将广播带来的各种复杂度、脆弱性和安全风险彻底排除。

也就是说,每个接口就是一个广播域,终端之间二层隔离,因二层广播机制而产生的安全风险都将不复存在。

云化网络架构,极限压缩二层域避免广播风暴

避免使用生成树协议,释放交换机的大带宽能力

  • 利用Spine-leaf网络结构,星融元云化园区网络在物理上就是一个天然无环的网络,因此也不需要人为地阻塞掉一半的物理线路使其处于不工作状态,相较于同样规模的传统架构园区网络,无需浪费掉一半的线路资源,即,在同等线路带宽的投入下,云化园区网络可接入终端的数量是传统园区网络的一倍(或者,在同等接入终端数量的前提下,云化园区网络所需要投入的带宽资源是传统园区网络的一半);
  • 如前所述,借助IP协议的各种L3能力,无环的云化园区网络能够做到超大规模,网络中交换机的数量不再受STP的理论限制,几百台、上千台的交换机组成的云化园区网络能够接入几十万的终端,组建超大规模的园区网络;
  • 最后,当将网络中各种额外的复杂因素去除掉以后,整个网络的建设与运维难度都会大幅度降低,节省网络建设者的综合成本。

深入底层架构的全面变革,星融元发布云化园区网络解决方案


关注星融元


都在谈云化园区,你有多少受益其中?

园区网络正在逐步跨入万物互联的物联网时代,各类智能终端的爆炸式增长和数字经济下的创新应用对园区网络提出更严苛的要求。借鉴云数据中心网络的发展经验,对园区网络进行云化改造是大家一致认同的解决方案。

但是,市面常见云化方案思路多是围绕一个综合性的SDN控制器进行整个园区网络的建设——将原本很多复杂、繁琐的运维和部署工作集中在统一的控制器上,通过可视化Web界面完成整网的运维和部署。

这的确很大程度上简化了日常运维工作,不过变革还不够彻底——虽然对外呈现了一个光鲜亮丽的SDN控制器,但底层仍然是僵化、复杂、臃肿的传统网络架构。很多传统园区正在经历的麻烦事,例如复杂的安全策略增删、广播风暴定位、WIFI频繁掉线、网络扩容困难等等,在这般“云化”之后仍然存在,治标不治本。

传统云化园区网络与下一代园区网络的对比图

彻底的云化变革,将”精简“与“高效”根植于底层网络架构

星融元的园区网络云化思路侧重网络架构本身,针对复杂、臃肿的传统园区网络架构,我们用Spine-Leaf、Arp-to-Host、分布式网关等云数据中心领域先进的技术理念,对园区的底层网络架构进行了全面的变革。相较于传统组网方案,星融元的全三层横向扩展组网方案可降低园区建设运营成本40%以上。

星融元新一代云化园区解决方案架构图

01 效仿云网架构的物理网络

多级Spine-Leaf架构:破除网络性能瓶颈,网络更易扩展

传统园区网络的“接入-汇聚-核心”三层架构自下而上逐层收敛,层级越往上,设备性能要求越高。随着网络规模的不断扩展,整个网络的性能瓶颈将聚焦在核心交换机上。

在云计算和大数据旺盛的带宽需求驱动下,云数据中心网络早已转型为无阻塞的多级Clos结构(Leaf-Spine),而在当下万物互联的物联网时代,云化园区网络亦采用了早已成熟的多级Clos结构。

无阻塞的多级Clos结构(Leaf-Spine)

无阻塞的多级Clos结构(Leaf-Spine)

并且,随着园区规模的从小到大,这个多级的Clos网络能够从一级横向扩展至多级,使得网络能够接入的终端数量从几十个扩展到几十万个不等,并且,扩展的过程中原有的网络架构完全保持不变,新扩展的模块与原有模块架构完全一致,最大限度地降低了维护的复杂度。

多级CLOS架构下的园区规模扩展

多级CLOS架构下的园区规模扩展

全三层路由组网:压缩二层域,根除广播风暴

通过一系列技术手段,我们将二层广播域压缩至交换机的每一个物理端口。终端仅和其所连的接入层Leaf接口上的网关IP进行二层通信,网关负责完成后续的三层路由转发——这从根源上彻底阻断了二层广播风暴发生的可能性,也阻断了依赖二层通信的网络病毒的传播路径。

全三层组网

全三层组网

去堆叠/MC-LAG/STP:充分利用带宽,不增加运维难度

传统园区网络架构下,为避免网络环路引入了以生成树(STP)为代表的一系列防环协议,但其核心思想都是人为阻塞一部分端口,冗余下来的链路只能做闲置备份。虽然后来出现了堆叠、MC-LAG等新技术,但因技术原理复杂,给运维部门带来了额外的工作量和故障风险。

在星融元新一代云化园区网络下,多级CLOS架构是天然无环路的,配合轻量级的等价多路径路由(ECMP)机制,可以在保证最高链路利用率和最低复杂度的前提下实现组网高可靠。

CLOS架构天然无环路

CLOS架构天然无环路

02 更贴合业务的网络虚拟化

轻量级的路由隔离方案:轻松实现一网多用

在大规模的园区部署实践中,为了保证安全高效的网络环境,不同的业务类型或部门会有严格的网络隔离需求。传统的做法是通过ACL策略做访问控制,或者建立两张独立的物理网络,其代价就是巨大的配置和维护工作量,或者更高的建设成本。

在星融元的云化园区方案中,我们的思路是使用轻量级的虚拟路由转发(VRF)技术进行隔离,让多种业务可以复用一张物理网络。(对于超大规模、网络空间复杂且重叠的园区网络,也可以完全复制云网中主流的VXLAN技术方案)

一网多用

一网多用

接入层的分布式网关:更高效的无AC园区漫游

在跨三层的无线漫游场景中,因为所在的IP子网发生了变化,终端不得不获取新的IP地址以适应新的网关,这势必会造成终端网络断连。

传统园区网络一般是尽可能将需要漫游的区域规划在一个二层网络里,但二层网络越大越不安全;二是在新旧网关之间建立隧道,把漫游后的终端流量传输到原来的网关来转发,而这又导致复杂的配置和低效的流量转发路径,影响了漫游性能。

星融元云化园区网络在全三层组网的基础上借鉴了云网中分布式网关的概念,即:在每一台接入层交换机上都运行统一的分布式网关,并且自动学习和同步了漫游终端的IP/MAC信息。如此一来,终端漫游过程中既不会有业务断连,流量也无需到某个集中式网关上“兜圈子”。

园区网络分布式网关

分布式网关

03 软硬解耦的开放式网络

传统园区网络中各种私有的网络协议、沉重的机框设备搭载着封闭的网络操作系统、网络无法随着业务的发展进行灵活的调整。

星融元的云化园区网络是一个全面解耦的开放式网络,采用全盒式设备的精简组网模式,搭载以开源开放的SONiC为内核而设计的网络操作系统——AsterNOS

相关阅读:AsterNOS是一款怎样的网络操作系统?

  • 大容量全盒式单芯片交换机组网,高密度端口、高性能转发、端口类型丰富
  • AsterNOS提供容器化环境和丰富的可编程接口,助力网络功能二次开发,并可无缝对接网络控制器和云管平台

星融元的云化园区网络是一个全面解耦的开放式网络

相关产品一览

让用户从园区网络的云化转型中切实获益

园区使用者

  1. 上网更流畅、更稳定
  2. 跨楼层/楼栋移动,WiFi不掉线,体验类比4G/5G网络

园区网络工程师

  1. 除IP地址以外,同一层设备配置相同,开局自动部署上线,运维简单少背锅
  2. 网络环路、广播风暴以及复杂的STP/堆叠技术,统统不复存在

园区建设运营方

  1. 极简运维降低了运维技能要求和人才招聘难度
  2. 高可靠组网+100%带宽利用率,无广播风暴更省心
  3. 软硬解耦,自主可控,避免单一厂商锁定

相关文章

下一代园区网络,何必再有“堆叠”?


关注星融元


传统的园区网络中,企业和供应商多是使用盒式交换机和框式设备来构建网络。当他们意识到在某些情况下,框式设备过于昂贵而且不够灵活,各自独立的盒式交换机又不便于统一管理。于是,堆叠架构诞生了。

01 堆叠式架构,让人欢喜让人愁

交换机的堆叠架构自20世纪90年代提出,其部署价值有目共睹。

比如,简化管理。堆叠后的交换机可以被视为一个逻辑实体,具有统一的管理界面,简化了管理和操作。高可用性方面,堆叠系统可以将不同物理交换机的端口进行链路聚合,使得下行链路具备更高的带宽和弹性。堆叠系统在逻辑上虚拟成一台交换机,所以也不需要为避免产生环路而去人为阻塞线路。此外,可堆叠交换机给中小企业提供了一个成本更低的选择——既有与框式设备类似的可扩展性,但又能更灵活地按需付费。

不过,随着有线、无线和物联网设备的快速增长,这种架构在下一代的园区网络中逐渐暴露出不少缺点。下面这几点相信一线的运维人应该深有感触。

  • 厂商锁定。堆叠不是一个标准的协议,不同供应商的可堆叠交换机使用不同的电缆、连接器和软件,甚至同一供应商的不同交换机都不能混合使用。当堆叠中的交换机已经停止销售,但你却还需要进行扩展,那就必须整体更换。
  • 有限的扩展性和带宽。虽然我们能按需增加堆叠成员,但由于堆叠带宽的限制,大多数供应商限制了堆叠组内设备的数量。(有些供应商会提供双向的吞吐量数据,可能会让客户误以为拥有两倍于实际的堆叠带宽)
  • 堆叠分裂的风险。扩展或删除堆叠设备可能会导致服务中断,因为这个过程需要重新启动堆叠组下的所有设备。当故障或错误操作发生时,堆叠组可能分裂成2个或更多,导致业务受到影响。
  • 软件引起严重故障。运行堆叠技术会给交换机软件增加很多复杂性(例如堆叠组管理、分裂检测等)。在现实中,堆叠组内的多台设备高度关联,一损俱损,软件问题甚至可以导致整个堆叠组的瘫痪。
  • 物理拓扑结构受限。出于控制平面的时序要求和带宽的考虑,支持堆叠部署的交换机使用的是专有的电缆,这便把参与堆叠的交换机物理位置限制在了同一个机房甚至一个机柜内。

02 彻底抛弃堆叠方案,可行吗?

云计算发展的初始阶段,云计算网络架构是参照传统的园区网络来构建的。在市场需求和技术推动之下,云网络经历了20年的蜕变和升华——无论是整体网络架构还是在硬件设备、可扩展性、运维能力等方面,云网络都比传统网络更加先进。

如今星融元已将基于云的开放架构重新引入园区网。基于CLOS的Spine-Leaf架构保留了堆叠式架构的优点,同时也解决了其中的一些缺陷。

星融元的云化园区网络架构中,我们彻底的抛弃了堆叠方案,转而采用基于L3能力实现的一种可靠度更高、扩展性更强、但复杂度约等于零的方案。

堆叠架构对比园区Spine-Leaf架构

图1 堆叠架构对比Spine-Leaf架构

在这种方案下,不会有堆叠复杂的组网逻辑、纷繁的设备配置、脆弱的状态同步等机制——整个园区设备组网将如同一台具有成千上万个接入端口的超大型虚拟交换机,可以进行统一的运维管理

  • 接入终端并不需要为此方案做出任何调整,依然是通过两条(或多条)的线路、采用通用的Bond技术,上连到不同的接入Leaf;
  • 接入Leaf通过使用ARP学习、32位主机路由、BGP同步等功能,利用L3网络天然的高可靠、多路径能力,达到跟传统堆叠一样的效果;
  • 不涉及复杂的堆叠软件开发,因此系统的稳定性非常高,不会因为复杂的堆叠逻辑引入潜在的Bug;
  • 利用L3网络的ECMP负载分担能力,可以充分利用交换机之间的所有带宽传递报文,网络性能更高。
 堆叠式架构云化园区网络架构
部署1.堆叠电缆连接(或业务口连接+堆叠配置)
2.增强配置(分裂检测,负载均衡模式)
1. Spine层和Leaf层之间使用通用线缆连接
2.配置本机接口和peer信息
高可用性物理设备之间的链路聚合全三层网络,天然避免广播风暴和以太环路;运行BGP和ECMP;使用分布式网关设计
物理拓扑结构限制在一个房间或机柜内没有物理限制
管理堆叠组作为一台逻辑设备Spine-Leaf集群作为一台逻辑设备
软件升级需要堆叠组重启,有业务中断在不中断的情况下单独升级每个设备
扩展需要根据当前堆叠的网络拓扑结构进行设计(链形加入到两端,环形需要拆环)按照标准CLOS架构的扩展
接入可扩展性以48口交换机为例最大堆叠成员数为8
最大8 x 48 = 384个接入端口
[2层CLOS,48口交换机作为Spine]最大48 x 48 = 2304个接入端口
[3层CLOS,64口交换机作为3级CLOS的Spine]最大48 x 48 x 64 = 147456个接入端口

03 同样支持交换机“多虚一”,但配置更简单,扩展更灵活

在星融元的云化园区网络架构下,运维工程师仅需完成基础的网络连接和集群相关配置,即可建立起交换机集群。集群内的多台交换机也可虚拟成一台逻辑交换机——同层设备使用同一套配置文件模板,具有统一的管理界面,配置将自动同步到集群成员(与堆叠系统类似),新增设备仅需人工完成最基础的接线操作即可通过ZTP顺利上线。

园区网络优势:多台交换机虚拟成一台逻辑交换机

图2 多台交换机虚拟成一台逻辑交换机

在Spine-Leaf架构下,集群的规模可以非常大而不必担心堆叠带宽的问题。例如,在48口接入交换机的堆叠系统中,下行端口的最大数量是48×8(因为堆叠成员限制),但在星融元的云化园区网络架构中,这个数量可以很容易地扩展到48×48(Spine层也使用48口交换机),甚至在3层CLOS架构中是48x48x64(以64口交换机作为3级CLOS的Spine为例)。

园区网络:可扩展的多层CLOS架构
图3 可扩展的多层CLOS架构

04 同样实现高可靠,但网络更精简,带宽利用更充分

传统的园区网络为提高组网的可靠性并避免以太网环路和广播风暴等问题,部署了很多复杂的功能(如堆叠、MC-LAG、STP)。星融元的云化园区网络方案采用天然无环路的Spine-Leaf架构,全三层路由组网,全网链路基于ECMP多路径负载分担,在保证高链路利用率和低复杂度的前提下实现了组网的可靠性。

园区网络:全三层的组网

图4 全三层的组网

不仅仅是去堆叠,星融元云化园区网络解决方案还蕴含着多层次的创新点,从架构到建设到运维,我们基于开放云网理念和技术所带来的变革,都将帮助园区网络的拥有者和运营者架构极简、更可靠、更安全、更高性能的网络。

相关文章

对星融元产品感兴趣?

立即联系!

返回顶部

© 星融元数据技术(苏州)有限公司 苏ICP备17070048号-2