网络时延
网络时延是指一个报文或分组从网络的一端传送到另一端所耗费的时间,好比如,快递从广东发出寄到成都需要3天,那么时延就等于3天,时延的高低决定了报文(快递)从一端到另一端的时间,时延越低意味着效率越高。其中时延由节点处理时延、排队时延、发送时延、传播时延四个部分组成。
- 处理时延,是指交换机、路由器等网络设备在收到报文后需要进行处理花费的时间。处理时延往往取决于交换机/路由器性能。
- 排队时延,是指路由器或交换机等网络设备处理数据包排队所消耗的时间,排队时延主要取决于当前队列中是否有其它报文在传输。
- 发送时延,是指从发送数据帧的第一个比特算起,到该帧的最后一个比特发送完毕所需的时间,发送时延即数据包长度/发送速率(信道宽度),所以发送时延与数据包长度成正比,与发送速率成反比。
- 传播时延,是指报文在实际的物理链路上传播数据所需要的时间,传播时延主要取决于信道长度(传播的距离)。
网络时延的重要性
随着数字化和数字化转型的不断推进,我们日常工作、生活中不断的出现新的应用场景,比如:人工智能、大数据、区块链、无人驾驶、边缘计算,5G通信等,新的场景带来更多的终端设备的入网,这就对我们的数据中心提出了更多的挑战。大量终端的入网伴随着海量信息的涌入,数据中心在要求大带宽的同时又关注网络的时延,旨在大带宽低时延的同时具备更高的性价比,来满足用户端良好的网络体验。
例如:过年抢火车票,有人家里装了100M/1000M的带宽或者使用了5G手机,就更容易抢到,因为骨干网上速度都差不多,但最后到个人用户网络那里时延就因网而异,响应速度快就更可能比别人先抢到火车票。
而在很多行业,降低时延就意味着增加收入,谷歌搜索产品和用户体验副总裁提到,0.5秒钟的时延就会造成流量和广告收入减少20%。同样对于电商平台来说,十分之一秒的时延就能导致亚马逊的销售额降低1%。
对于金融行业而言,时延的经济价值最为明显,1秒钟,它可以有翻天覆地改变,在电影《蜂鸟计划》的主人公为了1毫秒的领先,要在两个证券交易所之间修一条1000英里长、直径4英寸的“笔直”光纤,而这领先的每1毫秒将带来的是数百万美元盈利。
“时间就是金钱”这句谚语在高频交易业务中充分显示的其现实意义,早在 2007年,Information Week杂志在一篇题为《Wall Street‘s Quest To Process Data At The Speed Of Light 》的报道中,就提到在美国电子金融交易市场,1ms的时延优势的价值是1亿美元。目前,低时延是全球金融行业的共同追求,谁掌握了速度,谁就站上了这个行业的金字塔,所以对于服务时延敏感的业务需要做到毫秒必争,在满足业务时延需求的同时提高产品性价比,最大程度的降低数据中心网络时延提高数据中心竞争能力。
低时延网络需求的业务有哪些
早期低延时网络方案中,InfiniBand 提供比以太网更好的延迟和带宽成为当时用户唯一选择,但是InfiniBand方案目前因为种种原因面临的供货周期长、售后服务差、性价比差等等问题,极大的阻碍了用户业务的发展。如今该行业已经完成以太网方面的转型期,Inifiband是专有的InfiniBand网络,而RoCE则是基于IP网络,目前90%的网络都是基于IP网络架构设计,相关技术更加成熟,随着技术的发展RoCE业界标准更加统一,技术更加完善和成熟,在低延时网络场景中被用户接受并部署。
目前根据行业发展需求来看对低时延网络需求的业务大致分为以下四类:
- 第一是金融和电子交易类用户,金融衍生物分析、保险精算分析、资产负债管理、投资风险分析,特别是大家耳熟能详从事期货等产品高频交易的电子交易类用户;
- 第二是数字娱乐多媒体类业务,包括4K/8K高清视频直播和点播业务、在线游戏、以及未来的虚拟现实(VR)等实时性要求极高的大带宽业务;
- 第三是部分云业务,譬如实时性要求比较高的云桌面、云支付等业务;
- 第四部分,如:科研院所的生命科学、高精度天气预报、地球科学以及汽车设计/碰撞模拟、航空航天、船舶的设计单位的计算机辅助工程,等等,对网络时延指标非常苛刻,需要一些低时延网络设备和技术加以保障。
低时延场景的组网方案
金融/证券类业务对低时延的极致需求
信息不对称是交易盈利的不二法则,时延越低,意味着你的信息比别人快,你的订单比别人先到达交易中心,你也就越容易盈利。高频交易(HFT: High Frequency Trading)或称为机器交易、算法交易已经兴起多年,交易品涵盖了期货、股票、外汇等多个领域,为了争取千分之一秒的优势,证券公司甚至还将数据中心安置在交易所附近或同一座建筑里,来满足金融企业特别是有高频交易(HFT)需求的客户对超低时延、高安全等级的网络连接需求。
数字娱乐多媒体类业务的高吞吐低时延需求
TCP协议已经成为Internet主流,TCP的确认机制保证了可靠性,但也带来了吞吐量受限的问题。TCP吞吐量受限于三个因素,带宽BW、往返时延RTT和丢包率ρ。假设带宽足够,且良好的网络质量可以不考虑丢包率,则时延成为决定性因素。如果时延过大,客户体验带宽无法提升,此时仅提高带宽无法解决问题,形象的称之为“网络带宽黑洞”。
实时性云业务的低时延需求
云计算、大数据、物联网等发展趋势使得越来越多的业务运行在云上,云已经成为通信网络无法回避的趋势,而作为云的物理载体——数据中心逐渐成为网络流量的核心。随着越来越多的上层业务迁移到云上,为了满足用户体验,同样也会对云承载网络提出严格的时延需求,例如云支付业务的最佳体验需要时延低于10ms、云桌面业务的最佳体验需要时延低于20ms,等等。
科研院/设计单位所对低时延网络需求
科研院所是科学研究和技术开发的基地,主要从事探索性、创造性科学研究活动,是实施创新驱动发展战略、建设创新型国家的重要力量。在科研院所/设计单位中经常使用超级计算机来解决和处理极其复杂的计算问题,简称HPC。
HPC各计算节点在计算过程中有频繁的通讯需求为了避免CPU等待数据进行计算的情况,因此需要低时延高带宽的网络来连接大量的计算节点间的数据传输,提升计算效率。2020 年以来,十四五和新基建驱动我国高性能计算中心建设进入高速增长期,多地地方政府和企事业单位都在积极建设和筹建高性能计算中心。
综上所述,随着电子交易、高清视频、云计算和HPC等业务的发展,时延已经成为通信网络的重要性能指标,低时延也将成为未来数据中心网络能力竞争的重要手段。在InfiniBand方案问题频发的背景下,如何建设云时代下符合未来发展且具有低时延核心竞争力的云数据中心,是我们需要思考的重要问题。
HPC解决方案