数据中心网络中一种基于ECN的TCP慢启动拥塞控制策略

黄家玮; 徐文茜; 胡晋彬; 王建新; 叶进

doi:10.3969/j.issn.1001-0548.2018.02.002

数据中心网络中一种基于ECN的TCP慢启动拥塞控制策略

doi: 10.3969/j.issn.1001-0548.2018.02.002

1.
中南大学信息科学与工程学院长沙 410083
2.
广西大学计算机与电子信息学院南宁 530004

基金项目:

国家自然科学基金 61572530

国家自然科学基金 61402541

国家自然科学基金 61462007

国家自然科学基金 61402542

湖南省普通高等学校教学改革研究项目 2016jy41

详细信息

作者简介:
黄家玮(1976-), 男, 博士, 教授, 主要从事计算机网络算法和协议优化方面的研究

中图分类号: TN97

An ECN-based Slow-Start of TCP Congestion Control in Data Center Networks

1.
School of Information Science and Engineering, Central South University Changsha 410083
2.
School of Computer, Electronics and Information, Guangxi University Nanning 530004

摘要: 在数据中心网络中，高带宽、低时延的链路和多对一的网络结构造成了TCP Incast吞吐率崩溃问题。现有的改进方法都关注于在TCP拥塞避免阶段改进其拥塞控制算法，而忽视了慢启动阶段中激进的指数增窗方式是造成Incast问题的关键原因。因此，该文提出了一种基于ECN的TCP慢启动拥塞控制策略（gentle slow sTart，GST），利用已有的拥塞标志位动态反馈缓存拥塞状况，以调节慢启动阶段的增窗速率。实验结果表明，该方法帮助现有的数据中心TCP协议有效地避免了并发传输中的吞吐率崩溃现象，将并发度和吞吐率分别提升了3.4倍和85倍。
- 数据中心网络 /
- 显式拥塞反馈 /
- 慢启动 /
- 传输控制协议
Abstract: TCP incast congestion happens in data center networks with high-bandwidth and low-latency, when multiple synchronized servers send data to a single receiver in parallel. The existing improved methods focus on the congestion control algorithm in the congestion avoidance phase, ignoring the aggressive exponential increasing window in the slow start phase that is a key reason for incast problem. Therefore, this paper proposes an ECN-based slow-start of transmission control protocol (TCP) congestion control strategy, which dynamically feedbacks congestion status by using the existing congestion flags to adjust the window-increasing speed during the slow start phase. Experimental results show that our approach helps the existing data center TCP effectively avoid the throughput collapse in concurrent transmissions. The number of concurrent flow and network throughput are increased by 3.4×and 85×, respectively.
- data center network /
- ECN /
- slow start /
- transmission control protocol
图 1 流大小分布图

下载: 全尺寸图片幻灯片

图 2 流完成时间分布图

下载: 全尺寸图片幻灯片

图 3 不同并发度吞吐量情况对比

下载: 全尺寸图片幻灯片

图 4 基础性能结果

下载: 全尺寸图片幻灯片

图 5 设计框架图

下载: 全尺寸图片幻灯片

图 6 不同的K值对吞吐率的影响

下载: 全尺寸图片幻灯片

图 7 G值变化图

下载: 全尺寸图片幻灯片

图 8 基础性能对比

下载: 全尺寸图片幻灯片

图 9 无背景流不同协议对比

下载: 全尺寸图片幻灯片

图 10 有背景流不同协议对比

下载: 全尺寸图片幻灯片

图 11 Web Search流量模型

下载: 全尺寸图片幻灯片

图 12 MapReduce流量模型

下载: 全尺寸图片幻灯片

[1]	MEISNER D, SADLER C M, BARROSO L A, et al. Power management of online data-intensive services[C]//Proceedings of ISCA. New York, USA: ACM, 2011: 319-330.
[2]	JUDD G. Attaining the promise and avoiding the pitfalls of TCP in the datacenter[C]//Proceedings of NSDI. Berkeley, USA: USENIX Press, 2015: 145-157.
[3]	REN Yong-mao, ZHAO Yu, LIU Pei, et al. A survey on TCP incast in data center networks[J]. International Journal of Communication Systems, 2014, 27(8):1160-1172. doi: 10.1002/dac.v27.8
[4]	LIU Fang-ming, GUO Jian, HUANG Xiao-meng. EBA: Efficient bandwidth guarantee under traffic variability in datacenters[C]//IEEE/ACM Transactions on Networking. Piscataway: IEEE, 2017, 25(1): 506-519.
[5]	MITTAL R, LAM V T, DUKKIPATI N, et al. TIMELY: RTT-based congestion control for the datacenter[C]//Proceedings of ACM SIGCOMM. New York, USA: ACM, 2015: 537-550.
[6]	LEE C, PARK C, JANG K, et al. Accurate Latency-based congestion feedback for datacenters[C]//Proceedings of USENIX ATC. Berkeley, USA: USENIX Press, 2015: 403-415.
[7]	WU Hai-tao, FENG Zhen-qian, GUO Chuan-xiong, et al. ICTCP: Incast congestion control for TCP in data center networks[C]//Proceedings of CoNEXT. New York, USA: ACM, 2010.
[8]	ALIZADEH M, GREENBERG A, MALTZ D A, et al. Data center TCP (DCTCP)[C]//Proceedings of ACM SIGCOMM. New York, USA: ACM, 2010: 63-74.
[9]	VAMANAN B, HASAN J, VIJAYKUMAR T N. Deadline-aware datadcenter TCP (D2TCP)[C]//Proceedings of ACM SIGCOMM. New York, USA: ACM, 2012: 115-126.
[10]	MUNIR A, QAZI I A, UZMI Z A, et al. Minimizing flow completion times in data centers[C]//Proceedings of INFOCOM. Piscataway, USA: IEEE, 2013: 2157-2165.
[11]	CHEN Yan-pei, GRIFFITH R, LIU Jun-da, et al. Understanding TCP incast throughput collapse in datacenter networks[C]//Proceedings of WREN Workshop. New York, USA: ACM, 2009: 73-82.
[12]	VASUDEVAN V, PHANISHAYEE A, SHAH H, et al. Safe and effective fine-grained TCP retransmissions for datacenter communication[C]//Proceedings of ACM SIGCOMM. New York, USA: ACM, 2009: 303-314.
[13]	ZHANG Jun, WEN Jiang-tao, WANG Jing-yuan, et al. TCP-FITDC: an adaptive approach to TCP incast avoidance for data center applications[C]//Proceedings of ICNC. Piscataway, USA: IEEE, 2013: 1048-1052.
[14]	BAI Wei, CHEN Kai, WU Hai-tao, et al. PAC: Taming TCP incast congestion using proactive ACK control[C]//Proceedings of ICNP. Piscataway, USA: IEEE, 2014: 385-396.
[15]	HUANG Jia-wei, HE Tian, HUANG Yi, et al. ARS: Cross-layer adaptive request scheduling to mitigate TCP incast in data center networks[C]//Proceedings of INFOCOM. Piscataway, USA: IEEE, 2016: 1-9.
[16]	SHUKLA S, CHAN S, TAM A S W, et al. TCP PLATO:Packet labelling to alleviate time-out[J]. IEEE Journal on Selected Areas in Communications, 2014, 32(1):65-76. doi: 10.1109/JSAC.2014.140107
[17]	CHENG Peng, REN Feng-yuan, SHU Ran, et al. Catch the whole lot in an action: Rapid precise packet loss notification in data centers[C]//Proceedings of USENIX NSDI. Berkeley, USA: USENIX Press, 2014: 17-28.
[18]	ZHANG Jiao, REN Feng-yuan, TANG Li, et al. Taming TCP incast throughput collapse in data center networks[C]//Proceedings of ICNP. Piscataway, USA: IEEE, 2013: 1-10.
[19]	SHAN Dan-feng, JIANG Wan-chun, REN Feng-yuan, et al. Absorbing micro-burst traffic by enhancing dynamic threshold policy of data center switches[C]//Proceedings of INFOCOM. Piscataway, USA: IEEE, 2015: 118-126.
[20]	BENSON T, AKELLA A, MALTZ D A. Network traffic characteristics of data centers in the wild[C]//Proceeding of IMC. New York, USA: ACM, 2010: 267-280.
[21]	BORTHAKUR D. The hadoop distributed file system: Architecture and design[EB/OL]. [2016-10-16]. https://svn.eu.apache.org/repos/asf/hadoop/common/tags/release-0.16.3/docs/hdfs_design.pdf.
[22]	KANDULA S, SENGUPTA S, GREENBERG A, et al. The nature of data center traffic: Measurements and analysis[C]//Proceedings of ACM SIGCOMM. New York, USA: ACM, 2009.
[23]	BAI W, CHEN L, CHEN K, et al. Enabling ECN in multi-service multi-queue data centers[C]//Proceedings of NSDI. Berkeley, USA: USENIX Press, 2016: 537-549.
[24]	CHEN Wen, REN Feng-yuan, XIE Jing, et al. Comprehensive understanding of TCP incast problem[C]//Proceedings of INFOCOM. Piscataway, USA: IEEE, 2015: 1688-1696.
[25]	XIA Yong, SUBRAMANIAN L, STOICA I, et al. One more bit is enough[C]//Proceedings of ACM SIGCOMM. New York, USA: ACM, 2005: 37-48.

[1]	孙健, 廖丹, 李可, 巩玉, 孙罡. 基于排队论的异构数据中心性能及能源管理策略 . 电子科技大学学报, 2018, 47(2): 161-168. doi: 10.3969/j.issn.1001-0548.2018.02.001
[2]	何怀文, 肖涛, 程东, 彭政, 傅瑜. 碳感知的绿色云数据中心能源优化在线算法 . 电子科技大学学报, 2018, 47(4): 550-557. doi: 10.3969/j.issn.1001-0548.2018.04.013
[3]	温怀玉, 霍伟东. 无线传感器网络流量重分配拥塞控制算法 . 电子科技大学学报, 2017, 46(2): 407-411. doi: 10.3969/j.issn.1001-0548.2017.02.015
[4]	何嘉, 彭商濂. 云数据中心虚拟机管理研究综述 . 电子科技大学学报, 2016, 45(1): 107-112. doi: 10.3969/j.issn.1001-0548.2016.01.018
[5]	于海征, 边红. 近地卫星网络的一致随机超图数据传输模型 . 电子科技大学学报, 2014, 43(4): 607-611. doi: 10.3969/j.issn.1001-0548.2014.04.024
[6]	王聪, 张凤荔, 刘梦娟, 王勇. IP网络坐标抖动感知与慢启动抑制 . 电子科技大学学报, 2012, 41(6): 921-926. doi: 10.3969/j.issn.1001-0548.2012.06.020
[7]	易发胜, 赵继东. 利用时延特性的模糊TCP拥塞控制算法 . 电子科技大学学报, 2010, 39(2): 260-265. doi: 10.3969/j.issn.1001-0548.2010.02.023
[8]	任超, 李战怀, 张英. 异构P2P网络的分布式查询协议 . 电子科技大学学报, 2009, 38(1): 108-112.
[9]	葛一楠, 周驰岷, 易勇. 高速TCP拥塞控制算法的公平性改进 . 电子科技大学学报, 2008, 37(2): 270-273.
[10]	王朝翔, 韦蓉, 丁炜. 带拥塞控制的多预约MAC协议 . 电子科技大学学报, 2008, 37(5): 765-768.
[11]	吴国纲. DDoS攻击与IP拥塞控制研究 . 电子科技大学学报, 2007, 36(3): 614-616,655.
[12]	包晓安, 徐伟强, 吴铁军. 一种用于Ad hoc网络的优化拥塞控制算法 . 电子科技大学学报, 2007, 36(2): 250-253.
[13]	王满喜, 胡向晖, 马刈非. 混合式的网络拥塞控制算法 . 电子科技大学学报, 2007, 36(3): 642-645.
[14]	陈翰林, 尚亚东, 刘希强. 正则化长波方程的显式精确解 . 电子科技大学学报, 2005, 34(5): 709-712.
[15]	何敏, 刘心松, 赵东风, 陈建英. 分布式并行无线令牌环接入控制协议 . 电子科技大学学报, 2005, 34(6): 813-816.
[16]	陈远, 李乐民. 缓存管理算法及其在无线网络中的应用研究 . 电子科技大学学报, 2004, 33(6): 755-758.
[17]	程劲, 罗克露. 基于异常的Anti SYN Flood实现 . 电子科技大学学报, 2003, 32(6): 701-705.
[18]	任立勇, 卢显良. Internet拥塞控制研究 . 电子科技大学学报, 2002, 31(1): 48-52.
[19]	詹柔莹. 网络传输层协议的随机Petri网模型及性能分析 . 电子科技大学学报, 2001, 30(1): 13-16.
[20]	刘煜, 蔡希尧. 面向网络的一种新分布式事务处理协议 . 电子科技大学学报, 1997, 26(2): 175-179.

点击查看大图

图(12)

计量

文章访问数: 4672
HTML全文浏览量: 1369
PDF下载量: 196
被引次数: 0

全文HTML

近年来，随着在线搜索、社交网络、电子商务等网络应用的飞速发展和普及，越来越多的在线应用系统被迁移到数据中心中，利用大规模的计算和存储资源为用户提供各种网络服务^[1]。为了保证应用请求的快速响应，数据中心网络(data center network, DCN)采用了高并发的网络传输^[2]。这样的同步并发流极易造成某些路径瞬时成为瓶颈，引起网络拥塞，导致TCP连接出现频繁丢包，最终出现TCP重传超时(retransmission time-out, RTO)。一旦TCP超时发生，新一轮的请求必须要等上一轮中经历超时的连接完成超时重传才会发出。此时，即使是一条TCP流超时带来的空等时间(一般在200 ms以上)都会造成传输链路空闲，导致TCP吞吐率严重崩溃^[3]。而且数据中心网络具有超高带宽^[4]、超低时延的特性，这与传统广域网有很大的差别，所以传统TCP在数据中心网络中的应用效果很差。

为了解决吞吐率崩溃问题，国内外学者做出了很多研究。其中基于延时的协议TIMELY^[5]、DX^[6]和ICTCP^[7]等都通过RTT的测量来检测拥塞以调节拥塞窗口。基于显式拥塞反馈(explicit congestion notification, ECN)的协议DCTCP^[8]、D²TCP^[9]和L²TCP^[10]等利用ECN更准确的反馈链路拥塞状态来调节发送速率。然而这些协议仅专注于对拥塞避免阶段的调窗算法改进，而忽略了由于慢启动的激进增窗导致在进入拥塞避免之前就出现了超时问题。

在分析数据中心网络中的流量发现，网络中传输流大部分是延时敏感的小数据流(90%小于100 KB)^[11]，而这些流很可能在慢启动阶段就完成传输。通过实验验证，DCTCP协议即使在并发度较小时，由于慢启动激进的指数增窗方式也会出现超时现象，这对小流的吞吐率影响极大。

本文提出了一种基于ECN的TCP慢启动拥塞控制策略GST来对TCP的慢启动阶段增窗算法进行调节改进，避免因为慢启动增长过快而导致进入拥塞避免之前出现超时现象。测试中分别在DCTCP、D²TCP和L²TCP协议上部署了GST，对比了使用和不使用GST反馈调节慢启动增窗的情况。测试结果表明，在使用了GST反馈调节慢启动增窗之后，能将并发度提升3.4倍，吞吐率提升85倍。

1. 相关工作

随着互联网应用变得高度多样化和复杂化，为了解决传统传输控制协议的不足，缓解数据中心网络中的TCP Incast现象^[12]，国内外许多学者在提高TCP对网络数据拥塞控制的调控能力方面做了大量研究，寻求一些稳定的方法让数量动态变化的网络用户能高效使用有限的网络带宽资源。

最普遍的方案就是基于RTT测量，利用RTT变化来反映当前链路拥塞情况，加速丢包恢复过程从而提高TCP吞吐量。TIMELY^[5]作为基于延时的协议，无需交换机支持，利用RTT测量信息来调整发送速率，以获得低延迟和高吞吐量。与TIMELY类似，DX^[6]使用端到端延迟来决定增减拥塞窗口，实现近零排队和高瓶颈链路利用率。但是数据中心网络的RTT很小，而且动态变化，精准测量成为改进的关键，直接影响协议性能。

基于经典RED队列管理算法，利用交换机ECN反馈来判断拥塞状态，可以准确地判断拥塞。DCTCP第一次全面讨论尾部延迟，实现了数据中心网络的高突发、低延迟、高吞吐率。但是，DCTCP协议即使当并发度较小时，交换机缓存依然会出现部分流拥塞丢包甚至超时。L²TCP针对减少短流的流完成时间，以分布式的方法在发送端实现LAS调度。TCP-FITDC^[13]是一种基于DCTCP的改进传输协议，通过RTT测量来进一步精确地估计链路拥塞程度，从而实现更准确的拥塞控制。

在接收端，ICTCP^[7]自适应地调整接收窗口以调节总吞吐量，从而缓解Incast拥塞。作为接收端驱动的拥塞控制方案，PAC^[14]主动地控制接收器侧的ACK的发送速率，以防止Incast拥塞。ARS^[15]是一种跨层设计，可缓解高度并发流下的TCP突发问题。ARS通过根据从传输层获取的端到端拥塞信号对应用请求进行批处理来动态调整并发TCP流的数量。

从交换机控制的角度，TCP-PLATO^[16]引入了一个标记系统，以确保标记包优先在交换机上排队。因此，TCP发送方可以利用重复的ACK来触发重传，而不是等待超时。CP^[17]为了保持TCP自时钟同步，简单地丢弃了包的数据字段而不是整个包，它需要快速和精确地检测丢失的数据包以通知发送端。GIP^[18]开始传输具有最小拥塞窗口大小的服务器请求单元以避免分组丢失，并且还冗余地传输服务器请求单元的最后分组以进一步减轻TCP超时。为了缓解由微突发流量造成的丢包，当端口变得过载时，EDT^[19]允许交换机的输出端口暂时占用所有共享交换机缓冲区。

以上方法的问题都在于着眼于拥塞避免阶段，并未考虑拥塞可能发生在更早的阶段。为了避免并发传输中慢启动阶段增窗过快而造成的吞吐率崩溃问题，本文旨在缓解慢启动阶段的增窗方式，利用ECN标记来动态调节慢启动阶段的拥塞控制算法。

5. 结束语

针对数据中心网络特点的研究，本文总结并发现数据中心网络中大部分都是小数据流，并具有并发度大的特点；而慢启动激进的指数增长方式是引发大量丢包产生超时的关键原因。针对现有研究都关注改进于拥塞避免阶段算法，而忽视了对慢启动阶段激进增长的问题，本文提出了一种基于ECN的TCP慢启动拥塞控制策略，动态反馈网络拥塞状况来缓解慢启动的增窗速率。实验表明，本方法有效避免了数据中心网络并发传输中由于慢启动阶段发送窗口增长过快导致的吞吐率崩溃现象，使得并发度提升了3.4倍，吞吐率倍数提升了85倍，大幅优化网络应用的整体性能。

参考文献 (25)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

数据中心网络中一种基于ECN的TCP慢启动拥塞控制策略

doi: 10.3969/j.issn.1001-0548.2018.02.002

作者简介:
黄家玮(1976-), 男, 博士, 教授, 主要从事计算机网络算法和协议优化方面的研究

An ECN-based Slow-Start of TCP Congestion Control in Data Center Networks

计量

数据中心网络中一种基于ECN的TCP慢启动拥塞控制策略

doi: 10.3969/j.issn.1001-0548.2018.02.002

1. 中南大学信息科学与工程学院长沙 410083

2. 广西大学计算机与电子信息学院南宁 530004

作者简介:
黄家玮(1976-), 男, 博士, 教授, 主要从事计算机网络算法和协议优化方面的研究

English Abstract

An ECN-based Slow-Start of TCP Congestion Control in Data Center Networks

1. School of Information Science and Engineering, Central South University Changsha 410083

2. School of Computer, Electronics and Information, Guangxi University Nanning 530004

全文HTML

2.1. 流大小分布

2.2. 高并发传输

2.3. 超时产生原因分析

2.4. 小结

3.1. 总体设计

3.2. 协议详细设计

3.2.1. 慢启动拥塞标记

3.2.2. 拥塞控制算法

3.3. K取值分析

4.1. 基础性能结果

4.2. 不同协议性能对比

4.3. 不同场景性能对比

目录

期刊在线

编辑办公

友情链接

留言板

数据中心网络中一种基于ECN的TCP慢启动拥塞控制策略

doi: 10.3969/j.issn.1001-0548.2018.02.002

作者简介: 黄家玮(1976-), 男, 博士, 教授, 主要从事计算机网络算法和协议优化方面的研究

An ECN-based Slow-Start of TCP Congestion Control in Data Center Networks

计量

出版历程

数据中心网络中一种基于ECN的TCP慢启动拥塞控制策略

doi: 10.3969/j.issn.1001-0548.2018.02.002

1. 中南大学信息科学与工程学院 长沙 410083 2. 广西大学计算机与电子信息学院 南宁 530004

作者简介: 黄家玮(1976-), 男, 博士, 教授, 主要从事计算机网络算法和协议优化方面的研究

English Abstract

An ECN-based Slow-Start of TCP Congestion Control in Data Center Networks

1. School of Information Science and Engineering, Central South University Changsha 410083 2. School of Computer, Electronics and Information, Guangxi University Nanning 530004

全文HTML

2.1. 流大小分布

2.2. 高并发传输

2.3. 超时产生原因分析

2.4. 小结

3.1. 总体设计

3.2. 协议详细设计

3.2.1. 慢启动拥塞标记

3.2.2. 拥塞控制算法

3.3. K取值分析

4.1. 基础性能结果

4.2. 不同协议性能对比

4.3. 不同场景性能对比

目录

期刊在线

编辑办公

友情链接

作者简介:
黄家玮(1976-), 男, 博士, 教授, 主要从事计算机网络算法和协议优化方面的研究

1. 中南大学信息科学与工程学院长沙 410083

2. 广西大学计算机与电子信息学院南宁 530004

作者简介:
黄家玮(1976-), 男, 博士, 教授, 主要从事计算机网络算法和协议优化方面的研究

1. School of Information Science and Engineering, Central South University Changsha 410083

2. School of Computer, Electronics and Information, Guangxi University Nanning 530004