基于强化学习的LTE与WiFi异构网络共存机制

林粤伟

doi:10.12178/1001-0548.2019303

基于强化学习的LTE与WiFi异构网络共存机制

doi: 10.12178/1001-0548.2019303

林粤伟^{1, 2,}

1.
青岛科技大学信息科学技术学院　山东青岛　266061
2.
海尔集团博士后工作站　山东青岛　266000

详细信息

作者简介:
林粤伟(1979 − )，男，博士，副教授，主要从事无线通信、嵌入式等方面的研究. E-mail：smgk@163.com

Coexistence Mechanism of LTE and WiFi Based on Reinforcement Learning in Heterogeneous Networks

LIN Yue-wei^{1, 2
,}

1.
College of Information Science and Technology, Qingdao University of Science and Technology　Shandong Qingdao　266061
2.
Postdoctoral Workstation of Haier Group　Shandong Qingdao　266000

摘要: 该文论述了5G异构无线网络中LTE-U与WiFi的共存机制，提出基于Q学习的LTE-U空白子帧配置机制(QL-ABS)。该机制使用排队论对LTE-U与WiFi共存的异构网络进行建模，使用网络时延性能表征Q学习的输入状态。仿真结果表明，通过自主学习过程，该机制可在多业务不同负载条件下为LTE-U产生较为合理的空白子帧配置策略，具有较好的在线学习性能。较传统方法，该机制更好地解决了LTE-U与现有WiFi网络在非授权频带的共存问题，提升了系统的时延和在线性能。
- 第五代移动通信 /
- LTE-U /
- 排队论 /
- 强化学习 /
- WiFi
Abstract: The coexistence mechanism of LTE-U (long term evolution - unlicensed) and WiFi in 5G heterogeneous wireless networks is discussed. Q learning based – almost blank subframe (QL-ABS) configuration mechanism is proposed for LTE-U. In the mechanism, the queuing theory is used to model the heterogeneous network where LTE-U and WiFi coexist, and the network delay performance is used to represent the input state of Q-learning. The simulation results show that the proposed mechanism can generate a more reasonable almost blank subframe configuration strategy for LTE-U under multiple services and different load conditions through autonomous learning process, and therefore has better online learning performance. Compared with the traditional methods, the proposed mechanism better solves the problem of coexistence between LTE-U and existing WiFi network in the unlicensed frequency bands, and improves the overall delay and online performances of the networks.
- 5G /
- LTE-U /
- queuing theory /
- reinforcement learning /
- WiFi

图 1 网络模型

下载: 全尺寸图片幻灯片

图 2 LTE-U与WiFi共存系统的M/G/1排队模型

下载: 全尺寸图片幻灯片

图 3 平均包时延性能分析

下载: 全尺寸图片幻灯片

图 4 不同用户数的平均包时延性能分析

下载: 全尺寸图片幻灯片

图 5 ABS配置与时延

下载: 全尺寸图片幻灯片

图 6 连续两天动态变化业务量

下载: 全尺寸图片幻灯片

图 7 QL-ABS算法在线性能

下载: 全尺寸图片幻灯片

表 1 仿真参数配置

参数	配置
分布式帧间间隔T_DIFS/μs	34
WiFi时隙/μs	9
竞争窗口大小CW_max	15
信道占用服务时间/ms(E(S_i,o)=1/μ_i,$ i\in \{l,w\} $)	0.9163
LTE-U用户数N_l	50, 100
WiFi用户数N_w	50, 100
空白子帧最大数目N	10
用户业务类型分布	VoIP 30%，视频流40%，FTP 30%
频段	5.8 GHz，带宽20 MHz

下载: 导出CSV

[1]	孙绍辉, 高秋彬, 杜滢, 等. 第5代移动通信系统的设计与标准化进展[J]. 北京邮电大学学报, 2018, 41(5): 26-43. SUN Shao-hui, GAO Qiu-bin, DU Ying, et al. Overview on the proceedings of design and standardization of the fifth generation of mobile communications system[J]. Journal of Beijing University of Posts and Telecomunications, 2018, 41(5): 26-43.
[2]	ZHANG R, ZHENG Z, WANG M, et al. Equivalent capacity in carrier aggregation-based LTE-a systems: A probabilistic analysis[J]. IEEE Transactions on Wireless Communications, 2014, 13(11): 6444-6460. doi: 10.1109/TWC.2014.2350496
[3]	3GPP Study Item. Study on licensed-assisted access using LTE: RP-141397[S/OL]. [2019-10-10]. https://www.3gpp.org/ftp/tsg_ran/TSG_RAN/TSGR_65/Docs/RP-141397.zip.
[4]	NIHTILA T, TYKHOMYROV V, ALANEN O, et al. System performance of LTE and IEEE 802.11 coexisting on a shared frequency band[C]//Proc IEEE Wireless Communication Networking Conference (WCNC). [S.l.]: IEEE, 2013, DOI: 10.1109/WCNC.2013.6554707.
[5]	EKTI A R, WANG A, ISMAIL X, et al. Joint user association and data-rate wireless networks[J]. IEEE Transactions on Vehicular Technology, 2016, 65(9): 7403-7414. doi: 10.1109/TVT.2015.2497658
[6]	XU S, LI Y, GAO Y, et al. Opportunistic coexistence of LTE and WiFi for future 5G system: Experimental performance evaluation and analysis[J]. IEEE Access, 2018, 6: 8725-8741. doi: 10.1109/ACCESS.2017.2787783
[7]	ZHANG Q, WANG Q, FENG Z, et al. Design and performance analysis of a fairness-based license-assisted access and resource scheduling scheme[J]. IEEE Journal on Selected Areas in Communications, 2016, 34(11): 2968-2980. doi: 10.1109/JSAC.2016.2614950
[8]	AL-DULAIMI A, AL-RUBAYE S, NI Q, ea al. 5G communications race: Pursuit of more capacity triggers LTE in unlicensed band[J]. IEEE Vehicular Technology Magazine, 2015, 10(1): 43-51. doi: 10.1109/MVT.2014.2380631
[9]	3GPP RAN1 Standard Contribution. Views on LAA for unlicensed spectrum – scenarios and initial evaluation results: RWS-140026[S/OL]. [2019-10-15]. https://www.3gpp.org/ftp/workshop/2014-06-13_LTE-U/Docs/RWS-140026.zip.
[10]	ALMEIDA E, CAVALCANTE A, PAIVA R, et al. Enabling LTE/WiFi coexistence by LTE blank subframe allocation[C]//Proceeding IEEE International Conference on Communication (ICC). [S.l.]: IEEE, 2013: 5083-5088.
[11]	3GPP RAN1 Standard Contribution. Cable Labs perspective on LTE-U Coexistence with Wi-Fi and operational modes for LTE-U: RWS-140004[S/OL]. [2019-10-18]. https://www.3gpp.org/ftp/workshop/2014-06-13_LTE-U/Docs/RWS-140004.zip.
[12]	CHAVES F, ALMEIDA E, VIEIRA R, et al. LTE UL power control for the improvement of LTE/Wi-Fi coexistence[C]//Proceeding IEEE Vehicle Technology Conference (VTC). [S.l.]: IEEE, 2013: 1-6.
[13]	ZHANG H, CHU X, GUO W, et al. Coexistence of Wi-Fi and heterogeneous small cell networks sharing unlicensed spectrum[J]. IEEE Communications Magazine, 2015, 53(3): 158-164. doi: 10.1109/MCOM.2015.7060498
[14]	SONG Y, SUNG K W, HAN Y. Impact of packet arrivals on Wi-Fi and cellular system sharing unlicensed spectrum[J]. IEEE Transactions on Vehicular Technology, 2016, 65(12): 10204-10208. doi: 10.1109/TVT.2016.2542267
[15]	LIU Y Y, YOO S J. Dynamic resource allocation using reinforcement learning for LTE-U and WiFi in the unlicensed spectrum[C]//the 9th International Conference on Ubiquitous and Future Networks (ICUFN). Milan: [s.n.], 2017: 471-475.
[16]	CHATTERJEE S, ABDEL-RAHMAN M J, MACKENZIE A B. Optimal distributed allocation of almost blank subframes for LTE/WiFi coexistence[C]//the15th International Symposium on Modeling and Optimization in Mobile, Ad Hoc, and Wireless Networks (WiOpt). Paris: [s.n.], 2017: 1-6.
[17]	RUPASINGHE N, GUVENC I. Reinforcement learning for licensed-assisted access of LTE in the unlicensed spectrum[C]//Wireless Communications & Networking Conference. New Orleans: IEEE, 2015: 1279-1284.
[18]	GUO Z, ZHANG Q, FENG Z, et al. Traffic load based adaptive almost blank subframe optimization in LTE-U and WiFi coexisted systems[C]//IEEE International Conference on Communications in China (ICCC Workshop). [S.l.]: IEEE, 2018, DOI: 10.1109/ICCChinaW.2018.8674483.
[19]	RGP Project. Policy and charging control architecture[EB/OL]. [2019-11-01]. http://www.arib.or.jp/english/html/overview/doc/STD-T63V12_10/2_T63/ARIB-STD-T63/Rel13/23/A23203-d80.pdf.

[1]	胡浪涛, 杨瑞, 刘全金, 吴建岚, 嵇文, 吴磊. 深度强化学习下连续和离散相位RIS毫米波通信 . 电子科技大学学报, 2024, 53(1): 50-59. doi: 10.12178/1001-0548.2022285
[2]	翟社平, 李航, 亢鑫年, 杨锐. 融合强化学习的实体关系联合抽取模型 . 电子科技大学学报, 2024, 53(2): 243-251. doi: 10.12178/1001-0548.2023107
[3]	朱献超, 侯晓凯, 吴绍君, 祝峰. 基于情景记忆的量子深度强化学习 . 电子科技大学学报, 2022, 51(2): 170-175. doi: 10.12178/1001-0548.2022043
[4]	胡浪涛, 毕松姣, 刘全金, 吴建岚, 杨瑞. 基于深度强化学习的多小区NOMA能效优化功率分配算法 . 电子科技大学学报, 2022, 51(3): 384-391. doi: 10.12178/1001-0548.2021193
[5]	罗欣, 陈艳阳, 耿昊天, 许文波, 张民. 基于深度强化学习的文本实体关系抽取方法 . 电子科技大学学报, 2022, 51(1): 91-99. doi: 10.12178/1001-0548.2021162
[6]	高远翔, 罗龙, 孙罡. 基于强化学习的多阶段网络分组路由方法 . 电子科技大学学报, 2022, 51(2): 200-206. doi: 10.12178/1001-0548.2021260
[7]	李新民, 尹宝林, 魏李莉, 张晓强. 强化学习无人机通信系统中的信息年龄优化 . 电子科技大学学报, 2022, 51(2): 213-218. doi: 10.12178/1001-0548.2021128
[8]	张凤荔, 赵佳君, 刘东, 王瑞锦. 基于深度强化学习的边云协同串行任务卸载算法 . 电子科技大学学报, 2021, 50(3): 398-404. doi: 10.12178/1001-0548.2021015
[9]	鲁华祥, 尹世远, 龚国良, 刘毅, 陈刚. 基于深度确定性策略梯度的粒子群算法 . 电子科技大学学报, 2021, 50(2): 199-206. doi: 10.12178/1001-0548.2020420
[10]	叶进, 肖庆宇, 陈梓晗, 陈贵豪, 李陶深. 以用户QoE预测值为奖励的视频自适应比特率算法 . 电子科技大学学报, 2021, 50(2): 236-242. doi: 10.12178/1001-0548.2020325
[11]	秦爽, 赵冠群, 冯钢. 基于多智体强化学习的接入网络切片动态切换 . 电子科技大学学报, 2020, 49(2): 162-168. doi: 10.12178/1001-0548.2020049
[12]	吴佳, 陈森朋, 陈修云, 周瑞. 基于强化学习的模型选择和超参数优化 . 电子科技大学学报, 2020, 49(2): 255-261. doi: 10.12178/1001-0548.2018279
[13]	谭俊杰, 梁应敞. 面向智能通信的深度强化学习方法 . 电子科技大学学报, 2020, 49(2): 169-181. doi: 10.12178/1001-0548.2020040
[14]	黄庆东, 石斌宇, 郭民鹏, 袁润芝, 陈晨. 基于Q-learning的分布式自适应拓扑稳定性算法 . 电子科技大学学报, 2020, 49(2): 262-268. doi: 10.12178/1001-0548.2019076
[15]	史豪斌, 徐梦. 基于强化学习的旋翼无人机智能追踪方法 . 电子科技大学学报, 2019, 48(4): 553-559. doi: 10.3969/j.issn.1001-0548.2019.04.012
[16]	王维博, 孙敬欢, 董蕊莹, 郑永康. 基于小样本的高精度室内停车场指纹定位算法 . 电子科技大学学报, 2019, 48(1): 32-38. doi: 10.3969/j.issn.1001-0548.2019.01.006
[17]	孙健, 廖丹, 李可, 巩玉, 孙罡. 基于排队论的异构数据中心性能及能源管理策略 . 电子科技大学学报, 2018, 47(2): 161-168. doi: 10.3969/j.issn.1001-0548.2018.02.001
[18]	黎海涛, 齐双. 基于室内地图环境信息的多楼层WiFi定位技术研究 . 电子科技大学学报, 2017, 46(1): 32-37. doi: 10.3969/j.issn.1001-0548.2017.01.006
[19]	周瑞, 袁兴中, 黄一鸣. 基于卡尔曼滤波的WiFi-PDR融合室内定位 . 电子科技大学学报, 2016, 45(3): 399-404. doi: 10.3969/j.issn.1001-0548.2016.02.015
[20]	向中凡. Q学习角色值法在机器人足球比赛中的应用 . 电子科技大学学报, 2007, 36(4): 809-812.

点击查看大图

图(7) / 表(1)

计量

文章访问数: 4937
HTML全文浏览量: 1504
PDF下载量: 60
被引次数: 0

全文HTML

随着无线通信技术的发展，LTE、5G、WiFi等技术方兴未艾，8K视频、VR、AR等新颖的高吞吐率、低时延业务需要更大的频谱带宽支持。现有频谱资源分为授权和非授权频带，仅仅依靠授权频带已无法充分保证未来4.5G、5G高吞吐量业务的带宽QoS要求^[1]。载波聚合(carrier aggregation, CA)或频谱聚合是LTE-Advanced标准R10的一个重要特性，通过将多个连续或非连续的载波(频谱)聚合成更大的带宽(最大100 MHz)，能够实现在100 MHz的带宽内，提供下行1 Gbit/s、上行500 Mbit/s的速率^[2]。LTE早期只专注于授权频段的聚合，在4.5G、5G研究领域，聚焦于授权与非授权频段的频谱聚合技术也被提出并得到广泛研究，其中将LTE部署在非授权频段的技术称为LTE-U(unlicensed)^[3-4]，使用的是低于6 GHz的非授权频段。毫米波频段(如60 GHz)不在LTE-U的研究范围内，有专门的技术对LTE在毫米波频段部署进行研究^[5]。

LTE-U使用的6 GHz以内的非授权频段主要指2.4 GHz和5.8 GHz两个频段，在这两个频段已经部署有WiFi、蓝牙、雷达等无线通信系统，LTE-U作为后来者，需要解决好LTE与现有无线通信网络(尤其是WiFi网络)之间的共存与干扰问题。主要有两种技术来解决非授权频段中的已有无线通信系统与LTE-U的共存干扰问题，分别是：基于listen-before-talk(LBT)^[6-7]和不基于LBT(non-LBT)^[8]的两类技术。LBT类似于WiFi的(carrier sense multiple access) CSMA/CA(载波侦听多址接入/冲突回避)多址接入协议，采用基于竞争的接入策略。LTE-U在发送数据前需要先探测信道是否空闲以决定是否接入，以降低LTE-U与WiFi的冲突概率。文献[9]使用基于LBT的方法处理多个RAT之间和RAT内部由于LTE-U与WiFi共存带来的干扰问题。在美国、中国、韩国、印度等国家，并没有强制要求LTE-U必须实现LBT机制，并且在LBT机制下两种无线通信系统都要检测信道，频谱利用率降低。non-LBT机制中，LTE-U会周期性地静默一段时间，在该段时间内不发送或几乎不发送数据，从而使WiFi有更多机会发送数据。

文献[10-11]基于non-LBT方法处理了LTE-U和WiFi系统间的共存与干扰问题。文献[10-12]分别使用了基于空白子帧、duty-cycle、上行链路功率控制的方法，都没有触及ABS空白子帧的比例问题。基于几乎空白子帧(almost blank subframe, ABS)(下面简称空白子帧)的方法是一种典型的non-LBT的LTE-U与WiFi在非授权频段的共存机制，该机制最为重要的是如何确定空白子帧所占无线帧的比例，以确保系统的公平性和性能。文献[13]使用频谱侦听的方法对一定区域内WiFi AP的数目进行估算，进而提出了一种根据LTE基站周围WiFi热点的强度调整空白子帧数目的方法。文献[14]基于排队论模型研究了数据包的到达对LTE-U和WiFi的平均数据包时延的影响，但没有提出具体的异构网络共存机制，只是为WiFi和LTE-U的共存提供了一个指导准则。文献[15-16]研究了如何决定ABS空白子帧的比例以确保公平性，但是没有考虑无线网络的业务量负载情况。文献[17]考虑了业务量负载情况，但只研究了单一的业务(FTP)和吞吐量QoS指标，没有考虑多业务场景和时延等技术指标。

本文针对基于ABS空白子帧的LTE-U小基站(small BS/SBS)与WiFi AP共存的场景，提出了基于强化学习算法的智能化LTE-U与WiFi的共存机制，考虑了无线网络的业务量负载情况，能够提高不同无线网络的时延性能，进而提高系统的用户满意度。较已有的动态配置ABS空白子帧的算法，提出的基于强化学习的QL-ABS算法能够较好地利用以往学习经验(具有更好的在线性能)，后续决策可以利用先前学到的经验，从而做出更为合理的配置决策，提升系统的时延、在线性能及用户满意度。

4. 结束语

本文提出基于Q学习的LTE-U的空白子帧配置机制，使用排队论对LTE-U与WiFi共存的5G异构网络进行建模。仿真结果表明，通过自主学习过程，本算法可在不同的负载条件下为LTE-U产生较为合理的空白子帧配置策略，具有较好的在线学习性能。较传统方法，本机制更好地解决了5G异构网络中LTE-U与现有WiFi网络在非授权频带的共存问题，提升了网络的总体时延性能和用户满意度，具有更好的在线性能。在未来的工作中，将把所提出的方案扩展到更为复杂的多个LTE-U SBS和WiFi AP共存的场景。

本文研究工作得到泛网无线通信教育部重点实验室(北京邮电大学)开放课题(KFKT-2018107)的资助，在此表示感谢！

参考文献 (19)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于强化学习的LTE与WiFi异构网络共存机制

doi: 10.12178/1001-0548.2019303

作者简介:
林粤伟(1979 − )，男，博士，副教授，主要从事无线通信、嵌入式等方面的研究. E-mail：smgk@163.com

Coexistence Mechanism of LTE and WiFi Based on Reinforcement Learning in Heterogeneous Networks

计量

基于强化学习的LTE与WiFi异构网络共存机制

doi: 10.12178/1001-0548.2019303

1. 青岛科技大学信息科学技术学院　山东青岛　266061

2. 海尔集团博士后工作站　山东青岛　266000

作者简介:
林粤伟(1979 − )，男，博士，副教授，主要从事无线通信、嵌入式等方面的研究. E-mail：smgk@163.com

English Abstract

Coexistence Mechanism of LTE and WiFi Based on Reinforcement Learning in Heterogeneous Networks

1. College of Information Science and Technology, Qingdao University of Science and Technology　Shandong Qingdao　266061

2. Postdoctoral Workstation of Haier Group　Shandong Qingdao　266000

全文HTML

目录

期刊在线

编辑办公

友情链接

留言板

基于强化学习的LTE与WiFi异构网络共存机制

doi: 10.12178/1001-0548.2019303

作者简介: 林粤伟(1979 − )，男，博士，副教授，主要从事无线通信、嵌入式等方面的研究. E-mail：smgk@163.com

Coexistence Mechanism of LTE and WiFi Based on Reinforcement Learning in Heterogeneous Networks

计量

出版历程

基于强化学习的LTE与WiFi异构网络共存机制

doi: 10.12178/1001-0548.2019303

1. 青岛科技大学信息科学技术学院 山东 青岛 266061 2. 海尔集团博士后工作站 山东 青岛 266000

作者简介: 林粤伟(1979 − )，男，博士，副教授，主要从事无线通信、嵌入式等方面的研究. E-mail：smgk@163.com

English Abstract

Coexistence Mechanism of LTE and WiFi Based on Reinforcement Learning in Heterogeneous Networks

1. College of Information Science and Technology, Qingdao University of Science and Technology Shandong Qingdao 266061 2. Postdoctoral Workstation of Haier Group Shandong Qingdao 266000

全文HTML

目录

期刊在线

编辑办公

友情链接

作者简介:
林粤伟(1979 − )，男，博士，副教授，主要从事无线通信、嵌入式等方面的研究. E-mail：smgk@163.com

1. 青岛科技大学信息科学技术学院　山东青岛　266061

2. 海尔集团博士后工作站　山东青岛　266000

作者简介:
林粤伟(1979 − )，男，博士，副教授，主要从事无线通信、嵌入式等方面的研究. E-mail：smgk@163.com

1. College of Information Science and Technology, Qingdao University of Science and Technology　Shandong Qingdao　266061

2. Postdoctoral Workstation of Haier Group　Shandong Qingdao　266000