基于个性化联邦学习的无线通信流量预测

林尚静; 马冀; 李月颖; 庄琲; 李铁; 李子怡; 田锦

doi:10.12178/1001-0548.2022102

基于个性化联邦学习的无线通信流量预测

doi: 10.12178/1001-0548.2022102

林尚静^1, ,,
马冀²,
李月颖¹,
庄琲¹,
李铁¹,
李子怡¹,
田锦²

1.
北京邮电大学安全生产智能监控北京市重点实验室　北京海淀区　100876
2.
金陵科技学院网络与通信工程学院　南京　211169

基金项目: 国家重点研发计划(2019YFC1511400)；中央高校基本科研业务费(2021RC07)；泛网无线通信教育部重点实验室开放基金(KFKT-2020102)

详细信息

作者简介:
林尚静(1986 − )，女，博士生，主要从事深度学习、分布式计算及边缘计算等方面的研究

通讯作者: 林尚静，E-mail： linshangjing@bupt.edu.cn

中图分类号: TN92

Citywide Wireless Traffic Prediction Based on Personalized Federated Learning

1.
Beijing Key Laboratory of Work Safety Intelligent Monitoring, Beijing University of Posts and Telecommunications　Haidian Beijing　100876
2.
School of Network and Communication Engineering, Jinling Institute of Technology　Nanjing　211169

摘要: 提出一种基于分布式的城市全域通信流量预测算法Fed-DenseNet，各个边缘计算服务器在中心服务器的协调下进行协同训练，中心服务器利用KL散度挑选出流量分布相似的区域流量模型，并采用联邦平均算法对具有相似流量分布的区域流量模型的参数进行融合，以较低的复杂度和通信开销实现城市全域流量预测。此外，城市范围内不同地区流量具有高度差异化的特征，为此，在Fed-DenseNet算法基础上，提出基于合作博弈的个性化联邦学习算法p-Fed-DenseNet，将本地区的各个区域性数据特征作为合作博弈的参与者，通过合作博弈的超可加性准则，进行本地区特征的筛选，从而达到既能提高模型的泛化性，又能够保持对本地流量精准刻画的目的。
- 云边协同 /
- 合作博弈 /
- 联邦学习 /
- 时空依赖性 /
- 无线流量预测
Abstract: Wireless communication network traffic prediction is of great significance to operators in network construction, base station wireless resource management and user experience improvement. However, the existing centralized algorithm models face the problems of complexity and timeliness, thus difficult to meet the traffic prediction of the whole city scale. A distributed urban global traffic prediction algorithm Fed-DenseNet is proposed in this paper. Each edge computing server of the algorithm performs collaborative training under the coordination of the central server, and the central server uses KL (Kullback-Leibler) divergence to select regional traffic models with similar traffic distribution and uses the federated average algorithm to fuse the parameters of these regional traffic models. In this way, the urban global traffic prediction can be realized with lower complexity and communication cost. In addition, the traffic in different areas within the city is highly differentiated, so how to improve the accuracy of model prediction is also facing challenges. Based on Fed-Densenet algorithm, a personalized federated learning algorithm p-Fed-DenseNet based on cooperative game is proposed. Each regional data feature in the region is taken as a participant of cooperative game, and local features are screened by the super-additivity criterion of cooperative game, so as to achieve the purpose of both improving the generalization of the model and maintaining the accurate description of local traffic.
- cloud-edge collaboration /
- coalitional game /
- federated learning /
- spatio-temporal dependence /
- wireless traffic prediction

图 1 短消息业务流量在时空维度上的相关性

下载: 全尺寸图片幻灯片

图 2 短消息业务流量的分布

下载: 全尺寸图片幻灯片

图 3 基于个性化联邦学习的全域流量预测模型p-Fed-DenseNet形成过程

下载: 全尺寸图片幻灯片

图 4 米兰市区域信息

下载: 全尺寸图片幻灯片

图 5 预测效果对比

下载: 全尺寸图片幻灯片

图 6 不同模型短消息业务流量误差对比

下载: 全尺寸图片幻灯片

图 7 短消息业务流量真实值和预测值对比

下载: 全尺寸图片幻灯片

表 1 不同本地化特征组合下个性化联邦学习模型预测误差(RMSE)

本地特征类型	市区区域7	市区区域8	市区区域9	市区区域12	市区区域17
无	9.69	9.84	7.11	30.84	15.03
工作日/节假日	9.88	10.23	7.01	29.17	14.35
天气	9.48	9.85	7.02	29.01	14.35
基站密度	9.45	9.87	6.96	28.34	14.21
天气+基站密度	9.44	10.06	7.05	28.7	14.22
工作日/节假日+天气	9.90	10.24	7.08	29.35	14.39
工作日/节假日+基站密度	9.99	10.21	7.16	28.87	14.10
工作日/节假日+天气+基站密度	9.93	10.13	7.15	29.01	14.22

下载: 导出CSV

[1]	张杰, 白光伟, 沙鑫磊, 等. 基于时空特征的移动网络流量预测模型[J]. 计算机科学, 2019, 46(12): 108-113. doi: 10.11896/jsjkx.181102207 ZHANG J, BAI G W, SHA X L, et al. Mobile traffic forecasting model based on spatio-temporal features[J]. Computer Science, 2019, 46(12): 108-113. doi: 10.11896/jsjkx.181102207
[2]	WANG K, MA C, QIAN Y, et al. A hybrid deep learning model with 1DCNN-LSTM-Attention networks for short-term traffic flow prediction[J]. Physica A: Statistical Mechanics and Its Applications, 2021, 583(12):
[3]	张家晨, 左兴权, 黄海, 等. Prophet混合模型应用于基站网络流量长期预测[J]. 计算机工程与应用, 2022, 58(14): 80-88. doi: 10.3778/j.issn.1002-8331.2102-0111 ZHANG J C, ZUO X Q, HUANG H, et al. Application of prophet mixture model on long-term prediction of base station cell network traffic[J]. Computer Engineering and Applications, 2022, 58(14): 80-88. doi: 10.3778/j.issn.1002-8331.2102-0111
[4]	朱江, 潘成胜, 孔志翔, 等. 基于Prophet融合MGF提取的网络流量预测[J]. 计算机仿真, 2021, 38(7): 475-480. doi: 10.3969/j.issn.1006-9348.2021.07.100 ZHU J, PAN C S, KONG Z X, et al. Network traffic prediction based on prophet fusion muti-grain feature extraction[J]. Computer Simulation, 2021, 38(7): 475-480. doi: 10.3969/j.issn.1006-9348.2021.07.100
[5]	KAIROUZ E, MCMAHAN H B. Advances and open problems in federated learning[J]. Foundations and Trends in Machine Learning, 2021, 14(1): 1-210.
[6]	BAO W, WU C, GULENG S, et al. Edge computing-based joint client selection and networking scheme for federated learning in vehicular IoT[J]. China Communications, 2021, 18(6): 39-52. doi: 10.23919/JCC.2021.06.004
[7]	KRABS W. A cooperative treatment of an n-person cost-goal-game[J]. Mathematical Methods of Operations Research, 2003, 57(2): 309-319. doi: 10.1007/s001860200262
[8]	SHIROKIKH V A, LEZHNINA E A. Coalition-Formation problem for cooperative inventory routing game[J]. Automation and Remote Control, 2019, 80(7): 1358-1367. doi: 10.1134/S0005117919070129
[9]	ZHENG Z, CHEN W, WU X, et al. LSTM network: A deep learning approach for short-term traffic forecast[J]. IET Intelligent Transport Systems, 2017, 11(2): 68-75. doi: 10.1049/iet-its.2016.0208
[10]	SHI X, CHEN Z, WANG H, et al. Convolutional LSTM network: A machine learning approach for precipitation nowcasting[C]//Proceedings of the 28th International Conference on Neural Information Processing Systems. [S.l.]: MIT Press, 2015: 802-810.
[11]	ZHANG C T, ZHANG H X, YUAN D F, et al. Citywide cellular traffic prediction based on densely connected convolutional neural networks[J]. IEEE Communications Letters, 2018, 22(8): 1656-1659. doi: 10.1109/LCOMM.2018.2841832

[1]	赵庶旭, 张占平, 王小龙, 韩淑梅, 元琳, 张家祯. 基于安全与低能耗的传感云边缘协同优化策略 . 电子科技大学学报, 2023, 52(1): 85-94. doi: 10.12178/1001-0548.2022009
[2]	李小婧, 任勇, 晋涛, 裴楚. 基于边缘代理及深度学习的轻量型云边协同框架研究 . 电子科技大学学报, 2023, 52(5): 756-764. doi: 10.12178/1001-0548.2022144
[3]	刘东, 裴锡凯, 赖金山, 王瑞锦, 张凤荔. 融合边缘智能计算和联邦学习的隐私保护方案 . 电子科技大学学报, 2023, 52(1): 95-101. doi: 10.12178/1001-0548.2022176
[4]	余荣斌, 蒋沅, 严玉为, 洪成. 考虑相依边负载的相依网络鲁棒性研究 . 电子科技大学学报, 2022, 51(5): 774-785. doi: 10.12178/1001-0548.2021274
[5]	刘明友, 刘红美, 张招方, 朱映雪, 黄健. 抗微生物肽机器学习预测算法综述 . 电子科技大学学报, 2022, 51(6): 830-840. doi: 10.12178/1001-0548.2022188
[6]	张凤荔, 赵佳君, 刘东, 王瑞锦. 基于深度强化学习的边云协同串行任务卸载算法 . 电子科技大学学报, 2021, 50(3): 398-404. doi: 10.12178/1001-0548.2021015
[7]	曹红艳, 许小可, 许爽. 基于多模体特征的科学家合作预测 . 电子科技大学学报, 2020, 49(5): 766-773. doi: 10.12178/1001-0548.2019173
[8]	陈世明, 戴亚明, 程运洪. 提高相依网络鲁棒性的加边策略研究 . 电子科技大学学报, 2019, 48(1): 103-109. doi: 10.3969/j.issn.1001-0548.2019.01.017
[9]	桑葛楠, 韩筱璞. 科学家科研合作关系的均衡性特征 . 电子科技大学学报, 2019, 48(5): 786-793. doi: 10.3969/j.issn.1001-0548.2019.05.020
[10]	叶娅兰, 何文文, 程云飞, 侯孟书, 李云霞. 面向压缩感知的基于相关性字典学习算法 . 电子科技大学学报, 2017, 46(5): 703-708. doi: 10.3969/j.issn.1001-0548.2017.05.011
[11]	温怀玉, 霍伟东. 无线传感器网络流量重分配拥塞控制算法 . 电子科技大学学报, 2017, 46(2): 407-411. doi: 10.3969/j.issn.1001-0548.2017.02.015
[12]	赵洋, 任化强, 熊虎, 陈阳. 代理动态操作的云数据拥有性证明方案 . 电子科技大学学报, 2016, 45(5): 796-801. doi: 10.3969/j.issn.1001-0548.2016.05.015
[13]	钟婷, 耿纪昭, 熊虎, 秦志光. 云存储中基于SBT的数据完整性验证机制 . 电子科技大学学报, 2014, 43(6): 929-933. doi: 10.3969/j.issn.1001-0548.2014.06.023
[14]	李方伟, 柴源, 朱江, 张玉平. 基于动态古诺博弈的认知无线电频谱贸易算法 . 电子科技大学学报, 2014, 43(4): 502-507. doi: 10.3969/j.issn.1001-0548.2014.04.005
[15]	荣智海, 吴枝喜, 王文旭. 共演博弈下网络合作动力学研究进展 . 电子科技大学学报, 2013, 42(1): 10-22. doi: 10.3969/j.issn.1001-0548.2013.01.005
[16]	邵小强, 马宪民. 基于混沌的煤矿监测网络流量异变的预测 . 电子科技大学学报, 2012, 41(3): 424-428. doi: 10.3969/j.issn.1001-0548.2012.03.020
[17]	王勇, 黄科瑞, 秦志光, 吴波. 时空相关性的P2P网络信任模型 . 电子科技大学学报, 2011, 40(1): 80-84. doi: 10.3969/j.issn.1001-0548.2011.01.015
[18]	岑明, 傅承毓, 陈科, 刘兴法. 广义合作目标跟踪的误差空间估计方法 . 电子科技大学学报, 2007, 36(2): 217-219,274.
[19]	慕银平, 唐小我, 马永开. 企业集团内部转移定价的合作博弈分析 . 电子科技大学学报, 2005, 34(2): 277-280.
[20]	龙志和, 辛亚萍. 成渝客运市场博弈分析 . 电子科技大学学报, 1999, 28(6): 570-574.

点击查看大图

图(7) / 表(1)

计量

文章访问数: 5000
HTML全文浏览量: 1675
PDF下载量: 85
被引次数: 0

全文HTML

精准预测城市全域尺度通信网络流量能够辅助运营商进行精细化运营、高效配备与部署基站资源，从而满足涌现的各种业务需求。

然而，城市全域尺度的通信流量预测面临3方面困难。1) 预测模型的复杂性。现有的单个或局部范围的流量预测模型，由于数据体量不大，通常是集中式算法模型。如果直接扩展到城市全域范围，必然导致在模型训练过程中的复杂度急剧扩张。2) 预测模型的时效性。在模型持续运行过程中，分散在城市全域范围的各个基站的实时流量数据需要全部汇聚到部署了全域流量预测模型的中心节点上进行演算，这不仅导致通信负载的增加，还导致预测模型的时效性较低。3) 预测模型的准确性。城市尺度的流量特征是高度差异化，与城市的规划、城市居民生活习惯、通信设施部署息息相关。城市尺度的流量预测模型需要准确性以刻画本城市的流量特征。

本文的主要贡献体现在以下两个方面。

1) 提出了基于联邦学习的城市全域流量预测框架。首先，各个边缘计算服务器采集相应区域内的流量数据，并在本地流量预测模型训练；其次，各个边缘计算服务器将本地流量预测模型的模型参数上传给中心云服务器，由中心云服务器对模型参数进行融合，并将融合后的模型参数下发给各个边缘计算服务器；最后，各个边缘计算服务器在融合后的模型参数基础上继续进行本地模型训练，直至训练结束，形成通用流量预测模型。现有流量预测方案普遍采用集中式训练框架，需要将城域级流量数据汇聚到一台中心服务器上进行模型训练，通信开销大，模型复杂度高。本文所提的模型是一种分布式训练框架，各边缘计算服务器只需采集区域级的流量数据进行模型训练，因此，通信开销较小，模型复杂度较低。此外，联邦训练预测框架通过融合各区域的模型参数，间接地扩大了各个边缘计算服务器上的流量训练集，从而提高了区域级流量预测的准确性。

2) 提出了基于合作博弈的个性化联邦流量预测模型。各个边缘计算服务器在执行完上述联邦训练过程形成通用流量预测模型之后，各自独立训练出反应本地区特征的个性化的流量预测模型。具体地，各个边缘计算服务器将本地区的各个区域性特征作为合作博弈的参与者，通过合作博弈的超可加性准则，比较不同特征组合对流量预测产生的收益，根据收益进行本地区特征的筛选。对比现有多源流量预测模型，通常将流量数据和所有的多源特征数据直接融合在一起，以提升模型预测准确度。但是，融合的多源特征过多会加深模型训练的复杂度，导致预测效果变差。而本文所提的基于合作博弈的区域个性化特征筛选方法，能够为每个区域引入合适的多源特征数据，从而达到提升模型预测效果的目的。

1. 相关研究

针对蜂窝流量预测问题，国内外已涌现大量的相关研究。传统算法普遍采用统计概率模型或者时间序列预测模型进行流量预测^[1-2]。预测算法都是针对每个小区进行单独建模，无法直接适用于所有小区。在实际应用中，对千万数量级别小区流量进行并行化建模非常困难。

随着深度学习算法在各领域取得突破进展的同时，能够捕获空间相关性的卷积神经网络(convolutional neural network, CNN)以及能够捕获时间相关性的长短时记忆(long short-term memory, LSTM)网络被逐步应用到通信流量预测领域。深度学习模型由于具有拟合复杂非线性的特点，通常将多个小区的流量数据整体作为训练集进行训练并产生统一模型用于多个小区的预测。然而，随着流量预测范围扩大到城市全域尺度，导致预测模型的复杂度提高，实际预测效果不理想。

为了解决以上问题，本文在模型中引入联邦学习的思想。联邦学习是一种具有隐私保护的分布式机器学习训练框架，多个客户端在一个中心服务器的协同之下共同训练一个模型^[3-4]。分布式算法模型可以大范围地进行流量预测，数据集增多可提高模型预测精度，同时也不会出现复杂度高、实时性低的问题。

但在联邦学习的研究过程中，还面临着一个问题，常见数据集大多都是独立同分布(independent identically distribution, IID)，但在现实场景中，不同边缘计算服务器面对的数据质和量都不尽相同，很难满足IID的假设，而在模型训练时non-IID数据往往比IID数据表现差。为了解决这一问题，文献[5]针对non-IID数据根据每个客户机的贡献确定其参与训练的权重，模型性能有很大提升。其中对贡献的定义分为两类：一是根据每个客户机上不同类别数据的数量；另一类是根据本地模型在验证集上的准确性。文献[6]根据客户机的数据分布的相似性确定客户机集群，改进了模型的个性化与泛化性能。

通信流量数据大多为non-IID数据，也同样面临上述问题。为了解决该问题，本文在挑选出流量分布相似的区域中引入联邦平均算法，提高模型的泛化性能，引入合作博弈对各区域的本地特征进行筛选，提高模型的个性化。

5. 结束语

本文提出了基于联邦学习的城市全域流量预测模型Fed-DenseNet和基于合作博弈的个性化联邦流量预测模型p-Fed-DenseNet。前者将各个边缘服务器端时空流量预测的结果上传至中心服务器，在中心服务器的协同下训练出能够反映各区域流量共性特征的全局模型，解决了“城市全域尺度”的通信流量预测复杂性、时效性问题。后者在前者的全局模型上，引入符合条件的本地区域性数据，在全局模型泛化性的基础上保留各区域模型差异性，解决了“城市全域尺度”的通信流量预测准确性问题。

参考文献 (11)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于个性化联邦学习的无线通信流量预测

doi: 10.12178/1001-0548.2022102

作者简介:
林尚静(1986 − )，女，博士生，主要从事深度学习、分布式计算及边缘计算等方面的研究

通讯作者: 林尚静，E-mail： linshangjing@bupt.edu.cn

Citywide Wireless Traffic Prediction Based on Personalized Federated Learning

计量

基于个性化联邦学习的无线通信流量预测

doi: 10.12178/1001-0548.2022102

1. 北京邮电大学安全生产智能监控北京市重点实验室　北京海淀区　100876

2. 金陵科技学院网络与通信工程学院　南京　211169

作者简介:
林尚静(1986 − )，女，博士生，主要从事深度学习、分布式计算及边缘计算等方面的研究

通讯作者: 林尚静，E-mail： linshangjing@bupt.edu.cn

English Abstract

Citywide Wireless Traffic Prediction Based on Personalized Federated Learning

1. Beijing Key Laboratory of Work Safety Intelligent Monitoring, Beijing University of Posts and Telecommunications　Haidian Beijing　100876

2. School of Network and Communication Engineering, Jinling Institute of Technology　Nanjing　211169

全文HTML

2.1. 蜂窝流量的相关性

2.2. 蜂窝流量的分布性

2.3. 蜂窝流量特征对流量预测模型的影响

3.1. 时空流量预测模型

3.2. 个性化联邦学习算法

3.3. 模型复杂度与时效性分析

4.1. 数据集描述

4.2. 参数设置和实验环境

4.3. 个性化联邦学习中本地特征选择

4.4. 集中式学习、联邦学习与个性化联邦学习对比

4.5. 联邦学习与集中式学习算法对比

4.6. 真实值与预测值对比

目录

期刊在线

编辑办公

友情链接

留言板

基于个性化联邦学习的无线通信流量预测

doi: 10.12178/1001-0548.2022102

作者简介: 林尚静(1986 − )，女，博士生，主要从事深度学习、分布式计算及边缘计算等方面的研究

通讯作者: 林尚静，E-mail： linshangjing@bupt.edu.cn

Citywide Wireless Traffic Prediction Based on Personalized Federated Learning

计量

出版历程

基于个性化联邦学习的无线通信流量预测

doi: 10.12178/1001-0548.2022102

1. 北京邮电大学安全生产智能监控北京市重点实验室 北京 海淀区 100876 2. 金陵科技学院网络与通信工程学院 南京 211169

作者简介: 林尚静(1986 − )，女，博士生，主要从事深度学习、分布式计算及边缘计算等方面的研究

通讯作者: 林尚静，E-mail： linshangjing@bupt.edu.cn

English Abstract

Citywide Wireless Traffic Prediction Based on Personalized Federated Learning

1. Beijing Key Laboratory of Work Safety Intelligent Monitoring, Beijing University of Posts and Telecommunications Haidian Beijing 100876 2. School of Network and Communication Engineering, Jinling Institute of Technology Nanjing 211169

全文HTML

2.1. 蜂窝流量的相关性

2.2. 蜂窝流量的分布性

2.3. 蜂窝流量特征对流量预测模型的影响

3.1. 时空流量预测模型

3.2. 个性化联邦学习算法

3.3. 模型复杂度与时效性分析

4.1. 数据集描述

4.2. 参数设置和实验环境

4.3. 个性化联邦学习中本地特征选择

4.4. 集中式学习、联邦学习与个性化联邦学习对比

4.5. 联邦学习与集中式学习算法对比

4.6. 真实值与预测值对比

目录

期刊在线

编辑办公

友情链接

作者简介:
林尚静(1986 − )，女，博士生，主要从事深度学习、分布式计算及边缘计算等方面的研究

1. 北京邮电大学安全生产智能监控北京市重点实验室　北京海淀区　100876

2. 金陵科技学院网络与通信工程学院　南京　211169

作者简介:
林尚静(1986 − )，女，博士生，主要从事深度学习、分布式计算及边缘计算等方面的研究

1. Beijing Key Laboratory of Work Safety Intelligent Monitoring, Beijing University of Posts and Telecommunications　Haidian Beijing　100876

2. School of Network and Communication Engineering, Jinling Institute of Technology　Nanjing　211169