-
疫情在全球多点爆发并蔓延,已成为全球性流行病,给各国人民的健康带来巨大威胁。通过各地一系列防控措施,如勤洗手、公众场合戴口罩、外出需出示健康码和通行大数据等,我国疫情得到较好的控制,但是国外疫情仍然比较严峻,因此利用新冠肺炎历史数据预测疫情发展趋势对制定合理的干预防控措施有重要意义。
文献[1-3]从多个角度为抗击疫情提供了有力的学术支持。现有方法可分为统计学方法、动力学方法和机器学习方法。统计学方法适合在信息不完整的情况下使用,该方法通过部分样本的情况预测总体趋势,而部分样本与总体传播趋势具有较大差异性[4],因此该方法的预测误差较大,无法准确体现疫情传播的趋势变化。动力学方法的经典数学模型为SIR(susceptible infected recovered)模型[5-6]和SEIR(susceptible-exposed-infected-removed)模型[7-8]。动力学方法对疫情早期传播趋势有较好的预测,但是无法对开放式流动环境下的病毒传播做出准确估计,也无法使假设的疾病传播能力及治愈概率的常数与实际状况相符,因此无法对疫情趋势做长期准确的分析[9]。
随着新冠肺炎数据增多,机器学习展现出了极大的优越性。文献[10]在有限的数据下,通过最小二乘准则和梯度下降算法对数据进行非线性回归来预测新冠肺炎确诊人数趋势,但此方法需要人为添加时间特征保证预测准确度。为解决上述问题,文献[11-13]运用自回归积分滑动平均模型(autoregressive integrated moving average model, ARIMA)对新冠肺炎疫情发展状况进行了预测,此模型对数据的时序性要求高,不需要人为添加时间特征,但是非线性拟合能力不强,随着数据量增加,预测效果下降。为解决上述问题,文献[14]建立了基于深度学习的长短期记忆模型(long short-term memory, LSTM),通过Python实现了模型的拟合和预测,此方法在一定程度上提高了短期新冠肺炎预测的准确度,但是有以下不足:1)未做到对新冠肺炎发展趋势较为准确的长期预测;2) LSTM神经网络对数据量需求较大,文中未提供一个简单的数据采集方法;3)未考虑深层神经网络中由于参数多和模型复杂而带来的过拟合问题。
LSTM神经网络在趋势预测中有许多改进机制,大致分为两类:1)针对LSTM神经网络自身进行改进;2)引入其他方法改进LSTM算法。文献[15]针对LSTM神经网络自身改进,网络训练时,将输出反馈回输入端,使其二次训练达到提高泛化能力的目的。文献[16]利用卷积神经网络(convolutional neural network, CNN)提取挖掘相邻路口交通流量的空间关联性,通过LSTM模型挖掘交通流量的时序特征,将提取的时空特征进行特征融合,实现短期流量预测。文献[17]引入集合经验模态分解(ensemble empirical mode decomposition, EEMD),构建多层级LSTM预测模型提升模型预测准确率。本文提出的Dropout-LSTM模型属于第二种改进方法。新冠肺炎历史数据为时序性数据,而LSTM神经网络擅长处理时序性数据,可根据实验效果调整具体预测的天数,达到对新冠肺炎发展趋势预测的目的。
由于新冠肺炎历史数据较多,传统的人工搜集方法不再适用,因此本文使用网络爬虫技术从腾讯新闻网站中获取相关数据供本次研究使用。考虑到新冠肺炎历史数据之间有很强的时序性,故本文使用擅长处理时序性数据的LSTM神经网络作为基本模型对疫情趋势进行预测。该模型与ARIMA模型相比有更强的非线性拟合能力,且不需要人为添加时间特征,可最大限度地挖掘时序数据之间的非线性关系。针对LSTM神经网络,新冠肺炎数据量较小,为避免在多层网络训练时出现过拟合问题,本文构建多层LSTM神经网络,并引入Dropout技术按随机概率让神经元失活。最后使用国内累计确诊、现有确诊和累计治愈人数验证此方法的准确性。
-
每日更新的新冠肺炎历史数据属于时序性数据,根据神经网络的特征,本文选择擅长处理时序性数据的LSTM神经网络作为基本模型对新冠肺炎发展趋势进行预测,可最大限度地挖掘数据时序性与非线性之间的关系。
-
LSTM神经网络[19]属于循环神经网络(recurrent neural networks, RNN)。RNN在处理序列信息中有良好的性能,但是当历史数据和预测数据的位置间隔不断增大时,梯度越传越弱,上一层的网络权重无法更新,丧失从历史数据中学习信息的能力,即梯度消失问题。
LSTM神经网络能够解决RNN的梯度消失问题,是因为该网络中放置了遗忘门ft、输入门it和输出门ot[20]。可根据式(1)~(6)判断该数据是否符合算法认证,符合认证的数据留下,不符合的数据则通过遗忘门遗忘,因此LSTM神经网络能在更长的时序数据中有更好的表现[21]。LSTM神经网络标准结构如图2所示。
-
1)遗忘门
遗忘门负责对
$t$ 时刻的输入${x_t}$ 选择性忘记,通过计算${f_t}$ 控制上一单元候选状态${C_{t{\rm{ - }}1}}$ 中的数据保留或忘记。若${f_t}$ 为1,表示保留上一单元的数据;若${f_t}$ 为0,表示忘记上一单元的数据:$${f_t} = \sigma ({{ W}_f}[{h_{t - 1}},{x_t}] + {b_f})$$ (1) 式中,
$\sigma $ 为sigmoid激活函数;${{ W}_f}$ 为上一单元隐藏层的输出${h_{t{\rm{ - }}1}}$ 和当前输入数据${x_t}$ 相乘的权重矩阵;${b_f}$ 为遗忘门的偏置。2)输入门
输入门
${i_t}$ 负责对$t$ 时刻的输入有选择性地记忆。当前输入内容由式(2)得到,
$\sigma $ 用来控制需要更新的输入值,而输入的门控信号由式(3)控制,tanh用来控制当前记忆单元候选状态:$${i_t} = \sigma ({{{W}}_{it}}[{h_{t - 1}},{x_t}] + {b_i})$$ (2) $${\tilde C_t} = \tanh ({{{W}}_c}[{h_{t - 1}},{x_t}] + {b_c})$$ (3) 式中,
${{{W}}_{it}}$ 为输入门${i_t}$ 在$t$ 时刻的输入${x_t}$ 的权重矩阵;${{{W}}_c}$ 为新生成信息在$t$ 时刻的权重矩阵;${b_i}$ 、${b_c}$ 为输入数据和新生成信息在当前单元的偏置。传递给
$t + 1$ 时刻的状态${C_t}$ 由两部分组成:式(1)得到的遗忘门${f_t}$ 的输出与上一时刻$t - 1$ 候选状态${C_{t{\rm{ - }}1}}$ 之积;式(2)得到的输入门${i_t}$ 的输出与$t$ 时刻候选状态${\tilde C_t}$ 之积。此过程旨在抛弃当前单元中无用信息,保留有用信息:$${C_t} = {f_t} {C_{t - 1}} + {i_t} {\tilde C_t}$$ (4) 3)输出门
输出门
${o_t}$ 通过sigmoid激活函数控制得到初始输出,接着使用tanh层将传递给下一时刻$t + 1$ 的状态${C_t}$ 缩放至(−1,1)上,最后与初始输出相乘得到最终输出结果:$${o_t} = \sigma ({{ W}_{ot}} [{h_{t - 1}},{x_t}] + {b_o})$$ (5) $${h_t} = {o_t} \tanh ({C_t})$$ (6) 式中,
${{{W}}_{ot}}$ 为输出门${o_t}$ 的权重矩阵;${b_o}$ 为偏置。 -
在Windows8.1系统中使用Pycharm,Python3.6为实验平台,运用Tensorflow深度学习框架所提供的 LSTM 神经网络用于仿真实验。
-
实验数据均由网络爬虫技术在腾讯网站获取。日期范围为2020年1月13日−2020年9月12日,共计244条数据,将其按照训练集214条数据、测试集30条数据划分,针对国内累计确诊、现有确诊、累计治愈人数进行预测。
-
1) 数据提取、划分:在爬取到的新冠肺炎历史数据CSV文件中提取出来日期和累计确诊两列,将累计确诊列以矩阵形式表示:
$${{X}} = {[{x_0},{x_1}, \cdots ,{x_{243}}]^{\rm T}}$$ (7) 训练集、测试集为:
$${X_{{\rm{train}}}} = {[{x_0},{x_1}, \cdots ,{x_{213}}]^{\rm T}}$$ (8) $${X_{{\rm{test}}}} = {[{x_{214}},{x_{215}}, \cdots ,{x_{243}}]^{\rm T}}$$ (9) 2) 数据归一化处理:为缩短模型训练时间,加速loss下降,对训练数据和测试数据分别进行归一化处理,这样可以最大程度保留数据特征,更好拟合新冠肺炎数据之间的非线性关系。本文采用最大最小归一化方法对数据进行处理:
$${x_{{\rm{norm}}}} = \frac{{x - {x_{{\rm{min}}}}}}{{{x_{{\rm{max}}}} - {x_{{\rm{min}}}}}}$$ (10) 式中,
$x$ 代表样本数据;${x_{\max }}$ 、${x_{\min }}$ 分别代表训练数据或测试数据中的最大值和最小值。设归一化处理后的训练集和测试集为${X_{{\rm{ntrain}}}}$ 和${X_{{\rm{ntest}}}}$ ,对现有确诊和累计治愈数据做同样处理。 -
本文提出的模型由1个输入层、多个隐藏层和1个输出层组成。上一个隐藏层的输出作为下一个隐藏层的输入,输入层与隐藏层共同实现输入数据特征的提取,最后一个隐藏层的输出为一维列向量,经线性回归即得到处理后的预测值[23]。经反复实验,最终超参数设置如下:激活函数为Linear、迭代次数为15000,隐藏层为100,Dropout为0.05,学习率为0.0001,优化器为Adam。
-
目前缺乏利用深度学习对新冠肺炎发展趋势预测的研究,这是因为:1)深度学习对数据量要求较高,利用传统手工搜集方法不易获取相关数据;2)训练过程中易出现过拟合问题,严重影响预测精度。在已有的LSTM神经网络用于新冠肺炎预测的研究中,有以下不足:1) 未提供简单的数据获取方法;2) LSTM层过少,不能充分挖掘时序数据之间的非线性关系;3) 未考虑过拟合问题给实验结果带来的影响。针对以上问题,本文利用网络爬虫技术获取新冠肺炎历史数据组成实验数据集;在网络层上构建层次更深的LSTM新冠肺炎发展趋势预测模型;在每个LSTM单元构成的隐含层中的非循环部分采用Dropout技术对神经元进行随机概率失活,有效避免LSTM神经网络中的过拟合问题。本文实验流程图如图6所示。
-
本文预测评价指标采用平均绝对百分误差(mean absolute percentage error, MAPE)、平均绝对误差(mean absolute error, MAE)和均方根误差(root mean square error, RMSE)衡量:
$${\rm{MAPE}} = \frac{1}{n}\sum\limits_{i = 0}^n {\left|\frac{{{y_i} - {y_p}}}{{{y_i}}}\right|} \times 100{\text \%}$$ (11) $${\rm{MAE}} = \frac{1}{n}\sum\limits_{i = 0}^n {|{y_i} - {y_p}|} $$ (12) $${\rm{RMSE}} = \sqrt {\frac{1}{n}\sum\limits_{i = 0}^n {{{({y_i} - {y_p})}^2}} } $$ (13) 式中,
${y_i}$ 表示真实值;${y_p}$ 表示预测值;n表示待预测的新冠肺炎天数,即30。 -
为证明本模型(Dropout-LSTM模型)的普遍适用性与优越性,运用ARIMA模型、LSTM模型分别对2020年8月14日−2020年9月12日的国内累计确诊、现有确诊和累计治愈数据进行预测,并与Dropout-LSTM模型预测结果进行对比。Dropout-LSTM模型预测值和误差如表1所示,3种模型的可视化对比如图7所示。
表 1 全国新冠肺炎发展趋势预测
日期 全国累计确诊/人 全国现有确诊/人 全国累计治愈/人 日期 全国累计确诊/人 全国现有确诊/人 全国累计治愈/人 真实值 预测值 误差 真实值 预测值 误差 真实值 预测值 误差 真实值 预测值 误差 真实值 预测值 误差 真实值 预测值 误差 8.14 89695 89690 −5 1580 1576 −4 83407 83412 5 8.29 90351 90332 −19 675 675 0 84948 84918 −30 8.15 89761 89755 −6 1492 1489 −3 83559 83561 2 8.30 90383 90364 −19 649 650 1 85005 84974 −31 8.16 89859 89851 −8 1501 1498 −3 83648 83648 0 8.31 90402 90382 −20 614 615 1 85058 85026 −32 8.17 89926 89916 −10 1479 1476 −3 83737 83735 −2 9.1 90422 90402 −20 569 570 1 85122 85088 −34 8.18 89980 89969 −11 1410 1407 −3 83858 83853 −5 9.2 90442 90421 −21 539 540 1 85169 85134 −35 8.19 90013 90001 −12 1273 1271 −2 84027 84018 −9 9.3 90475 90454 −21 529 530 1 85211 85175 −36 8.20 90053 90041 −12 1215 1213 −2 84122 84111 −11 9.4 90498 90476 −22 506 507 1 85257 85220 −37 8.21 90103 90089 −14 1133 1131 −2 84254 84240 −14 9.5 90517 90495 −22 468 469 1 85314 85276 −38 8.22 90141 90127 −14 1052 1051 −1 84372 84355 −17 9.6 90551 90528 −23 464 465 1 85350 85311 −39 8.23 90182 90167 −15 1018 1017 −1 84446 84428 −18 9.7 90573 90550 −23 454 455 1 85380 85340 −40 8.24 90205 90189 −16 971 970 −1 84516 84496 −20 9.8 90582 90558 −24 431 433 2 85411 85370 −41 8.25 90239 90223 −16 894 893 −1 84626 84603 −23 9.9 90595 90571 −24 419 420 1 85436 85395 −41 8.26 90271 90254 −17 836 836 0 84715 84690 −25 9.10 90623 90598 −25 403 405 2 85480 85438 −42 8.27 90301 90283 −18 780 780 0 84799 84773 −26 9.11 90643 90618 −25 398 400 2 85505 85462 −43 8.28 90323 90305 −18 715 715 0 84883 84855 −28 9.12 90666 90641 −25 392 394 2 85533 85490 −43 误差为预测值与真实值之差。误差为负,代表预测值小于真实值;误差为正,代表预测值大于真实值。本文针对30天的数据进行预测,当预测日期后移时,将预测日期之前的数据加进来。若仅用当前数据去预测未来两个月甚至更久,从表3可看出误差有恶化趋势,选择适当的预测天数和日渐增多的数据量可解决误差趋势恶化问题。
若仅预测30天的数据,恶化程度是可控的,误差会固定在一定区间,对基数较大的累计确诊数和累计治愈,数据误差区间为[−25, −5]和[−43, 8],基数较小的现有确诊误差仅为[−4, 2]。随着新冠肺炎数据量增多,神经网络预测也会更加准确。
由图7可明显看出,累计确诊和累计治愈真实值总体呈上升趋势,现有确诊真实值呈下降趋势。
对3组数据分别进行预测时,ARIMA模型预测曲线与真实值曲线差别均较大,拟合效果较差。这是因为ARIMA模型网络结构较简单,非线性拟合能力较弱。LSTM模型拟合效果次之,这是因为虽然LSTM神经网络对时序数据有较好的拟合能力,但是出现了过拟合问题,无论如何调参,测试集的准确度依然不高。Dropout-LSTM模型预测曲线与真实值曲线最接近,尤其是在现有确诊预测中,几乎与真实值曲线重合,这是因为添加Dropout技术后解决了LSTM神经网络中的过拟合问题,从而提高了准确度。
-
为进一步说明Dropout-LSTM模型具有较高的拟合能力,采用ARIMA模型、LSTM模型和Dropout-LSTM模型对3组数据分别进行预测,表2对其MAPE、MAE和RMSE进行了对比。
表 2 评价指标对比
类别 模型 MAPE/% MAE RMSE 时间/s 累计确诊 ARIMA 0.320 288.458 289.403 290 LSTM 0.221 199.453 200.437 223 Dropout-lSTM 0.019 16.793 17.849 229 现有确诊 ARIMA 9.330 63.816 63.945 267 LSTM 3.588 25.551 25.566 252 Dropout-lSTM 0.203 17.034 17.162 266 累计治愈 ARIMA 0.681 577.583 583.498 302 LSTM 0.252 227.256 228.230 248 Dropout-lSTM 0.029 24.449 28.077 323 从模型角度看,Dropout-LSTM模型的MAPE、MAE和RMSE在3组数据中均有明显下降,说明误差降低,准确率提高,排除了只对一组数据有较好预测效果的可能。这是因为Dropout技术使神经元按照一定概率失活,神经网络不会偏向于某一个节点,从而使每一个节点的权重不会过大,减轻了LSTM神经网络的过拟合现象,提高了预测准确度。从时间角度看,LSTM模型训练时间最短,这是因为LSTM神经网络共享参数,节省了训练时间;而Dropout-LSTM模型比LSTM模型训练时间长,这是因为神经元按照随机概率失活后,神经网络结构变得更“粗糙”,为使曲线更平滑地到达理想值,收敛到全局最优,增加了训练时间。
虽然向LSTM模型中接入Dropout技术增加了网络训练时间,但是随着数据量增多,需要的网络层数、训练轮数会相应减少,过拟合问题也会减轻,使网络训练在可接受的时间内完成。
COVID-19 Trend Forecasting by Using Dropout - LSTM Model
-
摘要: 为提高新冠肺炎(COVID-19)趋势预测精度,该文提出一种运用Dropout技术的长短期记忆(LSTM)神经网络预测新冠肺炎发展趋势的方法。该方法基于Python语言使用网络爬虫技术获取完整的国内新冠肺炎历史数据,提高数据采集效率的同时减少了主观原因导致的数据错误;因为新冠肺炎历史数据为时序性数据,为避免人为添加时间特征及充分挖掘较少时序数据之间的非线性关系,该文构建了层数更多的LSTM神经网络预测模型。随后在隐藏层中的非循环部分采用Dropout技术,对神经元进行随机概率失活,有效解决了深度学习的过拟合问题。最后用国内累计确诊、现有确诊和累计治愈人数对该方法进行验证,实验证明该方法可较精准预测新冠肺炎传播趋势。
-
关键词:
- 新冠肺炎 /
- Dropout 技术 /
- 长短期记忆神经网络 /
- 网络爬虫
Abstract: To improve the accuracy of COVID-19 trend forecasting, a method of COVID-19 trend forecasting by using dropout and long short-term memory (LSTM) is proposed. The method uses web crawler based on python to obtain complete domestic historical data of COVID-19, which improves the efficiency of data collection and reduces data errors caused by subjective reasons. To avoid adding time features artificially and explore the nonlinear relationship fully between the less data of COVID-19, the proposed model extends the layers of the deep learning network. Then, the dropout technique is applied to the non-circular part of each hidden layer to randomly deactivate neurons, preventing the neural network from overfitting. The experiment demonstrates that the method can predict the number of cumulative confirmed cases, current confirmed cases and recovered cases.-
Key words:
- COVID-19 /
- dropout technique /
- long short-term memory /
- web crawler
-
表 1 全国新冠肺炎发展趋势预测
日期 全国累计确诊/人 全国现有确诊/人 全国累计治愈/人 日期 全国累计确诊/人 全国现有确诊/人 全国累计治愈/人 真实值 预测值 误差 真实值 预测值 误差 真实值 预测值 误差 真实值 预测值 误差 真实值 预测值 误差 真实值 预测值 误差 8.14 89695 89690 −5 1580 1576 −4 83407 83412 5 8.29 90351 90332 −19 675 675 0 84948 84918 −30 8.15 89761 89755 −6 1492 1489 −3 83559 83561 2 8.30 90383 90364 −19 649 650 1 85005 84974 −31 8.16 89859 89851 −8 1501 1498 −3 83648 83648 0 8.31 90402 90382 −20 614 615 1 85058 85026 −32 8.17 89926 89916 −10 1479 1476 −3 83737 83735 −2 9.1 90422 90402 −20 569 570 1 85122 85088 −34 8.18 89980 89969 −11 1410 1407 −3 83858 83853 −5 9.2 90442 90421 −21 539 540 1 85169 85134 −35 8.19 90013 90001 −12 1273 1271 −2 84027 84018 −9 9.3 90475 90454 −21 529 530 1 85211 85175 −36 8.20 90053 90041 −12 1215 1213 −2 84122 84111 −11 9.4 90498 90476 −22 506 507 1 85257 85220 −37 8.21 90103 90089 −14 1133 1131 −2 84254 84240 −14 9.5 90517 90495 −22 468 469 1 85314 85276 −38 8.22 90141 90127 −14 1052 1051 −1 84372 84355 −17 9.6 90551 90528 −23 464 465 1 85350 85311 −39 8.23 90182 90167 −15 1018 1017 −1 84446 84428 −18 9.7 90573 90550 −23 454 455 1 85380 85340 −40 8.24 90205 90189 −16 971 970 −1 84516 84496 −20 9.8 90582 90558 −24 431 433 2 85411 85370 −41 8.25 90239 90223 −16 894 893 −1 84626 84603 −23 9.9 90595 90571 −24 419 420 1 85436 85395 −41 8.26 90271 90254 −17 836 836 0 84715 84690 −25 9.10 90623 90598 −25 403 405 2 85480 85438 −42 8.27 90301 90283 −18 780 780 0 84799 84773 −26 9.11 90643 90618 −25 398 400 2 85505 85462 −43 8.28 90323 90305 −18 715 715 0 84883 84855 −28 9.12 90666 90641 −25 392 394 2 85533 85490 −43 表 2 评价指标对比
类别 模型 MAPE/% MAE RMSE 时间/s 累计确诊 ARIMA 0.320 288.458 289.403 290 LSTM 0.221 199.453 200.437 223 Dropout-lSTM 0.019 16.793 17.849 229 现有确诊 ARIMA 9.330 63.816 63.945 267 LSTM 3.588 25.551 25.566 252 Dropout-lSTM 0.203 17.034 17.162 266 累计治愈 ARIMA 0.681 577.583 583.498 302 LSTM 0.252 227.256 228.230 248 Dropout-lSTM 0.029 24.449 28.077 323 -
[1] CHAN J F, YUAN Shuo-feng, KOK K, et al. A familial cluster of pneumonia associated with the 2019 novel coronavirus indicating person-to-person transmission: A study of a family cluster[J]. The Lancet, 2020, 395(10223): 514-523. doi: 10.1016/S0140-6736(20)30154-9 [2] WEI Yan-qiu, LU Yan-jun, XIA Li-ming, et al. Analysis of 2019 novel coronavirus infection and clinical characteristics of outpatients: An epidemiological study from a fever clinic in Wuhan, China[J]. Journal of Medical Virology, 2020: 2758-2767. [3] ZHANG Qi, YU Yu. Epidemiological features of the 2019 novel coronavirus outbreak in China[J]. Current Topics in Medicinal Chemistry, 2020, 20(13): 1137-1140. doi: 10.2174/1568026620999200511094117 [4] 杨政, 原子霞, 贾祖瑶. 基于迁徙数据估计武汉感染新型冠状病毒的人员数量[J]. 电子科技大学学报, 2020, 49(3): 330-338. YANG Zheng, YUAN Zi-xia, JIA Zu-yao. Estimating the number of people infected with COVID-19 in Wuhan based on migration data[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(3): 330-338. [5] CHANG H J. Estimation of basic reproduction number of the Middle East respiratory syndrome coronavirus (MERS-CoV) during the outbreak in South Korea, 2015[J]. Biomedical Engineering Online, 2017, 16(1): 79. doi: 10.1186/s12938-017-0370-7 [6] ILSU C, HO L D, KUK K Y. Effects of Timely control intervention on the spread of middle east respiratory syndrome coronavirus infection[J]. Osong Public Health and Research Perspectives, 2017, 8(6): 373-376. [7] 武文韬, 柏如海, 李达宁, 等. 广东省新型冠状病毒肺炎疫情流行趋势的初步预测[J]. 暨南大学学报(自然科学与医学版), 2020, 41(2): 181-185. WU Wen-tao, BAI Ru-hai, LI Da-ning, et al. Preliminary prediction of the epidemic trend of corona virus disease 2019 in Guangdong province[J]. Journal of Jinan University (Natural Science & Medicine Edition), 2020, 41(2): 181-185. [8] 范如国, 王奕博, 罗明, 等. 基于SEIR的新冠肺炎传播模型及拐点预测分析[J]. 电子科技大学学报, 2020, 49(3): 369-374. FAN Ru-guo, WANG Yi-bo, LUO Ming, et al. SEIR-based COVID-19 transmission model and inflection point prediction analysis[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(3): 369-374. [9] 梅文娟, 刘震, 朱静怡, 等. 新冠肺炎疫情极限IR实时预测模型[J]. 电子科技大学学报, 2020, 49(3): 362-368. MEI Wen-juan, LIU Zhen, ZHU Jing-yi, et al. Extreme IR model for COVID-19 real-time forecasting[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(3): 362-368. [10] 王志心, 刘治, 刘兆军. 基于机器学习的新型冠状病毒(COVID-19)疫情分析及预测[J]. 生物医学工程研究, 2020, 39(1): 1-5. WANG Zhi-xin, LIU Zhi-xin, LIU Zhao-jun. COVID-19 analysis and forecast based on machine learning[J]. Journal of Biomedical Engineering Research, 2020, 39(1): 1-5. [11] 林德双, 金秀玲, 刘文鑫, 等. 新冠肺炎疫情预测分析[J]. 黑龙江工业学院学报(综合版), 2020, 20(9): 114-119. LIN De-shaung, JIN Xiu-ling, LIU Wen-xin, et al. Prediction and analysis of new coronavirus epidemic situation[J]. Journal of Heilongjiang University of Technology, 2020, 20(9): 114-119. [12] 纪安之, 杨雪梅. 基于ARIMA模型的新冠肺炎序列分析预测[J]. 价值工程, 2020, 39(18): 107-109. JI An-zhi, YANG Xue-mei. Analysis and prediction of time series of 2019-nCoV based on ARIMA model[J]. Journal of Value Engineering, 2020, 39(18): 107-109. [13] 白璐, 郭佩汶, 范晋蓉. 湖北省新冠肺炎确诊人数的建模与预测分析[J]. 检验检疫学刊, 2020, 30(2): 10-12. BAI Lu, GUO Pei-wen, FAN Jin-rong. Modeling and prediction of the number of confirmed cases of new coronavirus pneumonia in Hubei Province[J]. Journal of Inspection and Quarantine, 2020, 30(2): 10-12. [14] 赵行健. 基于深度学习的新型冠状病毒肺炎疫情的动态监测研究[J]. 现代商贸工业, 2020, 41(20): 156-157. ZHAO Xing-jian. Research on dynamic monitoring of COVID-19 based on deep learning[J]. Journal of Modern Trade Industry, 2020, 41(20): 156-157. [15] 曾鹏飞, 刘辉. 基于二次相似性度量的即时学习转炉炼钢终点碳温软测量方法[EB/OL]. [2020-10-11]. http://kns.cnki.net/kcms/detail/11.5946.tp.20201217.1558.002.html. ZENG Peng-fei, LIU Hui. A soft-sensing method for carbon temperature at the end of converter steelmaking based on quadratic similarity measurement[EB/OL]. [2020-10-11]. http://kns.cnki.net/kcms/detail/11.5946.tp.20201217.1558.002.html. [16] 晏臻, 于重重, 韩璐, 等. 基于CNN+LSTM的短时交通流量预测方法[J]. 计算机工程与设计, 2019, 40(9): 2620-2624, 2659. YAN Zhen, YU Chong-chong, HAN Lu, et al. Shot-term traffic flow forecasting method based on CNN+LSTM[J]. Journal of Computer Engineering and Design, 2019, 40(9): 2620-2624, 2659. [17] 李瑞津, 刘斌, 张学敏, 等. 基于改进LSTM的变电站铅酸电池寿命预测[EB/OL]. [2020-10-11]. http://kns.cnki.net/kcms/detail/43.1129.TM.20201202.1340.030.html. LI Rui-jin, LIU Bin, ZHANG Xue-min, et al. Life prediction of lead-acid battery in substation based on improved LSTM[EB/OL]. [2020-10-11]. http://kns.cnki.net/kcms/detail/43.1129.TM.20201202.1340.030.html. [18] CASTILLO C. Effective web crawling[J]. ACM SIGIR Forum, 2005, 39(1): 55-56. doi: 10.1145/1067268.1067287 [19] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735. doi: 10.1162/neco.1997.9.8.1735 [20] 曹有为, 闫双红, 刘海涛. 基于降噪时序深度学习网络的风电功率短期预测方法[J]. 电力系统及其自动化学报, 2020, 32(1): 145-150. CAO You-wei, YAN Shuang-hong, LIU Hai-tao. Short-term wind power forecasting method based on noise-reduction time-series deep learning network[J]. Journal of Proceedings of the CSU-EPSA, 2020, 32(1): 145-150. [21] 王瑞, 闫方, 逯静, 等. 运用相似日和LSTM的短期负荷双向组合预测[J]. 电力系统及其自动化学报, 2020, DOI: 10.19635/j.cnki.csu-epsa.000671. WANG Rui, YAN Fang, LU Jing, et al. Bidirectional combined short-term load forecasting by using similar days and LSTM[J]. Journal of Proceedings of the CSU-EPSA, 2020, DOI: 10.19635/j.cnki.csu-epsa.000671. [22] 张柏翰, 凌捷. 改进的基于DNN的恶意软件检测方法[J]. 计算机工程与应用, 2020, DOI: 11.2127.TP.20200819.1505.020. ZHANG Bo-han, LING Jie. An improved malware detection method based on DNN[J]. Journal of Computer Engineering and Applications, 2020, DOI: 11.2127.TP.20200819.1505.020. [23] 张宇帆, 艾芊, 林琳. 基于深度长短时记忆网络的区域级超短期负荷预测方法[J]. 电网技术, 2019, 43(6): 1884-1892. ZHANG Yu-fan, AI Qian, LIN Lin. A very short-term load forecasting method based on deep LSTM RNN at zone level[J]. Journal of Power System Technology, 2019, 43(6): 1884-1892.