留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于多变量LSTM神经网络的澳大利亚大火预测研究

李莉 杜丽霞 张子柯

李莉, 杜丽霞, 张子柯. 基于多变量LSTM神经网络的澳大利亚大火预测研究[J]. 电子科技大学学报, 2021, 50(2): 311-316. doi: 10.12178/1001-0548.2020370
引用本文: 李莉, 杜丽霞, 张子柯. 基于多变量LSTM神经网络的澳大利亚大火预测研究[J]. 电子科技大学学报, 2021, 50(2): 311-316. doi: 10.12178/1001-0548.2020370
LI Li, DU Li-xia, ZHANG Zi-ke. Multivariable LSTM Neural Network Model for Australia Fire Prediction[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(2): 311-316. doi: 10.12178/1001-0548.2020370
Citation: LI Li, DU Li-xia, ZHANG Zi-ke. Multivariable LSTM Neural Network Model for Australia Fire Prediction[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(2): 311-316. doi: 10.12178/1001-0548.2020370

基于多变量LSTM神经网络的澳大利亚大火预测研究

doi: 10.12178/1001-0548.2020370
基金项目: 国家自然科学基金(42075019,61673151);山西省自然科学基金(201801D221003);浙江省自然科学基金(LR18A050001,LY18A050004)
详细信息
    作者简介:

    李莉(1983 − ),女,副教授,主要从事复杂网络的研究

    通讯作者: 张子柯,E-mail:zhangzike@gmail.com
  • 中图分类号: TP391

Multivariable LSTM Neural Network Model for Australia Fire Prediction

  • 摘要: 长短周期记忆神经网络(LSTM)受益于能够捕获长期依赖关系的特点,在许多实际应用中展现了优异的性能。该文构建了LSTM多变量数据驱动的预测模型,通过多变量输入的方式预测澳大利亚森林大火。首先使用多变量LSTM预测模型对日最高温度进行预测,并与反向传播(BP)神经网络以及ARIMA预测模型的结果进行对比。研究表明:以相关变量为输入的BP神经网络无法考虑时序变化规律,预测误差最大;以温度单变量为输入的ARIMA根据时序变化做出相应预测,预测效果较好;多变量LSTM预测模型综合考虑了多种因素的相互影响,同时结合了时间序列依赖关系,预测效果最好。最后通过多变量LSTM预测模型对某节点是否着火进行了预测,预测结果与实际值契合较好。总体来说,多变量LSTM预测模型对澳大利亚大火的预测结果可信。
  • 图  1  BP神经网络模型[9]

    图  2  LSTM神经元模块

    图  3  多变量LSTM预测模型框架[14]

    图  4  节点36的日最高温度、最低降水量数据

    图  5  BP与多变量LSTM对日最高温度的预测

    图  6  ARIMA与多变量LSTM对日最高温度的预测

    图  7  着火可能性预测

  • [1] 白夜, 武英达, 贾宜松, 等. 2019-2020年澳大利亚气候异常与山火爆发的关系分析及应对策略[J]. 中国应急救援, 2020, 2: 23-27. doi:  10.3969/j.issn.1673-5579.2020.02.006

    BAI Ye, WU Ying-da, JIA Yi-song, et al. Link between climate anomaly and Australia bushfires in 2019-2020[J]. China Emergency Rescue, 2020, 2: 23-27. doi:  10.3969/j.issn.1673-5579.2020.02.006
    [2] 张勇. 澳大利亚山林大火的经验教训及启示[J]. 中国应急救援, 2020, 2: 8-12. doi:  10.3969/j.issn.1673-5579.2020.02.003

    ZHANG Yong. Experience and lessons learned from Australia bushfires[J]. China Emergency Rescue, 2020, 2: 8-12. doi:  10.3969/j.issn.1673-5579.2020.02.003
    [3] 张志强. 澳洲山火对我国森林消防体系建设的启示[J]. 中国应急救援, 2020, 2: 13-17. doi:  10.3969/j.issn.1673-5579.2020.06.004

    ZHANG Zhi-qiang. Construction of China’s forest firefighting system: Lessons learned from Australia bushfires[J]. China Emergency Rescue, 2020, 2: 13-17. doi:  10.3969/j.issn.1673-5579.2020.06.004
    [4] GRANGED A J, JORDAN A, ZAVALA L M, et al. Short-term effects of experimental fire for a soil under eucalyptus forest (SE Australia)[J]. Geoderma, 2011, 167: 125-134.
    [5] DAS A, DUTTA R, ARYAL J. A hybrid neural network based Australian wildfire prediction: A novel approach using environmental and satellite imagery[J]. Lancet, 2013, 3239: 564-565.
    [6] 李诚信, 赵良辰, 李东运, 等. 基于CA系统的澳大利亚森林火灾蔓延预测模型及应急物资调度应用[J]. 林业调查规划, 2020, 5: 62-69. doi:  10.3969/j.issn.1671-3168.2020.05.011

    LI Cheng-xin, ZHAO Liang-chen, LI Dong-yun, et al. Prediction model of forest fire extension in Australia and application of emergency materials dispatching based on CA system[J]. Forest Inventory and Planning, 2020, 5: 62-69. doi:  10.3969/j.issn.1671-3168.2020.05.011
    [7] PINEDA F J. Generalization of back-propagation to recurrent neural networks[J]. Physical Review Letters, 1987, 59(19): 602-611.
    [8] CHANG T C, CHAO R J. Application of back-propagation networks in debris flow prediction[J]. Engineering Geology, 2006, 85(3-4): 270-280. doi:  10.1016/j.enggeo.2006.02.007
    [9] 林森, 李志蜀. 用P-BP预测网络模型预测通信网络指标[J]. 计算机应用, 2006, 26(7): 1709-1712.

    LIN Sen, LI Zhi-shu. Data prediction in commun ication network using P-BP predicting network[J]. Computer Applications, 2006, 26(7): 1709-1712.
    [10] SANGSOO L, DANIEL F, SANGSOO L, et al. Application of subset autoregressive integrated moving average model for short-term freeway traffic volume forecasting[J]. Transportation Research Record Journal of the Transportation Research Board, 1999, 1678(1): 179-188. doi:  10.3141/1678-22
    [11] 李焱, 高强, 王勇, 等. 乘积季节模型在软件老化评估中的应用研究[J]. 电子科技大学学报, 2017, 46(3): 583-587. doi:  10.3969/j.issn.1001-0548.2017.03.017

    LI Yan, GAO Qiang, WANG Yong, et al. Software aging evaluation method using multiplicative seasonal ARIMA model[J]. Journal of University of Electronic Science and Technology of China, 2017, 46(3): 583-587. doi:  10.3969/j.issn.1001-0548.2017.03.017
    [12] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780. doi:  10.1162/neco.1997.9.8.1735
    [13] 刘菲, 郝风杰, 郝敬全, 等. 基于优化LSTM模型的停车泊位预测算法[J]. 计算机应用, 2019, 39(S1): 65-69.

    LIU Fei, HAO Feng-jie, HAO Jing-quan, et al. Parking prediction algorithm based on optimized LSTM model[J]. Computer Applications, 2019, 39(S1): 65-69.
    [14] 闫佰忠, 孙剑, 王昕洲, 等. 基于多变量LSTM神经网络的地下水水位预测[J]. 吉林大学学报(地球科学版), 2020, 50(1): 208-216.

    YAN Bai-zhong, SUN Jian, WANG Xin-zhou, et al. Multivariable LSTM neural network model for grounderwater levels prediction[J]. Journal of Jilin University (Earth Science Edition), 2020, 50(1): 208-216.
    [15] 鲍艳, 吕世华, 刘海辉. 澳大利亚植被覆盖对亚澳季风影响的数值模拟(I): 对澳洲气候及冬季风的影响[J]. 高原气象, 2006, 25(5): 763-771. doi:  10.3321/j.issn:1000-0534.2006.05.001

    BAO Yan, LÜ Shi-hua, LIU Hai-hui. Numerical simulation about impact of vegetation cover over Australian land on Asian-Australian monsoon (I): Impacts on regional climate and winter monsoon in Australia[J]. Plateau Meteology, 2006, 25(5): 763-771. doi:  10.3321/j.issn:1000-0534.2006.05.001
    [16] 刘晶, 吴英飞, 袁贞明, 等. 基于多因素线索长短期记忆模型的血压分析预测[J]. 计算机应用, 2019, 39(5): 1551-1556. doi:  10.11772/j.issn.1001-9081.2018110008

    LIU Jing, WU Ying-fei, YUAN Zhen-ming, et al. Blood pressure prediction with multi-factor cue long short-term memory model[J]. Computer Applications, 2019, 39(5): 1551-1556. doi:  10.11772/j.issn.1001-9081.2018110008
    [17] KAREVAN Z, SUYKENS J A K. Transductive LSTM for time-series prediction: An application to weather forecasting[J]. Neural Networks, 2020, 125: 1-9. doi:  10.1016/j.neunet.2019.12.030
  • [1] 吴劲, 陈树沛, 杨庆, 周帆.  基于图神经网络的用户轨迹分类 . 电子科技大学学报, 2021, 50(5): 734-740. doi: 10.12178/1001-0548.2020435
    [2] 杨旺功, 淮永建, 张福泉.  基于Gabor及深度神经网络的葡萄种子分类 . 电子科技大学学报, 2020, 49(1): 131-138. doi: 10.12178/1001-0548.2019164
    [3] 李润东, 李立忠, 李少谦, 宋熙煜, 何鹏.  基于稀疏滤波神经网络的智能调制识别 . 电子科技大学学报, 2019, 48(2): 161-167. doi: 10.3969/j.issn.1001-0548.2019.02.001
    [4] 陈姝, 梁文章.  结合特征点匹配及深度网络检测的运动跟踪 . 电子科技大学学报, 2016, 45(2): 246-251.
    [5] 谭骏, 陈兴蜀, 杜敏, 朱锴.  基于自适应BP神经网络的网络流量识别算法 . 电子科技大学学报, 2012, 41(4): 580-585. doi: 10.3969/j.issn.1001-0548.2012.04.020
    [6] 田毅贞, 张齐军.  知识型神经网络的射频/微波器件建模方法 . 电子科技大学学报, 2011, 40(6): 815-824. doi: 10.3969/j.issn.1001-0548.2011.06.002
    [7] 钱艺, 王沁, 吴巍, 刘金龙.  神经网络并行MIMD处理器的研究及实现 . 电子科技大学学报, 2008, 37(6): 904-907.
    [8] 陈文宇, 刘井波, 孙世新.  层次分析的神经网络集成方法 . 电子科技大学学报, 2008, 37(3): 432-435.
    [9] 袁继敏, 李小玲, 古天祥.  基于时空神经网络增强数字示波器功能的研究 . 电子科技大学学报, 2007, 36(5): 938-941.
    [10] 刘贵松, 王晓彬.  采用自适应GHA神经网络的分类器设计 . 电子科技大学学报, 2007, 36(6): 1241-1244.
    [11] 王运, 黄大贵, 杨天文.  开放式数控切割机神经网络误差补偿研究 . 电子科技大学学报, 2007, 36(2): 305-308.
    [12] 傅彦, 周俊临, 吴跃.  快速神经网络无损压缩方法研究 . 电子科技大学学报, 2007, 36(6): 1245-1248.
    [13] 陈科, 许家珆, 程永新.  基于免疫算法和神经网络的新型抗体网络 . 电子科技大学学报, 2006, 35(5): 804-806,840.
    [14] 朱文莉, 张杰.  变系数时滞神经网络的周期解与稳定性 . 电子科技大学学报, 2005, 34(1): 134-136.
    [15] 朱培勇, 孙世新.  具有时滞的Hopfield神经网络的周期解 . 电子科技大学学报, 2005, 34(5): 680-683.
    [16] 文武, 杨汉生, 徐军, 钟守铭.  随机型细胞神经网络的稳定性 . 电子科技大学学报, 2005, 34(5): 700-702,716.
    [17] 张春凤, 徐军, 钟守铭.  一类神经网络系统的渐近行为 . 电子科技大学学报, 2004, 33(1): 91-93.
    [18] 徐军, 钟守铭, 张春凤.  分布时滞Hopfield神经网络稳定性 . 电子科技大学学报, 2004, 33(2): 200-203.
    [19] 王定成, 王毅, 钟守铭.  一类神经网络算法的渐近行为 . 电子科技大学学报, 2003, 32(2): 221-224.
    [20] 陈中柘.  神经网络定性分析 . 电子科技大学学报, 2002, 31(3): 250-254.
  • 加载中
图(7)
计量
  • 文章访问数:  5689
  • HTML全文浏览量:  1971
  • PDF下载量:  119
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-10-09
  • 修回日期:  2020-11-20
  • 网络出版日期:  2021-03-31
  • 刊出日期:  2021-03-22

基于多变量LSTM神经网络的澳大利亚大火预测研究

doi: 10.12178/1001-0548.2020370
    基金项目:  国家自然科学基金(42075019,61673151);山西省自然科学基金(201801D221003);浙江省自然科学基金(LR18A050001,LY18A050004)
    作者简介:

    李莉(1983 − ),女,副教授,主要从事复杂网络的研究

    通讯作者: 张子柯,E-mail:zhangzike@gmail.com
  • 中图分类号: TP391

摘要: 长短周期记忆神经网络(LSTM)受益于能够捕获长期依赖关系的特点,在许多实际应用中展现了优异的性能。该文构建了LSTM多变量数据驱动的预测模型,通过多变量输入的方式预测澳大利亚森林大火。首先使用多变量LSTM预测模型对日最高温度进行预测,并与反向传播(BP)神经网络以及ARIMA预测模型的结果进行对比。研究表明:以相关变量为输入的BP神经网络无法考虑时序变化规律,预测误差最大;以温度单变量为输入的ARIMA根据时序变化做出相应预测,预测效果较好;多变量LSTM预测模型综合考虑了多种因素的相互影响,同时结合了时间序列依赖关系,预测效果最好。最后通过多变量LSTM预测模型对某节点是否着火进行了预测,预测结果与实际值契合较好。总体来说,多变量LSTM预测模型对澳大利亚大火的预测结果可信。

English Abstract

李莉, 杜丽霞, 张子柯. 基于多变量LSTM神经网络的澳大利亚大火预测研究[J]. 电子科技大学学报, 2021, 50(2): 311-316. doi: 10.12178/1001-0548.2020370
引用本文: 李莉, 杜丽霞, 张子柯. 基于多变量LSTM神经网络的澳大利亚大火预测研究[J]. 电子科技大学学报, 2021, 50(2): 311-316. doi: 10.12178/1001-0548.2020370
LI Li, DU Li-xia, ZHANG Zi-ke. Multivariable LSTM Neural Network Model for Australia Fire Prediction[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(2): 311-316. doi: 10.12178/1001-0548.2020370
Citation: LI Li, DU Li-xia, ZHANG Zi-ke. Multivariable LSTM Neural Network Model for Australia Fire Prediction[J]. Journal of University of Electronic Science and Technology of China, 2021, 50(2): 311-316. doi: 10.12178/1001-0548.2020370
  • 丛林大火是澳大利亚炎热干燥季节频繁发生的野外火灾,由于火灾时常交替发生,自然生态系统随之演变,丛林大火成为了澳大利亚生态的重要组成部分[1]。随着全球气温升高,澳大利亚大火愈发猛烈且不可控制。2019年7月以来,澳大利亚全境发生持续性的丛林大火[2],造成了巨大的损失。据澳大利亚联邦统计,大火总燃烧面积约1.7×107 hm2,全国超过10亿只动物因大火而丧生。澳大利亚大火造成的影响不止当地的损失,大火的连锁反应导致它成为一个全球性的问题,对人类生存有极大的消极影响,如引起CO2排放量上升、污染水源、破坏生态系统等[3]

    本文首先对森林火灾发生的必要因素[4]进行了分析,影响森林火灾发生的主要因素包括燃料、氧气和火源。山火蔓延的烈度和速度取决于环境温度、燃料湿度、风速和坡度。桉树、刺槐等易燃植物的分布是火灾发生的根本依据,干燥的燃料会燃烧得很快,而潮湿或湿的燃料不易发生火灾,所以降雨量是评估山火的重要考虑因素;环境温度越高,越有可能发生火灾,因此环境温度也是预测森林火灾重要指标。

    针对澳大利亚大火的预测,已有一些学者进行了研究,如文献[5]利用前馈反馈、多层感知等神经网络的方法预测澳大利亚最有可能发生火灾的地点。但是这种神经网络模型容易出现梯度消失或者梯度爆炸问题;文献[6]通过元胞自动机来模拟森林的生长-火灾-恢复过程,构建自然因素与火灾蔓延关系的模型。可是预测该模型没有考虑澳大利亚真实历史数据,预测结果与实际情况存在偏差。

    综合分析以上原因,本文以气候分布、植被分布、降水量和温度作为依据建立了LSTM(long short-term memory)多变量数据驱动预测模型,通过添加门控制来解决神经网络出现的梯度消失或者梯度爆炸问题,利用有时间依赖的数据进行预测,同时与BP(back-propagation)和ARIMA(autoregressive integrated moving average model)进行对比,多变量LSTM预测效果良好,有较高的可信度。

    • BP神经网络是应用最广泛的神经网络。它的基本思想是梯度下降法,利用梯度搜索技术,使网络的实际输出值和期望输出值的误差均方差最小[7-8]

      BP神经网络是线性权重的激活函数模型,输入一个向量,对向量进行加权处理输入到隐含层神经元的激活函数中,再将函数的输出值进行加权处理最后得到输出层的值,典型的BP神经网络模型图如图1所示。

      图  1  BP神经网络模型[9]

      输入层的输入为$i = ({i_1},{i_2}, \cdots ,{i_n})$,输入单元经过加权处理后成为隐含层的输入${l_i}_{_k}$;隐含层神经单元个数为$p$,经过处理后,隐含层的输出为${l_{{o_p}}}$;隐含层的输出结果经过$w_{hj}$加权处理后成为输出层的输入${o_{{o_m}}}$;输出层神经元个数为$q$,输出层的输出为${o_{{o}}}$。当实际输出与期望输出之间的误差超出规定的精度时,进入误差的反向传播阶段。误差通过输出层按误差梯度下降的方式修正各层权值,向隐含层、输入层逐层反传。

    • ARIMA模型的全称叫做差分自相关移动平均模型,是统计模型中最常见的一种用来进行时间序列预测的模型[10-11]。ARIMA模型实质上是自回归模型(autoregressive model, AR)、移动平均模型(moving average model, MA)和差分法3种方法的整合。

    • 长短周期记忆神经网络通常被称为LSTM网络,是一种时间递归的神经网络,适合预测和处理有时间依赖的问题[12]。它有能力捕获过去阶段的数据,并使用过去一段时间某一事件时间特征来预测未来一段时间内的活动特点,在许多实际应用中展现了优异的性能[13]

      LSTM的网络架构是由一个个重复的神经元模块组成的链式结构[14]。每一个重复的神经元模块有4个神经网络层,且通过一种特殊的方式交互。LSTM的神经元模块结构如图2所示。

      图  2  LSTM神经元模块

      基于时间序列数据特点以及循环神经网络从简设计的原则,多变量LSTM预测模型框架如图3所示,该框架大致可分为输入层、数据处理层、LSTM层和输出层4个部分[14],其中$I = [{I_1},{I_2}, \cdot \cdot \cdot ,{I_L}]$为实际输入,${T_o} = [{T_o}_{_1},{T_o}_{_2}, \cdot \cdot \cdot ,{T_o}_{_L}]$为实际输出。

      本文所采用的数据为浮点型数据,利用LSTM进行预测时,首先将数据进行归一化处理。考虑到上一个时间段降水量和温度,构造时间序列数据集,并将时间序列问题转化为监督学习问题,以监督学习输出值作为预测结果进行多变量时间序列预测,最终预测当前时刻的着火情况(1表示着火,0表示未着火)。预测输出结果为一系列0~1之间的无量纲值,越接近0,说明着火的可能性越小,反之,越接近1说明着火可能性越大。

      图  3  多变量LSTM预测模型框架[14]

    • 澳大利亚位于南太平洋,南回归线横贯澳大利亚大陆中部,大部分地区在副热带高气压带和东南信风的控制下,炎热干燥。

      澳大利亚的北部夏天,来自赤道的西北风带来丰沛的降水,较为湿润,冬季受东南信风控制,为干季;中部受副高控制,形成干燥少雨的热带沙漠气候;南部、西南部位受到副高和西风带的交替控制,为地中海气候;最南端常年受西风控制,形成温带海洋性气候;西部沿海受东南信风和副高控制,加上沿岸的寒流影响,形成热带草原气候;东南沿海受暖流影响,比较湿润,形成亚热带湿润气候;东北部常年吹东南信风,降水丰沛,形成热带雨林气候[15]

      澳大利亚的植被分布呈明显半环状,即北、东、南三面以森林为主,向内逐步以草原植被为主,核心为荒漠植被。

    • 本文基于澳大利亚地图,根据气候和植被的分布特点划分59个节点。选取每个节点2018年1月1日−2020年4月1日的日最低降水量、最高温度和是否着火3项数据作为研究数据。本文以节点36为研究对象,对预测模型进行详细说明,节点36的日最高温度、最低降水量数据如图4所示。

      图  4  节点36的日最高温度、最低降水量数据

    • 为了构建基于多变量LSTM神经网络的澳大利亚大火预测模型,选取2018年1月1日−2020年1月10日的数据作为训练集,2020年1月11日−2020年3月31日的数据作为测试集。以日最高温度、最低降水量、是否着火作为模型变量输入,以测试集的均方根误差(RMSE)作为模型训练预测精度评价指标。

      为了提高模型预测精度,加快模型训练收敛速度,本文采用以下方法对原始变量时序集进行标准化处理[16],表示为:

      $${I_S} = \frac{{I - {I_{\min }}}}{{{I_{\max }} - {I_{\min }}}} ({\rm{MAX}} - {\rm{MIN}})$$ (1)

      式中,${\rm{MIN}} = 0$${\rm{MAX}} = 1$${I_S}$表示标准化后的值;$I$表示标准化前的值;${I_{\min }}$表示原始数据集中的最小值;${I_{\max }}$表示原始数据集中的最大值。

      接下来将标准化后的数据进行格式转换,利用移位函数重新创建存储下一时刻数据的数据帧,由于时间移动产生的空值将被删除,从而将时间序列问题转变成监督学习问题。

    • 根据LSTM模型结构[16],多变量LSTM神经网络预测模型训练步骤如下:

      1) 在输入层中,定义2018年1月1日−2020年3月31日的数据集为:

      $${F_n} = ({i_1},{i_2}, \cdots ,{i_t}, \cdots ,{i_n})$$ (2)

      式中,${i_t} = \left\{ {\left. {{a_t},{b_t},{c_t}} \right\}} \right.$${a_t}$${b_t}$${c_t}$分别表示t时刻对应的最高温度、最低降水量和是否着火。

      2) 对标准化处理和格式转换后的数据进行训练集和测试集划分,可表示为:

      $$F'_{{\rm{train}}} = (i'_1,i'_2, \cdots ,i'_m)$$ (3)
      $$F'_{{\rm{test}}} =(i'_{m + 1},i'_{m + 2}, \cdots ,i'_n)$$ (4)

      式中,$F'_{{\rm{train}}}$$F'_{{\rm{test}}}$分别表示数据处理后的训练集和测试集;训练集截止点m=740,测试集截止点n=820。

      3) 对数据$F'_{{\rm{train}}}$进行分割,设分割窗口长度为L=64,故分割后输入隐含层的数据集为:

      $$I = ({I_1},{I_2}, \cdots ,{I_t}, \cdots ,{I_L})$$ (5)
      $${I_t} =(i'_t,i'_{t + 1}, \cdots ,i'_{m - L + 1})$$ (6)

      式中,I为输入到隐含层L个细胞单元的数据集。

      4) 隐含层理论输出为:

      $$O = ({O_1},{O_2} \cdots ,{O_t}, \cdots ,{O_L})$$ (7)
      $${O_t} = (o'_{t + 1},o'_{t + 2}, \cdots ,o'_{m - L + t})$$ (8)

      实际输出为:

      $${T_o} = ({T_{{o_1}}},{T_{{o_2}}}, \cdots ,{T_{{o_t}}}, \cdots ,{T_{o{_L}}})$$ (9)
      $${T_{{o_t}}} = {\rm{LSTM}}({I_t},{G_{t - 1}},{o_{t - 1}})$$ (10)

      式中,LSTM为图2所示计算过程。

      5) 训练过程中均方误差(RMSE)作为损失计算公式:

      $${\rm{RMSE}} = \sum\limits_{i = 1}^{L(m - L)} {\frac{{{{({o_i} - {T_{{o_i}}})}^2}}}{{[L(m - L)]}}} $$ (11)

      式中,${o_i}$为理论输出;${T_{{o_i}}}$为实际输出。

      6) 以RMSE最小为优化目标,应用Adam优化算法更新权重,直到RMSE最小。

    • 为了验证多变量LSTM神经网络预测澳大利亚大火的优点,使用多变量LSTM神经网络与ARIMA神经网络和BP神经网络预测结果互相对比的方法进行分析。

      BP神经网络预测通常以相互影响的因素作为输入来预测剩余的单个因素,以日最高温度、最低降水量和是否着火作为互相影响的元素,利用BP神经网络分别对节点36从2020年1月11日−2020年3月14日的日最高温度进行预测;ARIMA预测对数据的平稳性有一定要求,通过对训练集数据进行平稳性检验和白噪声检验后,发现数据的平稳性较好,不需要进行差分处理,随即利用ARIMA对日最高温度进行了预测;多变量LSTM神经网络以日最高温度、最低降水量和是否着火三维数据作为输入,通过综合分析3种元素之间的相互影响,对日最高温度进行了预测。图5为利用BP与多变量LSTM对日最高温度的预测,图6为ARIMA与多变量LSTM对日最高温度的预测。

      图  5  BP与多变量LSTM对日最高温度的预测

      图  6  ARIMA与多变量LSTM对日最高温度的预测

      为了更直观地看出3种方法的优劣,本文利用评价指标均方根误差(RMSE)来刻画。BP神经网络的RMSE最大,为4.150;ARIMA的RMSE比BP神经网络略小,为4.012。多变量LSTM神经网络的RMSE最小,为3.862。这是因为BP神经网络在训练过程中未考虑时序变化规律,只考虑了因素之间的相互影响,总体预测效果明显比其他两种方法差;ARIMA模型没有考虑多个因素之间的相互影响,只是以日最高温度单个因素作为变量进行训练,然后根据日最高温度的时序性做出相应预测,因此预测效果一般,介于两者之间;多变量LSTM在预测过程中综合考虑了日最高温度、最低降水量和是否着火3个因素的相互影响,同时结合了时间序列依赖关系[17],因此预测效果最好。

      综上所述,BP、ARIMA和多变量LSTM3种预测模型中,基于多变量的LSTM预测模型预测效果最佳,有较高的可信度。基于以上结论,利用多变量LSTM、BP和ARIMA对节点36从2020年1月11日−2020年3月14日的着火可能性进行了预测,结果如图7所示。

      图  7  着火可能性预测

      利用RMSE对3种预测方法进行评价。其中,多变量LSTM的RMSE为0.238;ARIMA的RMSE为0.297;BP的RMSE最大,为0.359。由此可见多变量LSTM对澳大利亚大火的预测效果最好。

      由于BP神经网络方法存在梯度消失问题,不能很好地利用时间序列信息,所以预测结果与实际情况偏差较大;ARIMA是时间序列预测常用的方法,可以很好地处理有时间依赖的数据。不足的是ARIMA不能考虑其他因素对本变量的影响,所以ARIMA的预测结果不佳。LSTM多变量数据驱动的预测模型,通过添加门控制来解决神经网络出现的梯度消失或者梯度爆炸问题,并且可以结合考虑多个因素,预测结果与真实情况对比有较高的可靠性。

    • 本文采用BP、ARIMA、多变量LSTM神经网络模型对澳大利亚大火进行预测。经对比发现多变量LSTM预测效果最好,用多变量LSTM的方法将预测结果与实际值进行比较,预测结果有很高的可信度。LSTM是长短周期记忆神经网络,由于其模型中3种“门”的存在,使得其对于有时序性的数据有长时记忆的能力,对有周期性的数据预测精度较高。用来预测澳大利亚大火的数据是日最高温度、最低降水量以及着火点,这3类数据均具有周期性,这也是多变量LSTM预测效果比BP、ARIMA好的原因。实验表明该算法对大火预测的精度较高,可以用于对我国境内发生的大火进行预测,减少大火带来的危害。

参考文献 (17)

目录

    /

    返回文章
    返回