-
丛林大火是澳大利亚炎热干燥季节频繁发生的野外火灾,由于火灾时常交替发生,自然生态系统随之演变,丛林大火成为了澳大利亚生态的重要组成部分[1]。随着全球气温升高,澳大利亚大火愈发猛烈且不可控制。2019年7月以来,澳大利亚全境发生持续性的丛林大火[2],造成了巨大的损失。据澳大利亚联邦统计,大火总燃烧面积约1.7×107 hm2,全国超过10亿只动物因大火而丧生。澳大利亚大火造成的影响不止当地的损失,大火的连锁反应导致它成为一个全球性的问题,对人类生存有极大的消极影响,如引起CO2排放量上升、污染水源、破坏生态系统等[3]。
本文首先对森林火灾发生的必要因素[4]进行了分析,影响森林火灾发生的主要因素包括燃料、氧气和火源。山火蔓延的烈度和速度取决于环境温度、燃料湿度、风速和坡度。桉树、刺槐等易燃植物的分布是火灾发生的根本依据,干燥的燃料会燃烧得很快,而潮湿或湿的燃料不易发生火灾,所以降雨量是评估山火的重要考虑因素;环境温度越高,越有可能发生火灾,因此环境温度也是预测森林火灾重要指标。
针对澳大利亚大火的预测,已有一些学者进行了研究,如文献[5]利用前馈反馈、多层感知等神经网络的方法预测澳大利亚最有可能发生火灾的地点。但是这种神经网络模型容易出现梯度消失或者梯度爆炸问题;文献[6]通过元胞自动机来模拟森林的生长-火灾-恢复过程,构建自然因素与火灾蔓延关系的模型。可是预测该模型没有考虑澳大利亚真实历史数据,预测结果与实际情况存在偏差。
综合分析以上原因,本文以气候分布、植被分布、降水量和温度作为依据建立了LSTM(long short-term memory)多变量数据驱动预测模型,通过添加门控制来解决神经网络出现的梯度消失或者梯度爆炸问题,利用有时间依赖的数据进行预测,同时与BP(back-propagation)和ARIMA(autoregressive integrated moving average model)进行对比,多变量LSTM预测效果良好,有较高的可信度。
-
为了构建基于多变量LSTM神经网络的澳大利亚大火预测模型,选取2018年1月1日−2020年1月10日的数据作为训练集,2020年1月11日−2020年3月31日的数据作为测试集。以日最高温度、最低降水量、是否着火作为模型变量输入,以测试集的均方根误差(RMSE)作为模型训练预测精度评价指标。
为了提高模型预测精度,加快模型训练收敛速度,本文采用以下方法对原始变量时序集进行标准化处理[16],表示为:
$${I_S} = \frac{{I - {I_{\min }}}}{{{I_{\max }} - {I_{\min }}}} ({\rm{MAX}} - {\rm{MIN}})$$ (1) 式中,
${\rm{MIN}} = 0$ ;${\rm{MAX}} = 1$ ;${I_S}$ 表示标准化后的值;$I$ 表示标准化前的值;${I_{\min }}$ 表示原始数据集中的最小值;${I_{\max }}$ 表示原始数据集中的最大值。接下来将标准化后的数据进行格式转换,利用移位函数重新创建存储下一时刻数据的数据帧,由于时间移动产生的空值将被删除,从而将时间序列问题转变成监督学习问题。
-
根据LSTM模型结构[16],多变量LSTM神经网络预测模型训练步骤如下:
1) 在输入层中,定义2018年1月1日−2020年3月31日的数据集为:
$${F_n} = ({i_1},{i_2}, \cdots ,{i_t}, \cdots ,{i_n})$$ (2) 式中,
${i_t} = \left\{ {\left. {{a_t},{b_t},{c_t}} \right\}} \right.$ ,${a_t}$ 、${b_t}$ 、${c_t}$ 分别表示t时刻对应的最高温度、最低降水量和是否着火。2) 对标准化处理和格式转换后的数据进行训练集和测试集划分,可表示为:
$$F'_{{\rm{train}}} = (i'_1,i'_2, \cdots ,i'_m)$$ (3) $$F'_{{\rm{test}}} =(i'_{m + 1},i'_{m + 2}, \cdots ,i'_n)$$ (4) 式中,
$F'_{{\rm{train}}}$ 、$F'_{{\rm{test}}}$ 分别表示数据处理后的训练集和测试集;训练集截止点m=740,测试集截止点n=820。3) 对数据
$F'_{{\rm{train}}}$ 进行分割,设分割窗口长度为L=64,故分割后输入隐含层的数据集为:$$I = ({I_1},{I_2}, \cdots ,{I_t}, \cdots ,{I_L})$$ (5) $${I_t} =(i'_t,i'_{t + 1}, \cdots ,i'_{m - L + 1})$$ (6) 式中,I为输入到隐含层L个细胞单元的数据集。
4) 隐含层理论输出为:
$$O = ({O_1},{O_2} \cdots ,{O_t}, \cdots ,{O_L})$$ (7) $${O_t} = (o'_{t + 1},o'_{t + 2}, \cdots ,o'_{m - L + t})$$ (8) 实际输出为:
$${T_o} = ({T_{{o_1}}},{T_{{o_2}}}, \cdots ,{T_{{o_t}}}, \cdots ,{T_{o{_L}}})$$ (9) $${T_{{o_t}}} = {\rm{LSTM}}({I_t},{G_{t - 1}},{o_{t - 1}})$$ (10) 式中,LSTM为图2所示计算过程。
5) 训练过程中均方误差(RMSE)作为损失计算公式:
$${\rm{RMSE}} = \sum\limits_{i = 1}^{L(m - L)} {\frac{{{{({o_i} - {T_{{o_i}}})}^2}}}{{[L(m - L)]}}} $$ (11) 式中,
${o_i}$ 为理论输出;${T_{{o_i}}}$ 为实际输出。6) 以RMSE最小为优化目标,应用Adam优化算法更新权重,直到RMSE最小。
-
为了验证多变量LSTM神经网络预测澳大利亚大火的优点,使用多变量LSTM神经网络与ARIMA神经网络和BP神经网络预测结果互相对比的方法进行分析。
BP神经网络预测通常以相互影响的因素作为输入来预测剩余的单个因素,以日最高温度、最低降水量和是否着火作为互相影响的元素,利用BP神经网络分别对节点36从2020年1月11日−2020年3月14日的日最高温度进行预测;ARIMA预测对数据的平稳性有一定要求,通过对训练集数据进行平稳性检验和白噪声检验后,发现数据的平稳性较好,不需要进行差分处理,随即利用ARIMA对日最高温度进行了预测;多变量LSTM神经网络以日最高温度、最低降水量和是否着火三维数据作为输入,通过综合分析3种元素之间的相互影响,对日最高温度进行了预测。图5为利用BP与多变量LSTM对日最高温度的预测,图6为ARIMA与多变量LSTM对日最高温度的预测。
为了更直观地看出3种方法的优劣,本文利用评价指标均方根误差(RMSE)来刻画。BP神经网络的RMSE最大,为4.150;ARIMA的RMSE比BP神经网络略小,为4.012。多变量LSTM神经网络的RMSE最小,为3.862。这是因为BP神经网络在训练过程中未考虑时序变化规律,只考虑了因素之间的相互影响,总体预测效果明显比其他两种方法差;ARIMA模型没有考虑多个因素之间的相互影响,只是以日最高温度单个因素作为变量进行训练,然后根据日最高温度的时序性做出相应预测,因此预测效果一般,介于两者之间;多变量LSTM在预测过程中综合考虑了日最高温度、最低降水量和是否着火3个因素的相互影响,同时结合了时间序列依赖关系[17],因此预测效果最好。
综上所述,BP、ARIMA和多变量LSTM3种预测模型中,基于多变量的LSTM预测模型预测效果最佳,有较高的可信度。基于以上结论,利用多变量LSTM、BP和ARIMA对节点36从2020年1月11日−2020年3月14日的着火可能性进行了预测,结果如图7所示。
利用RMSE对3种预测方法进行评价。其中,多变量LSTM的RMSE为0.238;ARIMA的RMSE为0.297;BP的RMSE最大,为0.359。由此可见多变量LSTM对澳大利亚大火的预测效果最好。
由于BP神经网络方法存在梯度消失问题,不能很好地利用时间序列信息,所以预测结果与实际情况偏差较大;ARIMA是时间序列预测常用的方法,可以很好地处理有时间依赖的数据。不足的是ARIMA不能考虑其他因素对本变量的影响,所以ARIMA的预测结果不佳。LSTM多变量数据驱动的预测模型,通过添加门控制来解决神经网络出现的梯度消失或者梯度爆炸问题,并且可以结合考虑多个因素,预测结果与真实情况对比有较高的可靠性。
Multivariable LSTM Neural Network Model for Australia Fire Prediction
-
摘要: 长短周期记忆神经网络(LSTM)受益于能够捕获长期依赖关系的特点,在许多实际应用中展现了优异的性能。该文构建了LSTM多变量数据驱动的预测模型,通过多变量输入的方式预测澳大利亚森林大火。首先使用多变量LSTM预测模型对日最高温度进行预测,并与反向传播(BP)神经网络以及ARIMA预测模型的结果进行对比。研究表明:以相关变量为输入的BP神经网络无法考虑时序变化规律,预测误差最大;以温度单变量为输入的ARIMA根据时序变化做出相应预测,预测效果较好;多变量LSTM预测模型综合考虑了多种因素的相互影响,同时结合了时间序列依赖关系,预测效果最好。最后通过多变量LSTM预测模型对某节点是否着火进行了预测,预测结果与实际值契合较好。总体来说,多变量LSTM预测模型对澳大利亚大火的预测结果可信。
-
关键词:
- 澳大利亚大火 /
- 深度学习 /
- 长短周期记忆神经网络(LSTM) /
- 多变量 /
- 神经网络
Abstract: Long Short-Term Memory (LSTM) neural network benefits from its ability to capture long-term dependencies and has shown excellent performance in many practical applications. Multivariable LSTM data-driven prediction model is constructed in this paper to predict Australian forest fires by multivariable input. Firstly, the multivariate LSTM prediction model is used to predict the maximum daily temperature, and the results are compared with those of the back-propagation (BP) neural network and Autoregressive Integrated Moving Average model (ARIMA) prediction model. The results show that the BP neural network with the related variables as input cannot consider the time-series variation law, and the prediction error is the largest. ARIMA with single temperature as input makes corresponding prediction according to time series change, and the prediction effect is good. Multivariable LSTM prediction model comprehensively considers the interaction of many factors, and combines the time series dependence, the prediction effect is the best. Finally, the multivariable LSTM prediction model is used to predict whether a node is on fire, and the prediction results are in good agreement with the actual value. Overall, the multivariable LSTM prediction model is reliable in predicting the Australian fires.-
Key words:
- Australia fire /
- deep learning /
- long short-term memory /
- multivariate /
- neural network
-
图 1 BP神经网络模型[9]
图 3 多变量LSTM预测模型框架[14]
-
[1] 白夜, 武英达, 贾宜松, 等. 2019-2020年澳大利亚气候异常与山火爆发的关系分析及应对策略[J]. 中国应急救援, 2020, 2: 23-27. doi: 10.3969/j.issn.1673-5579.2020.02.006 BAI Ye, WU Ying-da, JIA Yi-song, et al. Link between climate anomaly and Australia bushfires in 2019-2020[J]. China Emergency Rescue, 2020, 2: 23-27. doi: 10.3969/j.issn.1673-5579.2020.02.006 [2] 张勇. 澳大利亚山林大火的经验教训及启示[J]. 中国应急救援, 2020, 2: 8-12. doi: 10.3969/j.issn.1673-5579.2020.02.003 ZHANG Yong. Experience and lessons learned from Australia bushfires[J]. China Emergency Rescue, 2020, 2: 8-12. doi: 10.3969/j.issn.1673-5579.2020.02.003 [3] 张志强. 澳洲山火对我国森林消防体系建设的启示[J]. 中国应急救援, 2020, 2: 13-17. doi: 10.3969/j.issn.1673-5579.2020.06.004 ZHANG Zhi-qiang. Construction of China’s forest firefighting system: Lessons learned from Australia bushfires[J]. China Emergency Rescue, 2020, 2: 13-17. doi: 10.3969/j.issn.1673-5579.2020.06.004 [4] GRANGED A J, JORDAN A, ZAVALA L M, et al. Short-term effects of experimental fire for a soil under eucalyptus forest (SE Australia)[J]. Geoderma, 2011, 167: 125-134. [5] DAS A, DUTTA R, ARYAL J. A hybrid neural network based Australian wildfire prediction: A novel approach using environmental and satellite imagery[J]. Lancet, 2013, 3239: 564-565. [6] 李诚信, 赵良辰, 李东运, 等. 基于CA系统的澳大利亚森林火灾蔓延预测模型及应急物资调度应用[J]. 林业调查规划, 2020, 5: 62-69. doi: 10.3969/j.issn.1671-3168.2020.05.011 LI Cheng-xin, ZHAO Liang-chen, LI Dong-yun, et al. Prediction model of forest fire extension in Australia and application of emergency materials dispatching based on CA system[J]. Forest Inventory and Planning, 2020, 5: 62-69. doi: 10.3969/j.issn.1671-3168.2020.05.011 [7] PINEDA F J. Generalization of back-propagation to recurrent neural networks[J]. Physical Review Letters, 1987, 59(19): 602-611. [8] CHANG T C, CHAO R J. Application of back-propagation networks in debris flow prediction[J]. Engineering Geology, 2006, 85(3-4): 270-280. doi: 10.1016/j.enggeo.2006.02.007 [9] 林森, 李志蜀. 用P-BP预测网络模型预测通信网络指标[J]. 计算机应用, 2006, 26(7): 1709-1712. LIN Sen, LI Zhi-shu. Data prediction in commun ication network using P-BP predicting network[J]. Computer Applications, 2006, 26(7): 1709-1712. [10] SANGSOO L, DANIEL F, SANGSOO L, et al. Application of subset autoregressive integrated moving average model for short-term freeway traffic volume forecasting[J]. Transportation Research Record Journal of the Transportation Research Board, 1999, 1678(1): 179-188. doi: 10.3141/1678-22 [11] 李焱, 高强, 王勇, 等. 乘积季节模型在软件老化评估中的应用研究[J]. 电子科技大学学报, 2017, 46(3): 583-587. doi: 10.3969/j.issn.1001-0548.2017.03.017 LI Yan, GAO Qiang, WANG Yong, et al. Software aging evaluation method using multiplicative seasonal ARIMA model[J]. Journal of University of Electronic Science and Technology of China, 2017, 46(3): 583-587. doi: 10.3969/j.issn.1001-0548.2017.03.017 [12] HOCHREITER S, SCHMIDHUBER J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735-1780. doi: 10.1162/neco.1997.9.8.1735 [13] 刘菲, 郝风杰, 郝敬全, 等. 基于优化LSTM模型的停车泊位预测算法[J]. 计算机应用, 2019, 39(S1): 65-69. LIU Fei, HAO Feng-jie, HAO Jing-quan, et al. Parking prediction algorithm based on optimized LSTM model[J]. Computer Applications, 2019, 39(S1): 65-69. [14] 闫佰忠, 孙剑, 王昕洲, 等. 基于多变量LSTM神经网络的地下水水位预测[J]. 吉林大学学报(地球科学版), 2020, 50(1): 208-216. YAN Bai-zhong, SUN Jian, WANG Xin-zhou, et al. Multivariable LSTM neural network model for grounderwater levels prediction[J]. Journal of Jilin University (Earth Science Edition), 2020, 50(1): 208-216. [15] 鲍艳, 吕世华, 刘海辉. 澳大利亚植被覆盖对亚澳季风影响的数值模拟(I): 对澳洲气候及冬季风的影响[J]. 高原气象, 2006, 25(5): 763-771. doi: 10.3321/j.issn:1000-0534.2006.05.001 BAO Yan, LÜ Shi-hua, LIU Hai-hui. Numerical simulation about impact of vegetation cover over Australian land on Asian-Australian monsoon (I): Impacts on regional climate and winter monsoon in Australia[J]. Plateau Meteology, 2006, 25(5): 763-771. doi: 10.3321/j.issn:1000-0534.2006.05.001 [16] 刘晶, 吴英飞, 袁贞明, 等. 基于多因素线索长短期记忆模型的血压分析预测[J]. 计算机应用, 2019, 39(5): 1551-1556. doi: 10.11772/j.issn.1001-9081.2018110008 LIU Jing, WU Ying-fei, YUAN Zhen-ming, et al. Blood pressure prediction with multi-factor cue long short-term memory model[J]. Computer Applications, 2019, 39(5): 1551-1556. doi: 10.11772/j.issn.1001-9081.2018110008 [17] KAREVAN Z, SUYKENS J A K. Transductive LSTM for time-series prediction: An application to weather forecasting[J]. Neural Networks, 2020, 125: 1-9. doi: 10.1016/j.neunet.2019.12.030