-
地球表层的森林火灾是全球生态系统的调节器,它带来地表碳的突然扩散并借助大气输送,达到新的碳元素网络平衡。同时它促进热带、亚热带的碳流向温带、寒带流动与汇聚。但是,大量的森林火灾燃烧释放的二氧化碳气体聚集在温、寒带大气中,会导致气温升高、极地海冰消融和海平面升高。所以,监测和消除森林火灾是当今各国、各地区森林生态、环境保护的重要任务。
从全球火灾统计数据看,森林火灾主要分布在热带、亚热带、温带森林地区。火灾发生原因与森林可燃物的含水率大小密切相关。森林可燃物含水率(fuel moisture content, FMC)与叶子含水量不同,定义为森林植被中所包含的水的重量与干物质重量的比值。该参数作为监测指标,在森林火灾风险管理和火灾压力测试中起到重要作用。许多国家已经建立了通过遥感、遥测观察野火的FMC的预警系统,如美国农业部林务局、澳大利亚、加拿大、俄罗斯、中国、巴西等。在我国,遥感监测已经广泛地应用于国内日益增长的森林火灾预报与应急管理中。
纵观火灾学历史,早期的林火模型是在强大的物理、化学动力学理论基础上,由众多学者先后创立[1-4]。该模型根据能量守恒原理设定,以单位体积的可燃物在均匀的燃料床中蔓延推进的火势为前提条件。FMC概念通过“预先点燃热量”间接地引入该模型,预先点燃热量是使得单位重量的燃料点燃时所需的临界热量,它是燃料水分(Wm)与烘炉烘干之后的干叶子重量(Wd)的函数。同样地,由于叶子水分的阻尼效应,FMC的快速下降表示林火处于传播蔓延阶段,水分的存在使火灾反应速度低于其阈值。
文献[5-6]曾提出著名的病态(极端化)反演问题。文献[7]利用基于生态规则的多耦合物理模型(Prospect、GeoSAIL)并采用定量反演方法来解决问题。Prospect是叶片级辐射传输模型,GeoSAIL是冠层几何光学模型,它们的参数选择受地域影响,变动范围大,一般适用于卫星遥感的中低分辨率、宏观尺度的森林FMC监测。目前该物理模型尚不适合构建鲁棒性、实用性较强的县、区级以下的森林火灾监测系统。
对FMC研究的实证文献主要关注气象因素的研究,如降雨量、湿度、气温[1]。这种研究思路只考虑影响FMC的条件变量的一个维度。文献[2]研究了土壤条件以及地形坡度和方向,增加了变量的维度。不仅考虑了温度,也考虑了地形地面状况。最后,研究者们将森林植被和可燃物因素纳入知识框架。这些研究遵循了文献[8]确定的研究路径和方法,即把所有FMC影响因素分为3类:气象、植被、植被所处的土壤因素。
森林冠层可燃物含水率包含下列2个研究方向。
1) 植物理化
植被可燃物研究的复杂性在于植被、可燃物的多样性,它们包含不同层次的水:叶子、树冠、树干和根系[2]。火灾的点燃和蔓延由环境条件决定,如天气和土壤条件、燃料层的厚度、燃料的直径和生物化学成分[9]。通常FMC会根据树木的生存状态不同而分类计算,即分为死可燃物含水率(dead FMC, DFMC)或活可燃含水率(live FMC, LFMC)。虽然DFMC在很大程度上是由生态环境决定的,但好在LFMC具有较好植物稳定性,且LFMC可通过吸收地表层土壤中的水分来适应干旱天气,以应对植被的蒸腾作用[10]。故本文研究的对象是LFMC的水分特性。
2) 遥感物理
通过FMC进行火灾监测的最大困难是它需要实时、不间断地观察。一般在FMC研究中,数据通常由研究人员通过不同的地面实验来收集。依靠遥感数据的研究已被广泛用于评估火灾损失[11-12]。然而,当需要建立一个早期预警系统及需要进行更好的灭火管理时,对火灾前阶段的研究至关重要。遥感传感器通常分为被动式和主动式传感器[13-15]两大类型。被动式传感器测量被测物体反射的来自与仪器不同来源的辐射或物体本身发射的辐射。本文采用被动遥感为主,主动式遥感为辅的模式。
从1987年中国东北大兴安岭火灾开始,卫星遥感一直用于火灾管理研究。文献[16-18]研究了大安岭森林植被含水量,其中,可燃物不仅含有水,还含有影响火灾行为的灰物质。文献[7,19]用耦合辐射传输模型反演、统计回归等方法,分别研究了山西庆元县的林火灾后烈度和云南昆明市森林的FMC值。然而,关于中国东南地区亚热带丘陵山地的FMC反演的研究报道较少,这里分布着大量分散的亚热带常绿林、针阔混交林。这与东北地区的大兴安地区落叶林、针叶林景观的含水率都不同。考虑东西、南北之间的森林显著的生态含水率的异质性是本研究的重点。
-
地面样点的FMC来源于植被冠层中提取的叶片样本,并测定其鲜重和干重量(电烤箱烘干或自然爆晒干),叶子新鲜重量来自野外散装样品。
FMC的定义如下:
$$ {\rm{FMC}} = \frac{{F_{\rm{w}} - D_{\rm{w}}}}{{D_{\rm{w}}}} $$ (1) 式中,Fw是鲜叶重量;Dw是干叶重量。
FMC是森林冠层可燃性的一个关键控制变量。本文FMC的测量首先从实地采样的工作中测算得到,结果如图2所示。
横断面数据显示了森林冠层的FMC在样本时期的显著波动性和非线性。FMC平均值为1.513 8,水分重量大于自身干叶重量,表明在森林生长旺季期间,森林冠层含水量普遍较高,如图2所示。
箱型图是显示一组数据分散情况的统计图,不受异常值的影响,能够准确稳定地描绘出数据的离散分布情况,同时也利于数据清洗。图2b中间粗线为数据的中位数,长方形上边线是上四分位数,下边线为下四分位数,最上面的黑线为上限,最下面的是下限,超出上下限的数据称为异常值。从图2b可以看出第3、18、26、32等数据均为异常值,集中在较大值的一侧,说明分布呈现右偏态,且右尾部较重。
-
本文使用NDVI和NDII两种遥感光学指数。NDVI是归一化差异植被指数,由单个测量样地的不同波段反射值计算得出,具体如下:
$$ {\text{NDVI}} = \frac{{{\text{NIR}} - {\text{RED}}}}{{{\text{NIR}} + {\text{RED}}}} $$ (2) 式中,RED和NIR分别代表在红色(可见光)和近红外区域获得的光谱反射率测量值。根据设计,NDVI在−1.0~+1.0之间。
另一方面,NDII是归一化差异红外指数,是植被水分储存的另一个代表。NDII是基于近红外和短波红外(SWIR)反射带的比率:
$$ {\text{NDII}} = \frac{{{\text{NIR}} - {\text{SWIR}}}}{{{\text{NIR}} + {\text{SWIR}}}}$$ (3) 最初研究使用的是基于Gaden-6号最新的与地面同步接收的遥感图像。然而,深层(光学厚度)云层在卫星图像中相当多,因此改用过境的Sentinel-2A卫星数据。表1总结了NDVI和NDII的统计描述。
表 1 NDVI和NDII的统计学描述
参数类型 样点数 平均值 最小值 最大值 NDVI 113 0.6323 0.1540 0.8482 NDII 67 0.6677 0.1731 0.9749 -
常规回归方法的缺点是预先规定了变量之间的关系为线性,需要识别和解决一些常见的如多重共线性关系、内生性等问题。根据统计实验,从化区样点之间的变量的共线性较差,而机器学习方法可以克服这些问题,无需预先指定其函数公式。
考虑到所有因素之间的非线性,首先使用卫星RS的含水率指标(NDVI、NDII等)以及来自地面采样点的实测指标(如地面温度ST和树冠宽度TD),本文使用4种机器学习方法。
-
本文分析了3种经典的机器学习算法:常规线性回归、梯度提升回归、Xgboost的估算与反演,在此基础上提出综合投票法。
1) 常规线性回归方法
对于采样点的实验数据,常规线性回归适用于3种类型因素的变量,即:① 气象变量,包括温度、湿度等直接气象变量和116个采样点地块的纬度、经度等间接气象变量;② 土壤变量,如采样点地块的面积、地表温度;③ 植被变量,如树高、树冠直径、叶面积指数(LAI)、干叶重量、冠层叶子湿重量、树木的种类,包括两个主要的RS指标NDVI和NDII。根据式(4)可知,反演FMC的关键变量是这两个RS指标,其余都是控制变量:
$$ {\text{FMC}} = \alpha + \beta \left( {{\text{kv}}} \right) + \omega \left( {{\text{cv}}} \right) $$ (4) 式中,α为截距;β、ω为斜率系数;kv为关键变量;cv为控制变量。估计结果见表2。
表 2 使用常规线性回归的估计结果
变量 系数 T-值 Intercept (截距) 0.017 0 0.471 树冠直径 0.912 0 2.274 NDVI 1.274 0 4.012 NDII −3.437 0 −1.308 在解决了NDVI和NDII之间的多重共线性以及FMC和RS指标之间可能存在的内生性问题后,本文采用统计学中“工具变量分析”法,其中,RS指标中的NDVI较显著,表明FMC有主要相关对象,系数为1.274 0。此外,植被变量中,只有1个指标是显著的,即树冠直径,其他几乎所有的间接和野外直接测量的气象变量在本研究中都不明显。
2) 梯度提升回归算法
梯度提升回归算法是多种学习算法的集成,它结合了建立在多个基础估计值基础上的预测结果,从而提高单一估计值的可靠性。该算法的优点是:①自适应处理缺失数据(如亚热带雨季导致观测数据的缺失中断);②对于噪声数据不敏感(如云块、雾霾噪声对卫星数据的干扰);③能拟合复杂的非线性关系(FMC与遥感NDVI、NDII、LAI数据之间的非线性关联性);④预测精确度较高;⑤防止机器学习的过度拟合缺陷。
3) Xgboost算法
Xgboost算法能够减少模型过拟合程度;算法集成多种基础函数,具有较高的预测能力,成为本文FMC数据精准预测的较佳选择;其同时兼有有线性模型和树模型算法的优点,比现有的梯度提升技术更快速。
4) 综合投票法
以上3种算法各有优缺点,故采用综合投票法对3种算法进行优化组合,以求发挥遥感大数据的科学性、鲁棒性和高效实用性。
全部样点数据集按照3:1的比例划分为训练集和预测集样本。在进行预测时,分别使用剩余数据的三分之一和整个数据集,目的在于用两个不同的数据集来比较建模的精度。
综合投票回归算法是对上述3种算法中的每种各自分配其权重来计算运行。本文研究使用的主要变量是在常规线性回归中被确认为显著的变量,再加上其他控制变量。此算法在很大程度上依赖于分配给3个回归算法中每一个的权重,权重或分数规定如下:
$$ \begin{split} &{\text{Score}} = \left( {1 - \frac{{{u}}}{{{v}}}} \right) \\ {\rm{where}}{\text{ }}u = & {\left( {{{{y}}_{{\text{true}}}} - {{{y}}_{{\text{pred}}}}} \right)^2}{\text{sum}}\left( {} \right) \\ v =& {({{{y}}_{{\text{true}}}} - {{{y}}_{{\text{true}}}}{\text{mean}}())^2}{\text{sum}}() \\ \end{split} $$ (6) 式中,u为地面实测值与预测值差值的平方和;v为地面实测值与其平均值差的平方和;Score为权重值,该值越大,预测性能就越好。3种算法的计算得分分别为0.090 5、0.874 6、0.869 3。
-
用均方和误差来计算4种方法的预测误差。计算如式(6)所示,结果如表3所示。可以看出,综合投票回归法得出的MSE在测试样本中的统计结果最低,因此该方法将用于未来的FMC预测。
$$ {\text{RMSE}} = \sqrt {{\sum {{({y_i} - y_i^ \leftrightarrow )}^2}}/n} $$ (7) 表 3 不同算法下样本的MSE比较
算法名称 MSE(测试样本) MSE (全部样本) 常规线性回归 1 570.18 2 960.72 梯度提升回归 1 417.95 99.42 Xgboost 1 509.78 132.09 综合投票法 1 274.29 146.42 由此可见,测试样本的综合投票回归算法得出了最小的预测误差1 274.29;而全样本均方和误差远低于常规线性回归的误差值,且接近其他两种机器学习方法的误差值。除此之外,综合投票回归算法还有计算速度快、变量少而精的特点。因此,综合投票法成为使用NDVI和树冠直径等变量预测FMC的最可靠方法。
Remote Sensing Retrieval of FMC in Subtropical Forests of Guangdong Based on Satellite Multispectral Data
-
摘要: 通过森林可燃物含水率(FMC)监测评估植被活叶的水分状况,探究可燃物水分含水率与植被本身的微观特征及植被的环境条件的关系,包括森林几何特征因子(如树高、冠幅宽度)和森林水分特征因子(NDVI、NDII)。除具有传统的线性关联外,森林的特征变量之间存在非线性关系。采用常规线性回归、XGboost、 梯度提升回归3种经典的机器学习算法预测FMC。最后,通过分配权重整合这3种算法,构成新的“综合投票回归”方法。计算结果与样点初始值相关性最好,误差最低。该研究基于卫星遥感反演的低成本、准实时的FMC指数,可为制定森林火灾风险管理策略提供理论支撑和森林可燃物水分的时空分布数据。
-
关键词:
- 综合投票回归算法 /
- 可燃物含水率 /
- 广东亚热带森林 /
- 机器学习 /
- Sentinel-2A
Abstract: Forest fires caused by climate warming and human activities are the main disasters of subtropical forests in Guangdong in autumn and winter. We selected 116 satellite ground synchronous sampling sites in the subtropical forest area of Conghua District, Guangzhou City, Guangdong Province, to monitor and evaluate the water status of vegetation living leaves by forest fuel moisture content (FMC), and to explore the relationship between fuel water content and vegetation micro-characteristics and vegetation environmental conditions, including forest geometric characteristics (such as tree height, crown width) and forest water characteristic factors (such as NDVI, NDII). In addition to the traditional linear correlation, we also find that there is a nonlinear relationship among the characteristic variables of the forest, and the determination coefficient R2 is 0.88. We have adopted three different classical machine learning algorithms, including conventional linear regression, XGboost and Gradient Boosting Regression algorithms to predict FMC. Finally, the new "comprehensive voting regression" method, which integrates the three algorithms by allocating weights, has the best correlation with the initial values of the sample points and the lowest error, so this method is used to predict the FMC of the whole region, and the prediction accuracy of the sample points can reach 86%~ 87%. The low-cost and quasi-real-time FMC index based on satellite remote sensing can provide solid theory and temporal and spatial distribution data of forest fuel moisture when formulating forest fire risk management strategies. -
表 1 NDVI和NDII的统计学描述
参数类型 样点数 平均值 最小值 最大值 NDVI 113 0.6323 0.1540 0.8482 NDII 67 0.6677 0.1731 0.9749 表 2 使用常规线性回归的估计结果
变量 系数 T-值 Intercept (截距) 0.017 0 0.471 树冠直径 0.912 0 2.274 NDVI 1.274 0 4.012 NDII −3.437 0 −1.308 表 3 不同算法下样本的MSE比较
算法名称 MSE(测试样本) MSE (全部样本) 常规线性回归 1 570.18 2 960.72 梯度提升回归 1 417.95 99.42 Xgboost 1 509.78 132.09 综合投票法 1 274.29 146.42 -
[1] ROTHERMEL R C. A mathematical model for predicting fire spread in wild land fuels[R]. [S.l.]: United States Department of Agriculture, 1972. [2] WAGNERV C E. Conditions for the start and spread of crown fire[J]. Revue Canadienne de Recherche Forestière, 1977, 7(1): 23-34. [3] ANDREWS P L, CAROLYN H C. BEHAVE: Fire behavior prediction and fuel modeling system-burn subsystem, Part 2[M]. [S.l.]: United States Department of Agriculture, 1989. [4] da CRUZM G. Modeling the initiation and spread of crown fires[D]. Montana: The University of Montana, 1999. [5] 李小文. 定量遥感的发展与创新[J]. 河南大学学报(自然科学版), 2005, 35(4): 49-56. LI X W. Retrospect prospect and innovation in quantitative remote sensing[J]. Journal of Henan University (Natural Science). 2005, 35(4): 49-56. [6] 李小文, 王锦地, 胡宝新, 等. 先验知识在遥感反演中的作用[J]. 中国科学(D辑), 1998, 28(1): 67-72. doi: 10.1007/BF02878739 LI X W, WANG J D, HU B X, et al. On utilization of prior knowledge in inversion of remote sensing models[J]. Science in China (Series D), 1998, 28(1): 67-72. doi: 10.1007/BF02878739 [7] 全兴文, 何彬彬, 刘向茁, 等. 多模型耦合下的植被冠层可燃物含水率遥感反演[J]. 遥感学报, 2019, 23(1): 62-77. QUAN X W, HE B B, LIU X Z, et al. Retrieval of fuel moisture content by using radiative transfer models from optical remote sensing data[J]. Journal of Remote Sensing, 2019, 23(1): 62-77. [8] PYNE S J, ANDREWS P L, LAVEN R D. Introduction to wildland fire[M]. New York: Wiley, 1996. [9] YEBRA M, PHILIP E D, CHUVIECO E, et al. A global review of remote sensing of live fuel moisture content for fire danger assessment: Moving towards operational products[J]. Remote Sensing of Environment, 2013, 136: 455-468. doi: 10.1016/j.rse.2013.05.029 [10] VIEGAS D X, VIEGAS M, FERREIRA A D. Moisture content of fine forest fuels and fire occurrence in central portugal[J]. International Journal of Wildland Fire, 1992, 2(2): 69-86. doi: 10.1071/WF9920069 [11] CHUVIECO E C, DAVID R, et al. Combining NDVI and surface temperature for the estimation of live fuel moisture content in forest fire danger rating[J]. Remote Sensing of Environment, 2004, 92(3): 322-331. doi: 10.1016/j.rse.2004.01.019 [12] DANSON F M, BOWYER P. Estimating live fuel moisture content from remotely sensed reflectance[J]. Remote Sensing of Environment, 2004, 92: 309-321. doi: 10.1016/j.rse.2004.03.017 [13] PAUL M M, BRUCE C, SUN G Q, et al. Achieving accuracy requirements for forest biomass mapping: A spaceborne data fusion method for estimating forest biomass and LiDAR sampling error[J]. Remote Sensing of Environment, 2013, 130(5): 153-170. [14] QUEMADA C, PÉREZ-ESCUDERO J M, GONZALO R, et al. Remote sensing for plant water content monitoring: A review[J]. Remote Sensing, 2021, 13(11): 2088. doi: 10.3390/rs13112088 [15] WU Z P, ZHANG P, HUANG L, et al. A micro-uav-radar system for vegetation height inversion: A feasibility study[EB/OL]. [2021-10-08]. https://ieeexplore.ieee.org/document/9574231/2021. [16] 蔡文华, 杨健, 刘志华, 等. 黑龙江省大兴安岭林区火烧迹地森林更新及其影响因子[J]. 生态学报, 2012, 32(11): 3303-3312. CAI W H, YANG J, LI Z H, et al. Controls of post-fire tree recruitment in great Xing'An mountains in Heilongjiang province[J]. Acta Ecologica Sinica, 2012, 32(11): 3303-3312. [17] 郭焘. 锡林郭勒草原土壤含水量分布特征研究[D]. 呼和浩特: 内蒙古师范大学, 2018. GUO T. Study on distribution characteristics of soil water content in Xilinggol grassland[D]. Huhhot: Inner Mongolia Normal University, 2018. [18] 孙龙, 刘祺, 胡同欣. 森林地表死可燃物含水率预测模型研究进展[J]. 林业科学, 2021, 57(4): 142-152. SUN L, LIU Q, HU T X. Advances in research on prediction model of moisture content of surface dead fuel in forests[J], Scientia Silvae Sinicae, 2021, 57(4): 142-152. [19] YIN C M, HE B B, QUAN X W, et al. Remote sensing of burn severity using coupled radiative transfer model: A case study on chinese Qinyuan pine fires[J]. Remote Sensing, 2020, 12(21): 3590-3608. doi: 10.3390/rs12213590