2. 广东省林业科学研究院, 广州 510520
土壤有机质(SOM)的预测方法有空间插值法、线性回归模型和回归克里格法等,这些方法常需要大量的样点并假设空间自相关。而在多样化的环境中进行SOM预测时,样点数据匮乏,SOM与环境之间的关系更多是非线性过程[1]。因此,学者开始用人工智能技术来解决难题。例如,Mcbratney等[2]使用人工神经网络(artificial neural network, ANN)模型预测土壤物理性质。Henderso等[3]使用决策树生成各种土壤性质图。这些模型大多是基于数字高程模型(DEM)衍生的地形和水文变量,模型输入数据源较单一。随着卫星遥感技术迅速发展,记录着更多土壤信息的遥感影像丰富了土壤制图的数据集[4]。以往研究表明,Landsat系列卫星的遥感影像最为广泛运用。例如,张法升等[5]利用Landsat 5影像预测了辽宁省阜新镇土壤表层的SOM,Wang等[6]使用Landsat 8影像预测表层土壤有机碳(SOC)的含量。他们发现,在森林地区进行土壤成分预测的关键环境变量是遥感数据。但是,Landsat 5遥感卫星早已退役,Landsat 7则由于内部故障使遥感影像出现条带,最新的Landsat 8的30 m分辨率影像还无法满足高精度的预测模型。在小区域中,Spot、Quick Bird等高分辨率遥感影像也有应用,但波段少、幅宽小,并且价格昂贵[7],对大尺度土壤预测难普及。高分一号(GF-1)是中国首颗高分辨率对地观测遥感卫星,对我国的遥感技术的发展具有重要的战略意义。目前GF-1影像大多用于森林检测、地物识别和灾害监测等,用于估测土壤成分的研究非常少,尚处于探索阶段。
本文将构建2个ANN模型,即以粗分辨率土壤图为基础,A模型的候选输入变量为DEM衍生出来的9个地形变量,B模型继承了A模型筛选出来的预测能力最强的地形变量,又增加从GF-1影像衍生的9个遥感变量,建立罗定市0 ~ 100 cm 5个土层SOM的ANN反演模型,探索GF-1号遥感影像的4个波段以及衍生的5个植被变量在预测SOM上的反演能力,为今后利用GF-1号遥感影像预测其他土壤成分的研究提供参考。
1 材料与方法 1.1 研究区概况研究区在广东省云浮市的罗定市(22°25′11″ ~ 22°57′34″N,111°03′08″ ~ 111°52′44″E),全市面积2 327.5 km2,其中森林面积约1 426.9 km2,森林覆盖率高达61.3%。研究区内雨热同期,具有高温高湿的特点,有利于植物生长。其中,热带季风森林类型占主导地位,主要包括天然次生常绿阔叶林、针叶林和混交林。在当地气候、地形和植被类型的共同作用下,罗定市主要以红壤和赤红壤为主。
1.2 数据来源及处理 1.2.1 土壤样点数据研究区的260个土壤样点数据由广东省林业科学研究院提供,具体采样时间在2015年11—12月(图 1)。样点数据由随机布点、专题布点和林分布点3种采样方案所得,充分代表了不同地形、植被和土壤类型等条件下的SOM特征。依据来自中科院南京土壤研究所全国土壤调查数据的SOM图(http://www.soilinfo.cn/map/index.aspx),将0 ~ 100 cm土壤剖面分为5层,即L1:0 ~ 20 cm,L2: 20 ~ 40 cm,L3: 40 ~ 60 cm,L4: 60 ~ 80 cm,L5:80 ~ 100 cm,采用重铬酸氧化–外加热法测定SOM含量。
在ArcGIS中将中科院南京土壤研究所1∶100万比例尺的SOM矢量图转化成1 000 m分辨率栅格图,即本研究用的粗分辨率SOM(coarse-resolution soil organic matter, CSOM)图,再采用传统的反距离加权插值法重采样至10 m分辨率。本文以CSOM代表区域内SOM的平均值,空间上的SOM变化主要由地形水文和植被环境影响。
1.2.3 DEM衍生的9个地形水文变量本研究的DEM数据来自广东省林业科学研究院从Cartosat-1 (IRS-P5)获得的立体图像,采用反距离加权插值法重采样至10 m分辨率。根据Zhao等[8-9]对土壤性质的研究,坡度(Slope)、坡向(Aspect)、地形位置指数(topographical position index, TPI)、潜在太阳辐射(potential solar radiation, PSR)、潜在地下水位深(depth to water, DTW)、泥沙输移比(sediment delivery ratio, SDR)、水流长度(flow length, FL)、水流流向(flow direction, FD)、土壤地形因素(soil terrain factor, STF)是预测模型较为优越的变量。9个地形水文变量主要参照Meng等[10]和Zhao等[8]的提取方法,利用ArcGIS中的空间分析工具和基于ArcGIS的脚本语言Avenue开发的森林水文工具从DEM获取。
1.2.4 GF-1号衍生的9个遥感变量综合考虑影像的能见度和采样时间,从地理空间数据云网站(http://www.gscloud.cn)选择覆盖研究区的7景8 m分辨率的GF-1多光谱遥感影像,波段范围为450 ~ 890 nm,成像时间为2014年10月8日3景,2014年1月23日3景,2013年11月15日1景。虽然,选取影像的成像时间不一致,某些影像也不在生长季内,但是罗定市属于亚热带季风气候,森林植被终年常绿,季节变化不明显,不同季节的影像相差不大。首先,利用ENVI5.3软件对遥感影像进行预处理,主要包括在“Radiometric Calibration”模块中完成辐射定标;再对影像进行FLASS大气校正,以消除图像中由大气散射引起的辐射误差;再选择“RCP Orthorectification Workflow”模块进行正射校正;最后进行镶嵌、裁剪和重采样(反距离加权插值法)至10 m分辨率。模型采用的遥感变量有蓝波段(B)、绿波段(G)、红波段(R)、近红外波段(NIR),旨在探索GF-1影像4波段在预测SOM上的能力。另外,利用ENVI5.3的Band math模块进行4种植被指数NDVI、DVI、RVI、RDVI的计算,用于反映植物生长状况。在遥感科学领域,这些植被指数对土壤背景的变化非常敏感,能较好地反映植被覆盖度和生长状况的差异,是植被生长的良好指标。
为了提高森林分类的准确性,在易康(eCognition)软件中采用分层分类方法对处理好的8 m分辨率的影像进行森林分类。分类样本数据从广东省林业科学研究院提供的森林小班矢量图的各个森林类型较大斑块的几何中心选取900个尽可能均匀分布的森林类型样点。将900个数据样点随机分成两份,600个用于分类训练,300个用于精度检验。根据eCognition的“Feature Space Optimization”选择可分离性最优的特征,先区分植被和非植被,在植被基础上再分林地和耕地,最后在林地上区分针叶林、阔叶林和混交林。分类精度评价使用eCognition中的基于样本的误差矩阵(Error Mateix based on Sample),针叶林、阔叶林和针叶林的总体精度为0.81,KIA为0.77。分类结果见图 1。由于森林分类技术的局限,无法对研究区内面积很小的灌木、竹林和其他类植被实现自动分类,则依据小班图进行人工分类[11],最后采用反距离加权插值法重采样至10 m分辨率。
1.3 研究方法 1.3.1 ANN模型结构本研究采用的ANN模型是基于Zhao等[9]构建的后向反馈人工神经网络模型。ANN模型具有3层结构:输入层、输出层和隐含层。输入层为模型预测自变量,本研究的输入自变量分为两种类型:必选变量和候选变量。必选变量是模型必定会纳入的数据,候选变量则是从一个至多个逐渐增加的组合输入模型。本研究构建的2种ANN模型主要区别在于模型的输入变量上。A模型(地形)输入层的必选变量为CSOM,候选变量为DEM衍生的9个地形水文变量,候选参数组合为
为了比较模型的性能,ANN模型采用10-fold Cross Validation(10重交叉验证)评估模型精度。具体采用3个模型精度评价指标,包括均方根误差(RMSE)、决定系数(R2)、相对整体精度(ROA±10%)。具体公式如下:
$ {\text{RMSE}} = \sqrt {\frac{{\sum\limits_{i = 1}^n {{{({Y_i} - {X_i})}^2}} }}{n}} $ | (1) |
$ {R^2} = \frac{{\sum\limits_{i - 1}^n {{{({X_i} - {Y_i})}^2}} }}{{\sum\limits_{i - 1}^n {{{({X_i} - \overline {{Y_i}} )}^2}} }} $ | (2) |
$ {\text{ROA}} = \frac{{\sum\limits_{i = 1}^n {\left\{ \begin{gathered} 1\;{\text{if}}\;{\text{abs}}\left( {\frac{{{Y_i} - {X_i}}}{{{X_i}}}} \right) \times 100 < T \hfill \\ \;\;\;\;\;\;\;\;\;\;\;\;\;0\;{\text{else}} \hfill \\ \end{gathered} \right\}} }}{n} \times 100 $ | (3) |
式中:Yi为预测值;Xi为模型的测量值;n为总样本数;
研究区采样点SOM含量的统计结果如表 1所示。SOM的变化范围在0.05 ~ 103.07 g/kg,其中L1土层的变化最大,在0.07 ~ 103.70 g/kg。SOM的平均含量和标准差随土壤深度增加而下降,深层土壤(L4、L5)的SOM约是表层(L1)的1/2。此外,每一层SOM的变异系数都比较高,都在50% 以上,研究区SOM的空间分布属于中等变异。
SOM与森林类型(Forest)等19个变量的Pearson相关关系如表 2所示。每层土壤的SOM均与CSOM显著正相关。在遥感变量中,每层土壤的SOM与多个遥感变量之间的相关性都显著,特别是与NDVI、RDVI。另外,每层土壤的SOM仅与少数地形变量的相关性显著。统计表明,本研究区的SOM与地形变量的线性关系较弱,与遥感变量线性关系较强。因此,本研究采用经典的机器学习算法——ANN模型来解决非线性的问题。
最优模型应在继续添加变量后精度不会显著提高,则该输入组合才是模型最优的变量组合。因此,最佳模型应具有较高的R2和ROA±10%,较低的RMSE。本研究2种模型的预测结果如表 3所示。在L1土层中,A模型(地形)逐渐添加地形水文变量后显著提高了模型的性能,ROA±10% 的值从35% 逐渐增加到47%、50%、56%、63%、72%,但进一步添加变量,ROA±10% 不再继续增加,甚至在增加到8个变量时ROA±10% 降到了63%。模型的RMSE和R2也都反映出相同的先改善后降低的趋势。因此,A模型预测L1土层SOM的最佳输入变量为6个,基于此选择方案,预测L2、L3、L4、L5土层SOM的最佳输入变量为6、7、5、6个。而对于B模型,预测5个土层SOM的最佳输入变量个数分别为6、4、6、6、7个。
从表 3可知,B模型与A模型相比普遍具有最低的RMSE,以及最高的R2和ROA±10%,因此,B模型的预测结果较佳。并且,可以观察到B模型对表层土壤(L1、L2)比对深层土壤(L3、L4、L5)的预测精度提高尺度更大。相对于A模型,B模型对L1、L2土层预测的R2提高了13% 和10%,而L3、L4、L5土层仅提高了4%、5%、4%。同样地,RMSE和ROA±10% 也表现出相似的趋势。这表明遥感影像在改善研究区SOM的预测能力方面是有一定的局限性,对于深层土壤改善不够显著。
2.4 研究区土壤有机质空间格局采用B模型筛选出的最优ANN模型,以10 m× 10 m的分辨率绘制罗定市森林土壤SOM的空间分布(图 2)。SOM的含量随着土层深度的加深而减少,其中,L1土层SOM含量最高,其空间分布含量普遍高于30 g/kg;L2土层SOM含量主要在20 ~ 30 g/kg;L3土层SOM含量则大多处在10 ~ 20 g/kg和20 ~ 30 g/kg等级;L4和L5土层SOM含量减少得更明显,主要在10 ~ 20 g/kg等级范围内。从水平结构的整体来看,每层土壤较高的SOM主要出现在阔叶林地区。
本研究主要探索GF-1的4个多光谱波段与衍生的5个植被变量对传统的地形水文ANN模型的影响,结果表明,GF-1衍生数据提高了地形水文土壤模型的预测精度。这一研究结果与Wang等[12]和Zhou等[13]的报告一致,他们认为全变量模型(地形水文+遥感)比地形水文模型预测更好。在改善地形水文模型的精度上,遥感数据对上层(0 ~ 40 cm)土壤的预测提升幅度较大,对深层(40 ~ 100 cm)土壤提升幅度较小。这与Kempen等[14]和Minasny等[15]的结果一致,他们都报道了土壤预测模型的性能随深度而下降。这可能是由于辅助环境变量的映射能力随着土壤深度加深而降低,所使用的大部分辅助数据不能有效地捕获这些土层(40 ~ 100 cm)的SOM变化,其不确定性随着土壤深度的增加而增加[9]。
通过最佳模型(B模型)的变量组合来看,所有遥感变量中森林类型(Forest)和NDVI对SOM含量表现出较强的预测能力。这与Winowiecki等[16]的研究一致,其发现有机碳的空间分布格局与植被类型及密度密切相关。在森林生态系统中,SOM的主要来源为植被凋落物,植被越密,凋落物越多。植被凋落物的特征也是影响SOM积累的重要原因,针叶类凋落叶分解速率较慢,不利于SOM的积累,而阔叶树凋落叶容易分解,促进SOM的积累[17]。一些落叶阔叶林还发生季节性落叶,增加了SOM的来源。植被指数广泛用于评估植被覆盖、生物量、作物产量和植物健康等植物状况。最优模型变量组合显示,NDVI、RDVI、DVI和RVI均有出现在不同土层的最优模型中。这些指标对植被覆盖、植被色素含量和叶片水分的变化最为敏感,已成功用于评估植被覆盖状况、预测土壤养分和土壤盐分[18-19]。考虑到土壤性质与植被覆盖状况的密切关系,植被指数可以反映土壤性质的变化。因此,可以引入光谱植被指数作为间接指标来了解SOM的状况。
遥感数据是数字土壤制图研究中应用广泛的辅助变量。但是,以往研究中极少探索GF-1数据在土壤制图中的应用。本研究发现,GF-1的4个波段作为ANN模型输入变量进行评估SOM是有效的。这与马驰[7]的结果一致,他应用GF-1的4个波段较好地预测了SOM的空间分布。另外,以往研究大多数都是采用了Moidis、Landsat和Sentinel等卫星的绿波段、红波段和近红外波段等,都未探索蓝波段与土壤性质的关系。而最优模型的变量组合显示GF-1的蓝波段对L1、L3土层的SOM预测具有一定的重要性。该结论与郭燕等[20]研究一致,她们发现GF-1的4个波段中,蓝波段与SOM的相关性最强。Streck等[21]认为,土壤电磁光谱可见光区和近红外区等的光谱反射率揭示了大量关于土壤条件的信息。事实上,土壤光谱数据受到土壤性质的影响,包括土壤SOM、植被、土壤质地、土壤水分、土壤盐分和氧化铁含量等。因此,光谱数据是研究和测绘土壤性质的一个很好的工具。
Pouladi等[22]使用遥感数据预测表层土壤有机碳含量,发现遥感变量解释了89% 的有机碳含量的空间变化,并认为当采样点足够密集时,无需在模型中引入其他环境变量。但本研究表明,地形水文变量在预测土壤性质时起到了很重要的作用,仅地形水文变量就可以解释70% 左右的SOM含量分布状况。并且,遥感变量对表土层的预测效果较好,对深层土壤预测效果较差。因此,地形水文环境变量是必要的,尤其是在地势起伏大的森林地区[23]。从本研究A模型筛选出来的最优变量组合来看,预测SOM含量的代表性地形水文变量是TPI和Slope。TPI反映的是研究点与其邻域内其他点的相对高度差[24]。TPI为下坡位和山谷地区,坡度较小,海拔较低,人类活动干扰多,土壤侵蚀严重,容易造成SOM流失。相反,在坡度大的山脊和上坡位地区,海拔较高,人类活动较少,土壤动物和微生物活跃,有利于SOM形成。海拔还通过影响小气候的形成,影响土壤动物和微生物的活性,进而影响SOM的积累。
从SOM的垂直分布来看,随着土壤深度的增加,SOM含量呈逐渐下降的趋势,这与邓小军等[25]对亚热带广西山地红壤区域的研究结果一致。主要原因是凋落物、土壤动物和微生物主要分布在土壤表层,且表层土壤通风、湿热条件优于深层土壤,使得SOM在表层积累较高[26]。从SOM的水平结构来看,SOM含量高的主要分布在阔叶林。这与最优模型的变量组合一致,森林类型(Forest)是5个土层SOM预测的最重要的变量。SOM的积累主要受到高等植物凋落物的性质,以及土壤动物和微生物的影响。阔叶林的凋落物比针叶林凋落物易分解。另外,罗定市主要的针叶树种是马尾松、杉木和桉树林等人工林,受到人类林业活动的影响较多,不利于SOM的积累。
本研究中,加上遥感变量的ANN模型在预测性能上得到了提高,但是,研究中存在不确定性。首先,数据采集和实验室分析中会存在一些采样误差和实验误差。其次,由于地形和云层的影响,高海拔地区在图像分割过程中易产生阴影,从而导致卫星图像数据中出现较大的反射率误差[13]。另外,陆地表面特性随时间的变化和遥感数据采集的时间也会影响预测结果。最后,本研究只从GF-1提取了9个遥感数据,可能未充分挖掘更好的遥感潜在变量。
4 结论本研究利用2种ANN模型预测了广东省云浮市罗定市森林土壤5个土层的SOM含量,结果表明,国产卫星GF-1号衍生的9个遥感变量对研究区SOM的预测是有效的,其对上层(L1和L2)森林土壤SOM的预测效果较好,遥感数据的加入使得基于地形水文数据的ANN土壤模型的精度(R2)分别提高了13% 和10%,而对40 cm以下深层土壤的预测性能提高较小,仅提高了4% 或5%,需要引入更多的遥感变量,如多光谱波段和全色波段的纹理特征等辅助变量来改善深层土壤的预测。因此,在未来的森林土壤制图中应注重选择和开发与植被相关的变量,进一步探索国产遥感卫星与土壤制图技术的结合,推动其在全国范围内林业、农业等方面的进一步应用与发展。
[1] |
McBratney A B, Odeh I O A, Bishop T F A, et al. An overview of pedometric techniques for use in soil survey[J]. Geoderma, 2000, 97(3/4): 293-327 (0) |
[2] |
McBratney A B, Mendonça Santos M L, Minasny B. On digital soil mapping[J]. Geoderma, 2003, 117(1/2): 3-52 (0) |
[3] |
Henderson B L, Bui E N, Moran C J, et al. Australia-wide predictions of soil properties using decision trees[J]. Geoderma, 2005, 124(3/4): 383-398 (0) |
[4] |
周萍, 王润生, 阎柏琨, 等. 高光谱遥感土壤有机质信息提取研究[J]. 地理科学进展, 2008, 27(5): 27-34 (0) |
[5] |
张法升, 曲威, 尹光华, 等. 基于多光谱遥感影像的表层土壤有机质空间格局反演[J]. 应用生态学报, 2010, 21(4): 883-888 (0) |
[6] |
Wang S, Gao J H, Zhuang Q L, et al. Multispectral remote sensing data are effective and robust in mapping regional forest soil organic carbon stocks in a northeast forest region in China[J]. Remote Sensing, 2020, 12(3): 393 DOI:10.3390/rs12030393 (0) |
[7] |
马驰. 基于GF-1土壤有机质含量估测的研究[J]. 西南农业学报, 2018, 31(1): 126-130 (0) |
[8] |
Zhao Z, Yang Q, Benoy G, et al. Using artificial neural network models to produce soil organic carbon content distribution maps across landscapes[J]. Canadian Journal of Soil Science, 2010, 90(1): 75-87 DOI:10.4141/CJSS08057 (0) |
[9] |
Zhao Z Y, Yang Q, Sun D X, et al. Extended model prediction of high-resolution soil organic matter over a large area using limited number of field samples[J]. Computers and Electronics in Agriculture, 2020, 169: 105172 DOI:10.1016/j.compag.2019.105172 (0) |
[10] |
Meng F R, Castonguay M, Ogilvie J, et al. Developing a GIS-based flow-channel and wet areas mapping framework for precision forestry planning[EB/OL]. Stellenbosch: IUFRO Precision Forestry Symposium, 2006.
(0) |
[11] |
孙庆林. 基于GF-2的八达岭林场主要森林类型分类方法研究[D]. 北京: 北京林业大学, 2017.
(0) |
[12] |
Wang S, Zhuang Q L, Jin X X, et al. Predicting soil organic carbon and soil nitrogen stocks in topsoil of forest ecosystems in northeastern China using remote sensing data[J]. Remote Sensing, 2020, 12(7): 1115 DOI:10.3390/rs12071115 (0) |
[13] |
Zhou T, Geng Y J, Chen J, et al. Mapping soil organic carbon content using multi-source remote sensing variables in the Heihe River Basin in China[J]. Ecological Indicators, 2020, 114: 106288 DOI:10.1016/j.ecolind.2020.106288 (0) |
[14] |
Kempen B, Brus D J, Stoorvogel J J. Three-dimensional mapping of soil organic matter content using soil type-specific depth functions[J]. Geoderma, 2011, 162(1/2): 107-123 (0) |
[15] |
Minasny B, McBratney A B, Malone B P, et al. Digital mapping of soil carbon[M]//Advances in Agronomy. Amsterdam: Elsevier, 2013: 1-47.
(0) |
[16] |
Winowiecki L, Vågen T G, Huising J. Effects of land cover on ecosystem services in Tanzania: A spatial assessment of soil organic carbon[J]. Geoderma, 2016, 263: 274-283 DOI:10.1016/j.geoderma.2015.03.010 (0) |
[17] |
王薪琪, 王传宽. 东北5种温带人工林表层土壤碳氮含量的分异[J]. 应用生态学报, 2019, 30(6): 1911-1918 (0) |
[18] |
Rivero R G, Grunwald S, Binford M W, et al. Integrating spectral indices into prediction models of soil phosphorus in a subtropical wetland[J]. Remote Sensing of Environment, 2009, 113(11): 2389-2402 DOI:10.1016/j.rse.2009.07.015 (0) |
[19] |
Taghizadeh-Mehrjardi R, Minasny B, Sarmadian F, et al. Digital mapping of soil salinity in Ardakan region, central Iran[J]. Geoderma, 2014, 213: 15-28 DOI:10.1016/j.geoderma.2013.07.020 (0) |
[20] |
郭燕, 程永政, 王来刚, 等. 利用高光谱和GF-1模拟多光谱进行土壤有机质预测和制图研究[J]. 土壤通报, 2016, 47(3): 537-542 (0) |
[21] |
Streck N A, Rundquist D, Connot J. Spectral signature of selected soils[J]. Agrometeorol, 2015, 11(1): 184 (0) |
[22] |
Pouladi N, Møller A B, Tabatabai S, et al. Mapping soil organic matter contents at field level with Cubist, Random Forest and kriging[J]. Geoderma, 2019, 342: 85-92 DOI:10.1016/j.geoderma.2019.02.019 (0) |
[23] |
Li X H, Ding J L, Liu J, et al. Digital mapping of soil organic carbon using sentinel series data: A case study of the ebinur lake watershed in Xinjiang[J]. Remote Sensing, 2021, 13(4): 769 DOI:10.3390/rs13040769 (0) |
[24] |
李小川, 丁晓纲. 广东省云浮市森林土壤养分调查与评价[M].
中国林业出版社, 北京, 2018
(0) |
[25] |
邓小军, 曹继钊, 宋贤冲, 等. 猫儿山自然保护区3种森林类型土壤养分垂直分布特征[J]. 生态科学, 2014, 33(6): 1129-1134 (0) |
[26] |
何林. 汝城县森林土壤养分含量的垂直分布规律[J]. 湖南林业科技, 1988, 15(1): 59-63 (0) |
2. Guangdong Academy of Forestry, Guangzhou 510520, China