2. 土壤与农业可持续发展国家重点实验室(中国科学院南京土壤研究所),南京 210008
传统的土壤有机质含量测定方法较繁琐且成本高,无法满足大量样本快速监测土壤有机质的需求。高光谱技术可以快速、简便、无损耗地测定连续的地物光谱信息,从而较精确地预测土壤有机质的含量[1]。
国内外学者在利用高光谱预测土壤属性方面开展了较多的研究。如不同区域、不同土壤类型的高光谱特征及属性预测[3];不同的光谱处理[6]、不同的建模方法[9]等对土壤属性预测精度的影响。杨扬等[13]分析三江源区4种土壤类型的光谱特征以及预测有机质含量。Xu等[14]对丘陵地区不同成土母质的土壤有机质含量采用偏最小二乘回归方法建立高光谱预测模型。赵小敏等[15]分析江西省红壤地区4种主要土壤亚类及不同土属的高光谱特征。郭斗斗等[16]采用25种光谱处理方法结合3种建模方法,建立潮土有机质含量高光谱反演模型。于雷等[17]采用4种光谱指标建立江汉平原土壤有机质预测的偏最小二乘回归模型。王一丁等[18]采用3种光谱变换形式结合偏最小二乘回归法建立研究区域的有机质和全氮含量预测模型。刘磊等[19]采用3种光谱变换形式,分别运用偏最小二乘回归法和多元逐步回归方法建立红壤有机质含量估算模型。田永超等[20]采用3种建模方法结合不同光谱预处理方法建立土壤有机质含量预测模型。侯艳军等[21]采用一元线性回归方法、偏最小二乘回归法和多元逐步回归方法建立荒漠土壤有机质高光谱预测模型并进行比较。
目前对土壤有机质含量的光谱预测已经进行了大量研究,但对淮北平原区域不同土壤类型的光谱特性以及有机质的高光谱预测研究少有报道。淮北平原是淮河以北地区,位于安徽省北部,土壤类型主要包括砂姜黑土、潮土、潮棕壤、褐潮土等,土地利用以旱地为主,是我国重要粮食主产区之一。但是淮北平原气候易涝易旱,土壤肥力低,低产土壤约占耕地面积的60%,极大程度上限制了农业发展。
本研究以淮北平原的典型土壤砂姜黑土和黄褐土为研究对象,进行光谱采集和有机质测定,分析其光谱特征,比较不同光谱变换对土壤有机质含量光谱预测建模的影响。同时,根据光谱相似性对土壤样品进行分类,建立基于偏最小二乘回归的土壤有机质含量预测模型,比较土壤类型和光谱分类的有机质光谱预测精度,为快速有效测定淮北平原土壤有机质含量提供技术支持。
1 材料与方法 1.1 研究区概况本研究选择安徽省淮北平原中部典型的旱作农业区蒙城县为研究区。该县介于116°15′43″ ~ 116°49′ 25″E,32°55′29″ ~ 33°29′64″N,面积约2 091 km2,属暖温带半湿润季风区,光温条件充足,年均温14.8 ℃,年均降水量821.5 mm,无霜期211 d。地貌类型主要为剥蚀型构造残丘、剥蚀堆积平原和堆积平原,地势由西北向东南倾斜,海拔20 ~ 30 m。该区主要分布有砂姜黑土、黄褐土、黄潮土、潮棕壤等(图 1)。
采集土壤表层(0 ~ 20 cm)样品131个,主要包括砂姜黑土(108个)、黄褐土(23个)两种土壤类型,采用五点法混合采样。样品在室内经自然风干后用木棒碾磨,剔除砂砾及植物残体,然后过60目筛,采用重铬酸钾氧化滴定法测定有机质含量[22]。
土壤光谱测定采用Cary 5000分光光度计,该仪器波长在175 ~ 3 300 nm之间,本研究选用350 ~ 2 500 nm;当波段为175 ~ 700 nm时,光谱分辨率≤0.048 nm;当波段为700 ~ 2 500 nm时,光谱分辨率≤0.2 nm,重采样至1 nm。土壤样品过筛后放置在烘箱内用45 ℃烘24 h,然后置于干燥器内待用。先用白板校正,然后取出干燥器内约1 g土样置于样品池内进行光谱测定。
1.3 光谱数据处理对原始土壤光谱进行去除包络线处理,提取土壤的光谱吸收和反射特征,从而能更加直观地观察土壤的光谱特征[23]。为比较不同光谱变换形式对研究结果的影响,对原始光谱反射率(REF)进行一阶微分(FDR)和倒数的对数(Log(1/R))两种光谱变换。原始光谱反射率(REF)经FDR处理后,能够分解混合重叠的光谱,使样本间的光谱特征差异明显;光谱经Log(1/R)处理后,能够扩大可见光区的光谱差异,避免了背景噪音的干扰,使非线性关系转换为线性关系[3]。
不同土壤类型的光谱曲线之间存在差异性,但是也存在共性,比如曲线斜率、特征吸收谷等存在相似性,光谱分类就是依据光谱反射率和光谱曲线特征的相似性进行土壤分类[4]。光谱相似性度量技术是通过度量函数来判定已知类别和未知类别光谱间的相似性,根据相似性大小对未知类别光谱进行分类,该技术是光谱分类的重要基础,主要方法包括光谱相关系数、欧氏距离、光谱角余弦和光谱信息散度等。本研究利用光谱相关系数测度(spectral correlation measure,SCM)对土壤样品进行光谱分类,即通过光谱之间的相关性评价光谱相似性[24]。土壤光谱分类可以提高土壤有机质含量光谱预测模型的精度和稳定性,并为快速获取土壤有机质含量提供方法支持。具体的计算公式如下:
$ r = \frac{{\sum\limits_{i = 1}^n {({x_i} - \bar x)({y_i} - \bar y)} }}{{\sqrt {\sum\limits_{i = 1}^n {{{({x_i} - \bar x)}^2}} } \sqrt {\sum\limits_{i = 1}^n {{{({y_i} - \bar y)}^2}} } }} $ | (1) |
式中:xi和yi表示光谱第i波段对应的特征值,x和y表示光谱曲线的平均值。样本的相关系数值越大,其相似程度越高,反之,相似程度越低。
1.4 有机质光谱预测模型与结果评价偏最小二乘回归(partial least squares regression,PLSR)是土壤属性高光谱预测建模中常用的方法,该方法可以简化数据结构、可以分析变量间的相关性,适用于光谱数据分析[11]。本研究采用REF、FDR和Log(1/R) 3种变换形式,分别利用PLSR方法建模反演有机质含量并进行比较;并根据光谱相似性对土壤样品进行分类,比较按照不同土壤类型和不同光谱分类的有机质光谱预测精度。
采用交叉验证方式评价模型的预测结果,选取决定系数(determination coefficients,R2)、均方根误差(root mean squared error,RMSE)和相对分析误差(relative percent deviation,RPD)作为评价指标。R2的值越接近于1,RMSE越小,说明模型的稳定性越好,预测精度越高。当RPD < 1.4时说明模型无法对样品进行预测;当1.4≤RPD<2时,说明模型只能进行粗略预测;当RPD≥2时,表明模型具有极好的预测能力。评价指标的计算公式如下:
$ {R^2} = 1 - \sum\limits_{i = 1}^n {{{({y_i} - {{\mathord{\buildrel{\lower3pt\hbox{$\scriptscriptstyle\frown$}} \over y} }_i})}^2}} /\sum\limits_{i = 1}^n {{{({y_i} - \bar y)}^2}} $ | (2) |
$ {\rm{RMSE}} = \sqrt {\frac{1}{n}\sum\limits_{i = 1}^n {{{({y_i} - {{\hat y}_i})}^2}} } $ | (3) |
$ {\rm{RPD}} = {\rm{SD}}/{\rm{RMSE}} $ | (4) |
式中:yi表示样本i的实测值,
光谱分类和PLSR建模和验证利用The Unscrambler 9.7完成,数据统计分析及绘图在SPSS 22.0和OriginPro 9.0中完成,去除包络线处理在ENVI 4.8中完成。
2 结果与分析 2.1 有机质含量统计特征表 1为蒙城土壤样品有机质的测定情况。研究区土壤有机质平均含量为21.23 g/kg,变化范围为6.65 ~ 33.35 g/kg。砂姜黑土的有机质平均含量为21.60 g/kg,范围为6.65 ~ 31.30 g/kg;黄褐土的有机质平均含量较砂姜黑土略低,为19.50 g/kg,变化范围为10.00 ~ 33.35 g/kg。两种土壤有机质的变异系数为18.24%和22.36%,呈现中等变异性。
根据样本的土壤有机质含量,将样本分为 < 15、15 ~ 20、20 ~ 25和 > 25 g/kg 4个区间,分别计算样本在4个区间内的反射率平均值得到平均光谱曲线。在整体波段范围内,样品有机质含量不同,但光谱曲线趋势基本一致(图 2A);在可见光范围内光谱反射率值迅速增加,曲线斜率比其他波段范围的斜率大;而在红外波段范围内,光谱反射率增加速度逐渐减缓,曲线变化趋于平缓,并在1 400、1 900和2 200 nm处出现吸收谷,这是土壤黏土矿物质中所含的水分子和羟基引起的[13]。
图 3为有机质含量与原始光谱反射率的相关系数曲线,相关系数值为负值,说明有机质含量与光谱反射率之间呈显著负相关关系。由图 2A可以看出,在可见近红外波段范围内,随着土壤有机质含量的增加,光谱曲线位置降低,即光谱反射率值减小,符合一般规律[25],与图 3表现出的特征基本一致。但在短波红外范围内,光谱曲线不符合一般规律,光谱曲线之间出现交叉,这可能是因为不同土壤类型对其产生的影响遮掩了不同有机质含量本身的影响。为了探求更明显的特征,对原始光谱做去除包络线处理。
图 2B是光谱去除包络线后的曲线图。由图 2B可知,随着有机质含量减小,曲线中吸收谷更加明显。除了1 400、1 900和2 200 nm处的吸收谷更加突出外,在420、480、660和900 nm附近也出现了吸收谷。在可见光区,吸收谷随着有机质含量的增加而趋于平缓。有机质含量小于15 g/kg的包络线去除曲线与其他有机质含量曲线存在明显差异,这表明有机质含量越低,光谱反射率受其他因素的影响就越大。
分别选取砂姜黑土和黄褐土中有机质含量最小值、25%分位数、50%分位数、75%分位数和最大值所对应的光谱曲线进行光谱特征分析(图 4)。由图 4可知,两种土壤类型的光谱曲线总体趋势基本一致,光谱曲线在可见光范围内快速上升,在近红外波段范围内上升缓慢且较为平稳。砂姜黑土在可见光区反射率与有机质呈负相关(图 4A);但在近红外区,有机质含量为6.65 g/kg时光谱曲线呈现相反的趋势,这是因为有机质含量较低时,有机质掩盖其他土壤组成物质对光谱反射率的影响能力减弱,土壤光谱反射率被其他因素支配[26]。黄褐土有机质含量在10.00 ~ 33.35 g/kg之间,与光谱反射率呈负相关关系,即随着有机质含量的增加,土壤的光谱反射率减小(图 4B)。
本文选用原始光谱反射率(REF)、一阶微分(FDR)和倒数的对数(Log(1/R)) 3种光谱指标作为自变量,利用PLSR方法分别建立基于总体样本、土壤类型和光谱分类的有机质光谱预测模型(表 2)。
由表 2可知,总体样本利用Log(1/R)数据建模精度最高,R2和RMSE分别为0.85和1.56 g/kg,Log(1/R)验证精度也是最高的,R2和RMSE分别为0.66和2.40 g/kg。基于传统土壤分类时,砂姜黑土的Log(1/R)指标建模精度和验证精度与其他指标相比是最高的;黄褐土的FDR建模精度最高,R2达到0.99,接近于1,这可能是因为黄褐土土壤样品过少导致建模随机性过大;黄褐土验证精度中是Log(1/R)指标的结果最好,R2和RMSE分别为0.41和3.41 g/kg。基于光谱分类时,光谱类型1和光谱类型2的验证精度都是Log(1/R)指标时最高。说明3种光谱指标中,选择Log(1/R)指标预测土壤有机质比较好。
总体样本的Log(1/R)指标的RPD为1.70,可以粗略对土壤有机质进行预测;土壤分类后,砂姜黑土和黄褐土Log(1/R)指标的RPD分别为1.59和1.28,说明砂姜黑土的PLSR预测模型效果一般,仅能对土壤有机质含量进行粗略的估计,而黄褐土的光谱模型不能预测土壤有机质。可以得出结论,依照传统土壤类型建立各自的有机质光谱预测模型精度并不好。
砂姜黑土是淮北平原的主要耕作土壤,其黏土矿物以蒙脱石和水云母为主,其次为蛭石和高岭石。黄褐土的黏土矿物以蒙脱石、伊利石为主,并含有高岭石及微量绿泥石。两种土壤类型的黏土矿物都存在蒙脱石且含量较高,有机质含量也接近,所以两种土壤类型之间存在相似的光谱曲线特征,利用光谱相关系数测度对土壤样品进行光谱分类时能够将光谱曲线相关性高的分为一类,能够更好地预测土壤有机质含量。光谱分类后土壤样品分为光谱类型1(包含86个样品)和光谱类型2(包含45个样品),建立各自的土壤有机质光谱预测模型。由于两种土壤类型的黏土矿物中分别存在高含量的水云母和伊利石,同时可能由于有机质、铁等其他土壤属性的影响,光谱分类后的土壤类型光谱曲线存在一定的区别,但光谱类型1与砂姜黑土的光谱曲线相似度高,光谱类型2与黄褐土的光谱曲线更接近,相互之间可以进行比较。结果(表 2)比较表明,按照光谱分类后建立的有机质光谱预测模型精度明显提高,光谱类型1的Log(1/R)指标的RPD为1.74,与砂姜黑土的RPD相比提高了0.15,说明模型的稳定性有所提高;光谱类型2与黄褐土比较,Log(1/R)指标的RPD由1.28提高到1.51,能够对该类的土壤有机质进行估计。虽然光谱类型1和类型2的有机质预测模型RPD值仍小于2,但相对于按照土壤类型分别进行有机质光谱建模的精度有一定程度的提高。
3 结论1) 不同土壤有机质含量和不同土壤类型光谱曲线在整体波段范围内趋势基本一致;去除包络线处理后,光谱曲线特征差异明显,在420、480、660和900 nm附近出现了明显吸收谷;有机质含量与光谱反射率呈负相关关系;有机质含量越低,光谱反射率受其他因素的影响就越大。
2) 基于不同光谱指标建立土壤有机质的PLSR模型结果表明:经倒数对数处理后的模型预测精度更好,总体样本的RPD提高到1.70,砂姜黑土和黄褐土的RPD分别由1.57和1.22提升到1.59和1.28。
3) 按照光谱相似性分类后建立的有机质光谱预测模型,比按土壤类型建立的光谱预测模型精度明显提高。光谱类型1和光谱类型2经倒数对数变换后的RPD分别提高到1.74和1.51。因此,在今后的研究中可以尝试运用光谱分类方法预测淮北平原的典型土壤有机质含量。
致谢: 感谢中国科学院南京土壤研究所提供的土壤光谱测试。
[1] |
Shi Z, Ji W J, Viscarra Rossel R A, et al. Prediction of soil organic matter using a spatially constrained local partial least squares regression and the Chinese vis-NIR spectral library[J]. European Journal of Soil Science, 2015, 66(4): 679-687 (0) |
[2] |
于雷, 洪永胜, 周勇, 等. 高光谱估算土壤有机质含量的波长变量筛选方法[J]. 农业工程学报, 2016, 32(13): 95-102 DOI:10.11975/j.issn.1002-6819.2016.13.014 (0) |
[3] |
方少文, 杨梅花, 赵小敏, 等. 红壤区土壤有机质光谱特征与定量估算——以江西省吉安县为例[J]. 土壤学报, 2014, 51(5): 1003-1010 (0) |
[4] |
史舟, 王乾龙, 彭杰, 等. 中国主要土壤高光谱反射特性分类与有机质光谱预测模型[J]. 中国科学:地球科学, 2014, 44(5): 978-988 (0) |
[5] |
代希君, 彭杰, 张艳丽, 等. 基于光谱分类的土壤盐分含量预测[J]. 土壤学报, 2016, 53(4): 909-918 (0) |
[6] |
卢艳丽, 白由路, 王磊, 等. 黑土土壤中全氮含量的高光谱预测分析[J]. 农业工程学报, 2010, 26(1): 256-261 DOI:10.3969/j.issn.1002-6819.2010.01.045 (0) |
[7] |
王淼, 解宪丽, 周睿, 等. 基于可见光-近红外漫反射光谱的红壤有机质预测及其最优波段选择[J]. 土壤学报, 2011, 48(5): 1083-1089 (0) |
[8] |
周鼎浩, 薛利红, 李颖, 等. 基于可见-近红外光谱的水稻土全磷反演研究[J]. 土壤, 2014, 46(1): 47-52 DOI:10.3969/j.issn.1009-2242.2014.01.009 (0) |
[9] |
Stenberg B, Viscarra Rosse R A, Mouazen A M, et a1. Visible and near infrared spectroscopy in soil science[J]. Advances in Agronomy, 2010, 107: 163-215 DOI:10.1016/S0065-2113(10)07005-7 (0) |
[10] |
Viscarra Rossel R A, Behrens T. Using data mining to model and interpret soil diffuse reflectance spectra[J]. Geoderma, 2010, 158(1): 46-54 (0) |
[11] |
王乾龙, 李硕, 卢艳丽, 等. 基于大样本土壤光谱数据库的氮含量反演[J]. 光学学报, 2014, 34(9): 308-314 (0) |
[12] |
张娟娟, 熊淑萍, 时雷, 等. 基于近红外光谱分析的土壤全氮含量估测研究[J]. 土壤, 2015, 47(4): 653-657 (0) |
[13] |
杨扬, 高小红, 贾伟, 等. 三江源区不同土壤类型有机质含量高光谱反演[J]. 遥感技术与应用, 2015, 30(1): 186-198 (0) |
[14] |
Xu S X, Shi X Z, Wang M Y, et al. Effects of subsetting by parent materials on prediction of soil organic matter content in a hilly area using Vis-NIR spectroscopy[J]. Plos One, 2016, 11(3): 1-17 (0) |
[15] |
赵小敏, 杨梅花. 江西省红壤地区主要土壤类型的高光谱特性研究[J]. 土壤学报, 2018, 55(1): 31-42 (0) |
[16] |
郭斗斗, 黄绍敏, 张水清, 等. 多种潮土有机质高光谱预测模型的对比分析[J]. 农业工程学报, 2014, 30(21): 192-200 DOI:10.3969/j.issn.1002-6819.2014.21.023 (0) |
[17] |
于雷, 洪永胜, 耿雷, 等. 基于偏最小二乘回归的土壤有机质含量高光谱估算[J]. 农业工程学报, 2015, 31(14): 103-109 DOI:10.11975/j.issn.1002-6819.2015.14.015 (0) |
[18] |
王一丁, 赵铭钦, 刘鹏飞, 等. 基于高光谱分析的植烟土壤有机质和全氮含量预测研究[J]. 中国烟草学报, 2016, 22(3): 44-51 (0) |
[19] |
刘磊, 沈润平, 丁国香. 基于高光谱的土壤有机质含量估算研究[J]. 光谱学与光谱分析, 2011, 31(3): 762-766 DOI:10.3964/j.issn.1000-0593(2011)03-0762-05 (0) |
[20] |
田永超, 张娟娟, 姚霞, 等. 基于近红外光声光谱的土壤有机质含量定量建模方法[J]. 农业工程学报, 2012, 28(1): 145-152 DOI:10.3969/j.issn.1002-6819.2012.01.027 (0) |
[21] |
侯艳军, 塔西甫拉提·特依拜, 买买提·沙吾提, 等. 荒漠土壤有机质含量高光谱估算模型[J]. 农业工程学报, 2014, 30(16): 113-120 DOI:10.3969/j.issn.1002-6819.2014.16.016 (0) |
[22] |
鲍士旦. 土壤农化分析[M]. 3版. 北京: 中国农业出版社, 1999: 30-48
(0) |
[23] |
Bayer A, Bachmann M, Müller A, et al. A comparison of feature-based MLR and PLS regression techniques for the prediction of three soil constituents in a degraded south African ecosystem[J]. Applied and Environmental Soil Science, 2012 DOI:10.1155/2012/971252 (0) |
[24] |
赵春晖, 田明华, 李佳伟. 光谱相似性度量方法研究进展[J]. 哈尔滨工程大学学报, 2017, 38(8): 1179-1189 (0) |
[25] |
何挺, 王静, 林宗坚, 等. 土壤有机质光谱特征研究[J]. 武汉大学学报(信息科学版), 2006, 31(11): 975-979 (0) |
[26] |
刘焕军, 张柏, 刘志明, 等. 松嫩平原主要土壤光谱特征分析[J]. 中国科学院研究生院学报, 2007, 24(4): 439-445 DOI:10.3969/j.issn.1002-1175.2007.04.006 (0) |
2. State Key Laboratory of Soil and Sustainable Agriculture, Institute of Soil Science, Chinese Academy of Sciences, Nanjing 210008, China