运用物理数学方法预测森林土壤有机碳含量

所属栏目:应用物理学论文 论文作者:/
论文摘要

  森林土壤碳库是全球土壤碳库的重要组成部分,也是森林生态系统中的最大碳库,约占全球土壤碳储量的 73 %,森林土壤碳库的微小变化都会对大气 CO2浓度及全球变化产生巨大影响。森林土壤碳分为有机碳和无机碳,其中以有机碳为主,且有机碳含量是表征土壤有机质的重要方式。寻求快速测定土壤有机碳含量的方法在森林土壤理化性质、森林可持续利用及森林生态系统的相关研究中至关重要。近红外光谱技术 ( NIRS) 便是一种速度快、无损伤、低成本的预测技术。其波长范围介于 350 ~2 500 nm 之间,近红外光主要吸收含氢基团 X-H ( X = C、N、O) 振动的倍频和合频,这些基团反映大多数有机物的组成和结构信息。

  由于森林土壤中包括矿物质、有机质和微生物等,它们的构成含丰富的氢基团,而含氢基团是关乎土壤有机碳的重要信息,因此,近红外光谱可作为获取信息的一种有效的载体。近年来,在农业、林业、中药、烟草、食品等行业中都有广泛的应用并已成为一种快速的例行分析方法。由于近红外光谱技术分析优势明显,其应用领域开始不断拓宽,用于土壤成分分析日益趋增,其中包括土壤有机质、含水率、全氮和 pH 值等,如 Hum-mel等利用近红外光谱技术来预测土壤水分和土壤有机质含量,指出 NIRS 对土壤水分的预测要比对土壤有机质的预测容易。Lee等应用 NIRS 技术预测土壤中的营养成分磷、钾、钙、镁元素和有机质的含量与 pH 值,相关系数为 0. 24 ~ 0. 88。

  Cécillon L等研究应用 NIRS 技术对土壤土壤有机质含量、土壤营养供给、生物活性进行了评估和监测,研究结果表明,它们的预测值和实测值的相关系数都在 0. 90 以上。RA Viscarra Rossel等研究表明,应用 NIRS 技术与主成分分析法可以快速有效地预测土壤成分信息,客观地实现土壤归类。

  X . M. Yang等应用 NIRS 技术对颗粒有机物土和砂粒粒组土的有机碳的预测,近红外要优于中红外。Kuang Boyan等应用 NIRS 技术估测不同类型的土壤中有机碳和全氮的含量,预处理后的预测模型精度较高。

  根据国内外对土壤组分的研究情况,应用近红外光谱技术与传统 PLS 和 PCR 线性建模方法结合建模较多,非线性方法建模较少。而线性方法常适用于变量少且具有很大线性关系的组分建模,对于多变量建模的稳定性和预测效果一般。然而应用近红外光谱结合 BP 神经网络非线性方法可以快速、无损、精准地测定森林土壤有机碳含量,为野外实时、大面积、快速地测定森林土壤碳含量提供技术支持。本项研究采集小兴安岭带岭的 120 个土壤样本,收集其近红外光谱数据,并测定其土样的有机碳含量,利用 BP 神经网络非线性方法,对土壤有机碳含量进行预测,为东北林区施行有效的抚育管理提供技术和理论依据。

  1 研究方法

  1. 1 土壤样品的采集与制备
  土壤样品取自小兴安岭带岭林业局东方红林场,该林场位于东经 128° 57' ~ 129° 37',北纬46°50' ~ 46°59',海拔 650 m。该区夏季温暖多雨,冬季严寒多雪,属温带季风性气候,年均气温 1. 5℃ ,年平均降水量 670 mm ,无霜期约 114 天。

  树种主要以落叶松 ( Pinus gmelinii) 为主,平均年龄 19 年,平均胸径 14 cm,平均树高 11 m,郁闭度为 0. 9; 林区土壤为暗棕壤。

  研究样地以东方红林场林区小班为单位,从中随机选取 10 个小班,每个小班分别设置对照和抚育 2 块样地,共有 20 块,每块样地规格为 50 m ×20 m,每块样地沿对角线布置 3 个取土样方,每个样方分为上下两层取土样。上层为 0 ~10 cm 土层,下层为 10 ~20 cm 土层,每层取 1 个土壤样本。为满足近红外光谱建模样品要求,样品参数含量范围尽可大且分布均匀,20 块样地最终选取 120 个土壤样本。

  按国家标准-重铬酸钾外加热法测定了 120 个土壤样品的有机碳含量,测定结果见表 1。【表1】
论文摘要
  
  1. 2 土壤光谱测量仪器及方法
  土壤样品带回实验室进行风干处理后,使用木棒压磨、去除肉眼可见的砂砾和植物残体,研磨过40 目土壤筛,以减少固体漫反射的影响。仪器为美国 ASD 公司制造 LabSpec Pro FR/A114260 近红外光谱仪,配有内置光源 ( 它的色温为 3 000 K) 、光纤探头和旋转样品杯,光谱仪的光谱测量范围为28 571 ~ 4 000 cm- 1( 350 ~2 500 nm) ,输出的波段为 2 151 个,分辨率为 2 cm- 1( 波数单位) ,每条土壤近红外光谱取 30 次扫描的平均值,每 10 个样品进行一次背景校正。

  1. 3 BP 神经网络预测模型
  BP 网 络训练采用 Levengerg-Marquardt ( L-M)优化,以样本输出和期望输出误差极小为训练目的,学习的实质为权值的修正直至误差趋于零。L-M 优化算法属于非线性的最小二乘法,具备高斯牛顿法和梯度下降法优点,于两种方法中平滑和调和,此算法具备较高的稳定性和收敛速度,弥补传统 BP算法的缺点。经过反复的实验,最终确定隐含层的神经元的个数为 10 个,BP 神经网络的预测模型如图 1。【图1】
论文摘要
  
  左侧的第一个方形表示输入层,8 为输入层的节点数; 中间的方形表示隐含层,10 为隐含层的节点数; 最右边的方形表示输出层,1 为输出层的节点数。隐含层神经元方框中 “∫ ”符号表示该层传递函数即 logsig,输出层神经元方框中的 “/”符号表示该层的传递函数即 purelin。此程序由MATLAB 调试完成。

  1. 4 主成分数目
  本项研究若选取全波段 350 ~2 500 nm 进行建模,光谱数据波长点将高达 2 151 个,构成样本的数据矩阵为 120 ×2 151,数据量大且冗余。主成分分析是将原来众多具有一定相关性的自变量,通过线性组合的方式重新组合成一组较少的线性无关的综合指标来代表原来的指标,新变量能反映原变量的绝大部分信息,通过这种方式达到降维的目的。此法结合 BP 神经网络用于光谱数据建模,可以确保光谱数据准确、网络结构简化、模型训练时间缩短。

  1. 5 模型评价
  评价化学计量学建立的模型性能的基本指标有相关系数 ( R) 和均方根误差 ( RMSE) ,评价应用建立的模型预测样品时的基本指标有相关系数( R) 、均方根误差 ( RMSE) 、验证标准差 ( SEC)和预测标准差 ( SEP) 等。相关系数 ( R) 取值越接近 1,模型拟合性越好: 【公式】
论文摘要
  
  均方根误差越小,模型的拟合效果越好,预测精度越高: RMSE =【1】

论文摘要  
  验证标准差 SEC 越小,模型拟合的效果越好:【2】
论文摘要
  
  预测标准差 SEP 越小,模型的预测精度越高:【3】
论文摘要
  
  式中 n 为建模样本数,L 为主成分数,m 为预测样品数,y 为实测值,yi为预测值,珋y 为实测值的平均值,Bias 为系统偏差。
  
  2 结果与分析

  2. 1 原始土壤样品的近红外光谱
  120 条不同有机碳含量值的土壤样品的近红外光谱见图 2。从光谱图的整体来看,3 条光谱的变化趋势基本一致,最显着的特征是近红外光谱均在1 414 nm、1 918 nm、2 207 nm 附近出现较强的吸收峰,光谱的吸光度随着有机碳含量的增大而增大,说明土壤近红外光谱的吸光度对土壤有机碳含量有一定的响应。究其原因是由于 1 414 nm 波长吸收峰与亚甲基 CH2、C-H 组合频和烃类或脂肪类有关; 1 918 nm 波长吸收峰与水分子 O-H 有关;2 207 nm 波长对应芳基 C-H、CONH2、β-折叠结构中与肽主链呈直角的 N-H 和 C = O,这3 种特征波长点能很好地反映样品的基团信息。不同基团的吸收峰和吸收强度不同,由于土壤样品的有机碳含量不同,致使各个土壤样品的基团含量不同,最终使光谱特征发生相应的变化。【图2】
论文摘要

  本项研究所测定的 120 个土样的土壤近红外光谱均在1 414 nm、1 918 nm、2 207 nm 附近出现较强的吸收峰,这与申艳、Cozzolino 和 Moron得到的土壤近红外光谱图相似,仅峰值出现的位置稍有差异。吸收峰对应基团响应与 Cozzolino 和 Moron 研究相似,但是对应基团所指示的化学结构稍有不同,他们认为1 400 nm 处的吸收峰通常与 O-H 键及脂肪C-H 键有关,1 900 nm 处的吸收峰通常与氨基化合物中的 N-H 和 O-H 键有关,而 2 200 nm 处的吸收峰通常是由羒基化合物的 O-H 键、氨基化合物的N-H 键、胺基中的 N-H 键以及脂肪链中的 C-H 键振动引起的。
  
  2. 2 主成分分析法压缩提取土壤近红外光谱数据
  运用主成分分析法对取自小兴安岭带岭林业局东方红林场 120 个土壤样本的原始数据降维,结果见表 2。由表 2 可知,前 8 个主成分的累计贡献率达到98 % 以上,可以有效代表原始光谱数据的主要信息。该光谱数据前 8 个主成分的累积贡献率达到98. 59 % ,所以选择前 8 个主成分就可以有效代表全波段光谱数据。通过主成分分析压缩提取的 8 个新变量互不影响,最终 BP 神经网络的输入层矩阵由 120 ×2 151 转变为 120 ×8,极大降低预测模型的输入层的维数。【表2】
论文摘要
  
  2. 3 基于 BP 神经网络的土壤有机碳含量的预测结果
  采用原始光谱数据压缩提取的前 8 个主成分作为神经网络的输入层,建立单隐层的网络模型,实现从输入到输出的非线性映射。【图3】
  
论文摘要
  图 3 为 BP 神经网络验证集的回归模型图,横坐标为化学方法测定的土壤有机碳含量的实测值,纵坐标为 BP 神经网络模型预测的土壤有机碳含量的预测值。验证集为样本总数的 15 %,用于 BP神经网络模型的验证和权值、阈值的修正。回归系数为 0. 780 02,均方根误差为 0. 500 2。图 4 为 BP神经网络预测集的回归模型图,土壤有机碳含量的实测值与预测值的相关系数为 0. 849 41,均方根误差为 0. 453 8。【图4】
论文摘要
  
  本项研究结果与 Chodak 和 Reeves的研究结果相近 ( R > 0. 9) ,但是 Reeves 等和 Islam等建立的土壤有机碳模型的相关系数仅为 0. 80和 0. 68。模型结果的差异与很多因素有关,如土壤样品的颗粒度情况、光谱预处理方法和建模方法的应用等,也与研究的土壤类型有关。孙建英等研究得出黑土有机质含量与近红外光谱特性相关性很差,这可能是因为其采集的黑土有机质含量变幅较小,降低了吸收光谱对有机质含量的敏感度,也可能是有机质含量与其近红外光谱不具有较好的线性关系。徐彬彬等研究认为,土壤有机质对光谱特性的影响主要在可见光和近红外波段,这一结论肯定了近红外光谱技术研究测定森林土壤有机碳的可行性。刘焕军等对典型黑土可见光/近红外波段光谱研究发现,620 ~810 nm 是黑土有机质的主要光谱响应区域,在对光谱不进行任何预处理的情况下建立的黑土有机质高光谱模型相关系数为 0. 83,验证样本模型预测值与实测值之间的相关系数为 0. 82,这与本项研究建立的近红外光谱模型结果十分相近。

  研究结果表明,通过 BP 神经网络建立的模型对土壤有机碳含量预测效果显着,模型的预测值和实验室化学方法测定的实测值具有很高的相关性,达到了预测土壤有机碳含量的精度要求。

  3 结语

  本项研究应用近红外光谱技术对土壤近红外光谱进行分析,光谱在 1 414 nm、1 918 nm、2 207nm 附近出现较强的吸收峰,并很好地反映土壤的构成情况。采用 Savitzky-Golay 平滑、求一阶导数和 MSC 多元散射方法对光谱信息进行校正处理,去除噪声、颗粒度和波峰过尖等的影响。应用主成分分析法压缩提取光谱数据前 8 个主成分,克服近红外光谱全波段的光谱数据信息量过多、计算量太大的缺点,使其既充分代表原始光谱数据又能减少BP 神经网络的输入层维数。同时充分利用 BP 神经网络的非线性拟合特点,保证了可以快速、有效、精准地预测土壤的有机碳含量。验证集的相关系数为 0. 780 02,均方根误差为 0. 500 2; 预测集的相关系数为 0. 849 41,均方根误差为 0. 453 8。

  研究结果表明,近红外光谱技术与 BP 神经网络非线性方法结合可以作为森林土壤有机碳含量检测的新技术,既发挥近红外光谱技术的快速、无损和低成本的特点,又发挥 BP 神经网络非线性拟合处理海量数据的优势,同时为野外实时、大面积、快速地测定森林土壤有机碳含量提供技术支持,为施行有效的林区抚育管理提供技术和理论依据。

  参考文献:

  [1]周国模,刘恩斌,佘光辉. 森林土壤碳库研究方法进展[J]. 浙江林学院学报,2006,23( 2) : 207-216.
  [2]陆婉珍,袁洪福. 现代近红外光谱分析技术[M]. 北京: 中国石化出版社,2007.
  [3]高荣强,范世福. 现代近红外光谱分析技术的原理及应用[J]. 分析仪器,2002,3( 9) : 12.
  [4]刘 旭,陈华才,刘太昂,等. PCA-SVR 联用算法在近红外光谱分析烟草成分中的应用[J]. 光谱学与光谱分析,2007,27( 12) : 2460-2463.
  [5]王多加,周向阳,金同铭,等. 近红外光谱检测技术在农业和食品分析上的应用[J]. 光谱学与光谱分析,2004,24( 4) : 447-450.

'); })();