题目
基于无人机高光谱遥感的粳稻冠层叶绿素含量反演研究
应用关键词
叶绿素含量;无人机高光谱;农业应用
背景
叶绿素含量是表征粳稻生长状况的重要指标。开发近地尺度的快速评估粳稻叶绿素含量的无人机高光谱遥感平台,对辅助田间精准施肥和农药施用具有重要现实意义。
目前,利用高光谱数据反演作物叶绿素的研究多采用统计回归模型,大致可分为两类:植被指数模型和直接光谱模型。在植被指数模型中,首先利用高光谱数据构建各种植被指数,然后利用这些指数构建多元线性或非线性回归方法,建立这些指数与叶绿素含量之间的反演模型。这种方法的优点是模型构造简单,物理意义明确。然而,它需要以特别的方式构建大量的光谱指数,没有对一般作物品种的系统指导。不同的光谱指数取决于特定物种的类型和区域,因此缺乏普遍适用性。直接光谱模型依赖于整个高光谱波段,通常是一个高维矢量。直接利用整个高光谱波段会导致模型复杂度高,甚至模型过拟合。这个问题可以通过采用降维技术,如主成分分析或偏最小二乘回归来解决。
上述现有研究的高光谱数据大多是在地面或低空采集的。因此,测量的覆盖面积非常小。本研究的无人机平台可以在更高的高度操作,从而实现高效的大规模数据收集。具体来说,该系统工作在150 m的高度,可以在15秒内获得1000 m2区域的高光谱图像。此外,文献中的许多现有方法都是利用传统的回归方法开发的,其中许多模型参数是根据过去的经验进行初始化。本研究采用数据驱动的方法,通过采集的数据进行模型参数优化。数据驱动的方法可以消除人为偏见,获得更准确的预测结果。
本研究的目的是利用无人机遥感平台采集的高光谱成像数据,建立预测粳稻冠层叶绿素含量的反演模型。我们首先采用连续投影算法(Successive projection algorithm, SPA)从高光谱数据中提取特征波段。以提取的特征作为输入,利用极限学习机(Extreme learning machine, ELM)建立反演模型。采用粒子群算法(Particle swarm optimization, PSO)对ELM的种群大小、惯性权重、学习因子、速度位置相关系数等参数进行了优化。最终构建基于PSO-ELM算法的叶绿素含量高精度估测模型。
试验设计
试验地点位于辽中卡力玛水稻实验站,设有4个水稻氮肥梯度处理。沈阳农业大学许童羽教授团队利用搭载有GaiaSky-mini2-VN高光谱相机(江苏双利合谱公司)的DJI M600无人机平台(图1),于粳稻分蘖、拔节、孕穗、抽穗、开花和灌浆期共6个关键生育期获取其冠层高光谱影像。高光谱传感器的波段范围为400 ~ 1000 nm,光谱分辨率为2.35 nm。去除光谱上下边界的两个波段,最终得到253个有效波段。
图1 无人机高光谱成像系统
本研究使用常见的连续投影算法SPA用于波段的选择。本研究选择的光谱范围为400 ~ 800 nm,这是由于水稻叶绿素含量的变化主要影响该范围内的光谱反射率。SPA的输出为波段的集合。为了进一步减少波段数量,对所有输出子集应用多元线性回归MLR模型,选择产生最小均方根误差RMSE的子集作为最终的优选高光谱波段。
ELM是一种具有单层或多层隐层的前馈神经网络。与传统的反向传播(BP)神经网络不同,ELM隐层节点的参数是随机分配的,而且永远不会调整。与传统的BP神经网络相比,ELM的一个主要优点是学习速度更快。然而,由于隐层节点参数的随机性,在许多实际应用中,通常需要大量的隐层节点才能达到预期的精度。此外,传统的ELM架构有时没有很好的泛化能力。为了解决上述问题,我们提出采用粒子群限制学习机算法,即结合粒子群算法(PSO)和ELM。利用带有粒子群优化的ELM模拟了叶绿素含量与高光谱特征之间的关系。采用PSO对ELM的输入层权值和隐层偏差进行优化选择,计算输出权重矩阵。本研究所考虑的粒子群算法参数主要包括群体大小(pop)、惯性权重(w)、学习因子(C1, C2)和速度位置相关系数(m)。本文利用均方根误差(RMSE)和决定系数(R2)对反演模型的精度进行评价。
结论
首先,研究了粳稻叶绿素含量与不同高光谱波段的相关性。采用皮尔逊相关系数、距离相关系数和最大信息系数(Maximum information coefficient, MIC)三种方法分析了叶绿素与各个波段的相关性(图1)。这三种方法的结果总体上有相似的趋势:叶绿素含量与高光谱反射率之间的最大相关性在波长范围701 ~ 705 nm之间。具体而言,三种方法的相关系数峰分别为0.66、0.64和0.53。除了最大相关波段之外,在其他波段,如波长在410 ~ 480 nm之间的波段,也观察到相对较强的相关性。虽然400至450 nm的反射率低于0.1,但所有波段的信噪比在6.0至15.9 dB之间,可以提取特征的响应信息。
研究中利用SPA提取的特征波长分别为410 nm、481 nm、533 nm、702 nm和798 nm。702 nm和798 nm两个波段与用于叶绿素含量反演指数使用的705 nm和750 nm波段基本一致。410 nm、481 nm和533 nm的特征波段与文献中用于研究水稻拔节期的波段相似。综合分析表明,不同的研究在特征波段的光谱区域选择上存在重叠和差异。特征波段的差异主要是由于品种、生长期、环境条件和数据处理方法等方面的差异造成的,例如,(1)本研究所用的水稻品种与以往的研究不同;(2)稻田水分、杂草和土壤的存在可能影响高光谱信息。
利用从SPA中提取的波段的反射率作为自变量,以实测叶绿素含量作为因变量。采用粒子群算法PSO-ELM建立反演模型。为了比较,我们还测试了传统ELM的反演结果。在PSO-ELM中,粒子群迭代次数为100次。由于粒子群优化算法的参数很多,本研究设计了一个正交阵列来确定最佳的粒子群优化参数。结果如表1所示,其中每个参数可以取5个值中的一个,并且共有5个参数。
图1 单波段相关性分析
表1 PSO-ELM 正交阵列
表2总结了PSO-ELM参数的正交阵列结果,其中Wij是从参数j的第i个值得到的R2之和。例如,W11是通过计算第一个参数的第一个值对应的R2之和得到的,pop = 40,而W12是通过计算第二个参数的第一个值对应的R2之和得到的,w = 0.3。具体计算公式如下所示。
每一列表明了一个参数对预测精度的影响。例如,在第一列中,对于i = 1,... ,5,Wi1之间的差异揭示了种群大小如何影响反演模型的准确性,而与其他参数的值无关。由于W21 ≥ Wi1,我们得出结论,最大化R2的种群大小应该是正交阵列中的第二个值,也就是pop = 50。同样,对应于w、C1、C2和m的列分别在W52、W33、W34和W35处最大化。因此,参数的最佳值是pop = 50,w = 0.9 ~ 0.3,C1 = 1.65,C2 = 2.8和 m = 0.2。
表2 PSO-ELM正交阵列结果分析
通过正交阵列获得的一组参数,我们可以得到PSO-ELM粳稻叶绿素含量反演模型。将新建立的反演模型应用于实验数据,得到R2 = 0.791,RMSE = 8.215 mg/L。结果远优于ELM模型,该模型的R2 = 0.667,RMSE = 11.308 mg/L。反演结果表明,PSO-ELM模型对叶绿素含量的预测效果明显优于传统ELM模型(图2)。
图2 粳稻冠层叶绿素含量反演结果
通过增加无人机平台和地面数据的采集量,可以提高反演模型的精度。更多的数据可以减少由噪声、干扰和不可避免的采集误差引起的不确定性。此外,本研究只建立了供试粳稻品种的反演模型。为了提高模型的准确性和普适性,今后的研究重点是增加试验品种数量,建立不同生育期粳稻叶绿素含量反演模型。
UAV-HSI平台能够对水稻生长信息进行快速、准确和无损评估。本文提出的方法可以及时了解水稻的生长状况,这对于水稻施肥管理至关重要。不过,该方法面临的一个挑战是水稻叶片叶绿素含量随水稻品种、肥力期、生长环境等因素不断变化,所得结果仅适用于东北水稻,而其他水稻品种需要获得新的模型参数。
作者信息
许童羽,博士,沈阳农业大学信息与电气工程学院教授,博士生导师。
主要研究方向:精准农业航空、农业信息化、农业电气化。
参考文献:
Cao, Y.L., Jiang, K.L., Wu, J.X., Yu, F.H., Du, W., & Xu, T.Y. (2020). Inversion modeling of japonica rice canopy chlorophyll content with UAV hyperspectral remote sensing. PLoS One, 15(9):e0238530.
https://doi.org/10.1371/journal.pone.0238530
地址:无锡市梁溪区南湖大道飞宏路58-1-108
电话:13810664973
邮箱:info@dualix.com.cn
地址:北京市海淀区中关村大街19号
电话:13810664973
邮箱:info@dualix.com.cn
地址:陕西省西安市高新区科技一路40号盛方科技园B座三层东区
电话:13810664973
邮箱:info@dualix.com.cn
地址:成都市青羊区顺城大街206号四川国际大厦七楼G座
电话:13810664973
邮箱:info@dualix.com.cn