EN

机载高光谱影像结合XGBoost机器学习算法助力水稻产量估算

发布者: 发布时间:2025-04-03

背景

水稻作为全球主要粮食作物之一,在养活世界人口方面具有重要地位。然而,随着人口增长和耕地资源减少,提升水稻单位面积产量成为解决粮食安全的重要途径。在传统水稻育种过程中,高产品种的筛选依赖人工测量产量和生物量,但这种方法耗时费力、效率低且难以大范围应用。此外,受气候变化和环境因素影响,产量差异显著,增加了高产品种筛选的复杂性。  

近年来,随着无人机(UAV)和高光谱成像技术的发展,农业高通量表型检测成为可能。高光谱成像可以同时获取作物的光谱和空间信息,实现对生长状态、养分水平及倒伏等性状的无损监测和精准评估。然而,单一基于植被指数或传统统计模型的方法在动态环境下稳定性差,无法满足育种过程中对高精度、快速分类的需求。  

作者信息:

苏军,福建农林大学蛋白组学研究中心,博士生导师

期刊来源:Plant Phenomics

研究内容

该研究结合无人机高光谱影像和倒伏特征,利用XGBoost机器学习算法,构建水稻产量分类模型。旨在开发一种低成本、高通量、非破坏性的方法,实现大范围高产水稻品种的快速筛选,提升水稻育种效率,并为精准农业和农业智能化提供新的技术手段。

实验设计

本研究在江苏省南京市农业试验基地开展,选取多个水稻品种作为研究对象,数据采集时间为水稻灌浆中后期。使用大疆M600 Pro六旋翼无人机作为飞行平台,搭载江苏双利合谱科技有限公司生产的176波段高光谱相机(GaiaSky-Vis&Nir)(图1(a),a-1)。在测量前,需在直射阳光下校准曝光时间。采集一张白板和两张黑背景图像。拍摄白板图像时,将漫反射标准板垂直于镜头前方放置(图1(a),a-2)。两张黑背景图像(图1(a),a-3和a-4)按照制造商规范拍摄,分别使用镜头盖关闭并采用常规或增加曝光时间的方式获取。高光谱相机的白板和黑背景曝光时间分别为0.9秒和1.0秒。为进行辐射校准,将反射率分别为20%、40%和60%的参考面板放置在田间,并在图像处理中作为标准使用(图1(b))。该高光谱相机的分辨率为960×1057像素,在90米飞行高度下可提供4.5厘米的空间分辨率(图2(c))。高光谱相机为线传感器,波长范围为400至1000 nm,光谱分辨率(半高宽)为3.5 nm,每张图像的曝光时间为7秒。水稻的光谱曲线与周围土壤的光谱曲线存在显著差异(图1(d))。

 

图1:高光谱相机校准与图像采集。(a) 在阳光下使用标准白板校准曝光时间(a-1),包括拍摄白板图像(a-2)、暗背景图像(a-3)以及增加曝光时间后的暗背景图像(a-4)。(b) 反射率分别为20%、40%和60%的参考反射面板。(c) 图像采集时无人机飞行高度为90米。(d) 示例样本区域及其对应的水稻和土壤光谱曲线

研究方法

采集得到的高光谱影像首先进行了黑白板校正、辐射校正与大气校正。随后,剔除了光谱中的噪声波段,提取感兴趣区域(ROI)的平均光谱反射率,确保所用光谱数据准确代表水稻冠层信息。此外,计算了多种常用植被指数(如NDVI、GNDVI和OSAVI等),为后续建模提供更加丰富和直观的作物生长状态指标。

为了进一步提高水稻产量分类模型的表现,研究结合了倒伏特征,通过对无人机影像的分析,提取出倒伏程度(轻度、中度、重度)及倒伏位置分布情况。

将经过预处理的光谱数据、植被指数以及倒伏特征数据整合在一起(图2),并根据水稻品系进行标记。进行了两种分析:品系内分析和品系间分析。在品系内分析中,从每个品系中随机选取两个重复样本作为训练数据,而将第三个重复样本用作测试数据(图3(a))。在品系间测试中,从每个类别中选择一个品系作为测试样本,其余10个品系则被用作训练样本。总体而言,类别之间共有2(A类)×7(B类)×4(C类)=56种排列组合(图3(b))。为了降低测试误差并提高验证方法的可行性,这56种训练集和测试集均被逐一分析。

 

图2:高光谱和RGB图像处理流程及数据集构建。从抽穗期获取的原始图像经过多种失真校正后得到修正数据。提取参考光谱,并去除噪声和背景。在网格单元和后续感兴趣区域(ROI)选择后,使用随机像素计算植被指数。从成熟期提取的倒伏统计数据与光谱数据结合,形成训练和测试集

图3:模型建立的样本组合。图中展示了用于品系内分析(a)和品系间分析(b)的重复样本和品种排列的示意图

基于筛选后的特征,研究将水稻样本按照产量标准分为高产、中产和低产等级,并采用XGBoost(极端梯度提升算法)构建产量分类模型。并通过网格搜索方法确定了XGBoost算法的最佳参数。构建了3×3的混淆矩阵来分析预测结果,并计算了精确率和召回率。

结果

鉴于倒伏标注对于更准确的产量估算具有重要意义,测试是否可以不依赖人工标注,通过自动倒伏表型识别实现准确估算。为获得足够的训练样本,使用 RGB 相机(成本低于高光谱相机)采集了100 张倒伏图像和 83 张非倒伏图像。所有图像被调整为统一尺寸(224 × 224)。随后,从无人机航拍图像中裁剪出倒伏区域和非倒伏区域(ROI),作为训练数据集。最后,我们采用迁移学习、图像增强技术,并使用基于 ImageNet 预训练权重的 ResNet50 模型,结合 Adam 优化器进行模型训练。模型的批次大小(batch size)为 8,学习率为 0.0001,训练轮数(epoch)为 30,总迭代次数为 600。将训练好的模型应用于39 个实验地块中 13 个品种的三次重复实验进行倒伏识别(如图4所示)。结果显示,仅有2个倒伏单元被误判为非倒伏单元,倒伏识别准确率达到了94.87%,这表明深度学习技术完全可用于水稻倒伏的自动识别。

 

图4. 利用微调技术实现水稻倒伏的自动识别。(a) 倒伏检测模型的训练数据,其中包含100张倒伏图像和83张非倒伏图像。(b) 来自39个实验田块的高光谱数据的伪彩色图像(波段77、50和18)。根据种植区域截取感兴趣区域(ROIs),以建立测试数据集,其中包含14张倒伏图像和25张非倒伏图像。(c) 模型在训练数据上的混淆矩阵。(d) 模型在测试数据上的混淆矩阵

对五种机器学习算法进行了测试和比较,这些算法包括LDA(线性判别分析)、高斯核支持向量机(SVM)、AdaBoost、随机森林(RF)和XGBoost。测试结果显示,XGBoost的性能优于其他四种方法(图5)。

 

图5:五种分类器(包括LDA、SVM、AdaBoost、RF和XGBoost)的测试结果

结论

该研究结合无人机高光谱影像数据与水稻倒伏特征,构建了基于XGBoost算法的水稻产量分类模型。研究结果表明,倒伏特征在模型中具有重要作用,单独使用倒伏特征时模型准确率最高为69.32%,而将高光谱数据与倒伏特征结合后,模型分类准确率显著提升。通过对不同算法的比较,XGBoost算法表现最佳,具有更高的预测准确性和泛化能力。此外,研究还利用深度学习方法实现了水稻倒伏的自动识别,准确率达到94.87%,为无人机高通量表型分析和智能化水稻育种提供了技术支撑。整体而言,该研究为大规模高产水稻品种筛选与精准农业生产提供了一种高效、低成本、非破坏性的遥感监测方法,并建议未来结合多传感器与更多纹理及形态特征,进一步提升模型的适用性和智能化水平。

服务网络

  • 江苏双利合谱科技有限公司

    地址:无锡市梁溪区南湖大道飞宏路58-1-108

    电话:13810664973

    邮箱:info@dualix.com.cn

  • 北京办事处

    地址:北京市海淀区中关村大街19号

    电话:13810664973

    邮箱:info@dualix.com.cn

  • 西安办事处

    地址:陕西省西安市高新区科技一路40号盛方科技园B座三层东区

    电话:13810664973

    邮箱:info@dualix.com.cn

  • 成都

    地址:成都市青羊区顺城大街206号四川国际大厦七楼G座

    电话:13810664973

    邮箱:info@dualix.com.cn

  • 深圳办事处

    地址:深圳市龙华区民治梅龙路
    电话:13810664973
    邮箱:info@dualix.com.cn
高光谱成像仪_高光谱相机_高光谱成像系统解决方案-江苏双利合谱科技有限公司 无锡市梁溪区南湖大道飞宏路58-1-108 13810664973 ICP备案号:苏ICP备2021046114号-1

销售直拨:13810664973

回顶