追踪三文鱼之源:融合高光谱成像与深度学习的创新技术揭秘
应用方向
在该研究中,高光谱成像技术(HSI)主要应用于三文鱼地理来源溯源及真实性检测。通过分析光谱和纹理数据,结合深度学习与数据融合策略,HSI成功实现了不同产地三文鱼的精准分类,并有效检测出掺假现象,为水产品真实性鉴定提供了快速、无损且高效的解决方案。此外,研究开发了一种基于HSI数据的智能云平台,实现了实时分类,展示了该技术在食品溯源中的实际应用潜力和扩展性。这些成果凸显了HSI在食品质量检测与多维数据分析领域的广泛前景。
背景
三文鱼因其富含氨基酸、蛋白质、不饱和脂肪酸等营养成分,在全球备受欢迎。然而,由于不同地区的地理环境和生长条件存在差异,不同产地的三文鱼质量和价格差异显著,这使得其地理来源成为潜在的欺诈目标。传统的三文鱼产地识别方法多依赖于对外观(形状、纹理和颜色)的人工观察,但这种方法效率低下且耗时耗力。目前,农产品溯源领域常用的方法包括稳定同位素分析、感应耦合等离子体质谱法和多元素分析,但这些方法通常存在实验复杂、成本高昂以及对样品造成不可逆损伤等问题。因此,亟需探索一种快速、准确且无损的三文鱼地理来源识别方法。
高光谱成像(HSI)是一种快速且无损的检测技术,能够结合光谱和图像数据进行样本分类,具有较高的分辨率和鲁棒性。本研究基于HSI技术结合信息融合策略与深度学习模型,旨在解决三文鱼的地理来源溯源问题,为市场稳定和食品安全提供技术支持。
实验设计
1.1材料与方法
本研究中四种新鲜的三文鱼样本来自中国的刘家峡地区、法罗群岛的Bakkafrost以及成都通威三文鱼有限公司。这些三文鱼在捕获后立即被去内脏、放血并冷冻,使用无菌刀具去除头部、尾部、皮肤和骨骼进行处理。然后,每种三文鱼被切成500份,每份尺寸为40×50×15 mm,重量为40±5 g。
本研究中,三文鱼片的高光谱图像是使用江苏双利合谱科技有限公司的“Gaia”高光谱分选机获取。该系统包括一个Image-λ “Spectrum”系列高光谱相机(Image-λ-V10E-PS),两套200W的钨卤灯光源,一个电动控制的移动平台。“Gaia”高光谱分选机的光谱范围从388-1036 nm,光谱分辨率为2.8 nm,每个像素点共有256个波段。在实验过程中,每种三文鱼获得了500张高光谱图像。在采集样本之前分别获取高光谱图像的黑白帧,以便对高光谱图像进行黑白校正。使用分析软处理收集到的高光谱图像以提取ROI获取各样本平均光谱值,采用二阶统计方法从样本中提取纹理信息。
为了从光谱数据中去除噪声并防止数据失真,本实验采用了Savitzky-Golay平滑作为一种预处理方法,基于一系列实验和经验考虑,将窗口大小设置为17。在本研究中,采用了LightGBM和GBDT算法来消除冗余和无关信息以提高模型效果。然后对集成机器学习模型(随机森林、LightGBM和GBDT)、CNN-BiGRU深度学习模型、深度学习模型(MSADBO、CNN和BiGRU)三种模型结果进行对比,得出最优模型。同时,设计了一个自建的物联网云平台,以实现对不同三文鱼地理来源的实时检测。
1.2.结果
(1)不同类别三文鱼片的光谱特性
使用HSI获取了包括挪威三文鱼、法罗群岛三文鱼、淡水彩虹鳟鱼和智利三文鱼四个类别三文鱼样本的光谱。图1展示了这四种三文鱼类别的平均光谱,可以观察到这四种三文鱼类别的整体光谱趋势大致相似,但反射率值有所不同。然而,在大多数情况下,仅凭视觉是无法准确区分三文鱼类别的。因此,进行有效的波段分析以提取相关信息,用于分类模型是必要的。
图1. 四类三文鱼的平均光谱
此外,还识别出几个与不同官能团相对应的常见吸收峰。在可见光至近红外光谱范围(400-1000 nm)内,光谱显示出明显的峰值和谷值,观察到的吸收信息主要与样本中有机大分子官能团的基本振动相关(例如,C-H、N-H、O-H和S-H)。在可见光区域(400-760 nm),在450 nm左右观察到一个显著的吸收峰,归因于肌红蛋白和总色素的吸收。在650-700 nm,观察到高反射率,反映了三文鱼的红色光谱特征。在近红外区域(700-1000 nm),在760 nm出现吸收峰,对应于O-H伸缩振动的第三泛音。此外,在980 nm观察到轻微的下降,对应于O-H伸缩振动的第二泛音。这些观察表明,样本中光谱反射率的变化可以归因于它们化学性质的变化。换句话说,不同品种的三文鱼由于化学性质的差异而表现出不同的反射率。总之,400-1000 nm可以表征三文鱼肉质的特性,为后续三文鱼来源的追溯提供了理论基础。
(2)特征变量贡献分析
在全波段建模计算中,LGB和GBDT模型始终产生最稳定的结果。因此,本研究仅通过LGB和GBDT模型选择重要波长进行分类。LGB和GBDT算法被用来对光谱和纹理融合模型的2133个变量进行特征选择,每个算法提取的前30个贡献最大的特征变量被分别用于分析(见图2)。对特征变量重要性的分析显示,两个模型的光谱特征变量更集中于650 nm,而纹理特征更集中于400-450 nm和700-800 nm的单波段灰度图像。特别值得注意的是,在640-670 nm的光谱区域观察到最高的贡献率。从图1可以看出,这些光谱区域主要与色素、蛋白质和水分有关,导致三文鱼片中高反射率,并突出了三文鱼的光谱特性。
图2.特征重要性分析结果:(a) LGB模型TOP30特征变量贡献;(b) GBDT模型TOP30特征变量贡献
(3)光谱建模分析
使用237个连续波段的光谱数据和传统机器学习(ML)算法建立了三文鱼溯源模型。数据预处理采用了SG平滑方法,窗口点数设置为17。利用LGB、RF、GBDT和STACK四种监督模式识别方法对三文鱼的地理来源进行了区分。预测结果如图3所示。
图3.光谱模型的模拟结果。(a)原始数据ML算法的谱模型结果;(b)原始数据深度学习算法的光谱建模结果;(c)SG平滑后ML算法的光谱建模结果;(d)SG平滑算法的谱模型结果后深度学习算法的谱模型结果
从模型结果可以看出,传统的ML模型、集成学习模型和深度学习模型在测试集上的分类准确率表现出令人满意的稳定性,结果保持在87%到93%之间。此外,经过SG平滑处理后,所有模型的准确率都有所提高,在训练集上提高了0.1%到3.2%,在测试集上提高了0.2%到4.3%。这一现象可以归因于SG平滑有效地纠正了原始光谱中的曲率和偏移。另一方面,在CNN-BiGRU模型中,改进的正弦算法注入了强大的全局探索和局部开发能力,显著提升了模型的分类性能,整体准确率比优化前提高了0.5%到4.3%。值得注意的是,在基于光谱数据的ML模型结果中,集成学习模型表现突出,以训练集95.8%和测试集93%的准确率展示了最佳的分类性能。然而,与ML模型相比,深度学习模型在基于光谱数据的分类任务中表现不佳。这是因为深度学习需要大量数据进行训练,但在处理低维数据时更容易出现过拟合。
(4)纹理模型分析
本研究基于8个选定的特征纹理信息建立了三文鱼的纹理分类模型。为了消除光谱数据维度的差异,特征纹理信息经过了归一化预处理,以确保数据的一致性。采用与光谱模型相同的机器学习和深度学习方法区分三文鱼的地理来源。如图4所示,经过归一化处理后,所有模型的准确率都有所提高,训练集上的提高范围从0.7%到13.1%,测试集上的提高范围从2.7%到15.1%。这种提高可以归因于高维高光谱图像中熵评估的复杂性和无序性,因此归一化纹理信息有助于减少熵对分类结果的影响。
图4.纹理模型的建模结果:(a)原始数据的ML算法纹理模型结果;(b)原始数据深度学习算法纹理建模结果;(c)归一化预处理后的ML算法纹理模型结果;(d)归一化预处理后的深度学习算法纹理模型结果
从ML的角度来看,集成学习模型继续保持着强大的性能。在归一化纹理数据的分类结果中,训练集和测试集的准确率分别提高了1.3%至3.1%和0.8%至3.9%。尽管归一化处理显著增强了分类结果的准确率,但传统的ML方法在提取纹理信息等数据类型的特征时仍面临一些挑战。相比之下,CNN-BiGRU模型在处理纹理信息方面的分类性能远高于传统ML模型。值得强调的是,改进的DBO-CNN-BiGRU模型进一步提高了分类准确率。训练集和测试集的分类准确率分别达到了92.8%和92.5%,这展示了深度学习模型在处理高维和复杂数据,尤其是纹理数据方面的卓越性能。
(5)融合模型分析
本研究采用了一种信息融合策略,整合光谱和纹理数据构建了一个全面的数据模型。总体而言,融合模型展现出了令人满意的分类性能。每个模型都显示出一定程度的改进,这表明利用光谱和纹理两方面的信息有助于捕捉不同三文鱼类别之间的差异。在这些模型中,MSADBO-BiGRU取得了最佳结果,在训练集和测试集上的准确率分别为99.6%和99.5%,与优化前的DBO-BiGRU相比,测试集准确率提高了0.7%。分类结果如图5所示。法罗群岛三文鱼和智利三文鱼更容易被混淆,而彩虹鳟鱼很少与其他三文鱼种类混淆。从传统ML模型的结果来看,LGB、RF、GBDT和STACK模型的分类性能同样令人满意,测试集准确率分别为94.3%、96%、93.3%和96.3%。值得注意的是,与单独的ML模型相比,集成学习模型一贯展现出稳定性,并表现出最佳的分类性能,测试集准确率提高了0.3%到3%。此外,为了进一步提升模型性能并降低数据维度和冗余,使用了GBDT和LGB算法进行特征变量选择,最终结果如表1所示。结果表明,与全变量建模相比,ML模型的准确率提高了0.2%至0.7%,这表明GBDT和LGB算法成功地选择了关键变量,从而减少了HSI数据中的共线性和冗余问题。相比之下,STACK模型取得了最佳结果,在训练集和测试集上的准确率分别为97.4%和96.3%。总之,整合光谱和纹理数据的信息融合策略的分类性能优于使用单一光谱或纹理数据的最优模型。
图5.融合模型的建模结果:(a)ML算法的融合建模结果;(b)深度学习算法的融合建模结果;(c)LGB的混淆矩阵;(d)RF的混淆矩阵;(e)GBDT的混淆矩阵;(f)STACK的混淆矩阵;(g)DBO-CNN-BiGRU的混淆矩阵;(h)MSADBO-CNN-BiGRU的混淆矩阵
(6)深度学习互联网智能云平台用于最佳分类结果可视化
基于本研究,发现基于HSI技术的信息融合策略与深度学习方法结合在三文鱼溯源方面具有巨大潜力。然而,传统的模型预测方法限制了其在实际应用中的实时能力和灵活性。此外,对高维数据(如光谱和纹理特征)进行多次训练迭代不仅耗时,而且增加了模型扩展的难度。此外,传统方法无法实现远程访问,给用户带来不便。因此,为了解决这些问题,本研究构建了一个基于互联网的智能云平台,用于追踪三文鱼的来源。云平台的分类结果如图6所示。基于深度学习模型,借助光谱和纹理的融合数据,平台利用MSADBO-CNN-BiGRU算法处理融合数据,以实现三文鱼的溯源。在平台投入使用之前,将实验中的所有2000个融合数据(分为70%的训练集和30%的测试集)输入深度学习模型进行训练。尽管本研究开发的智能云平台可能尚未达到工业标准,评估其功能的可靠性和稳定性是必要的。结果如表2所示,证明了平台的平稳运行。此外,为了验证平台在应用中的可靠性,通过上传包含融合数据的文件到平台进行测试,可以获得如图8所示的四种三文鱼来源区分结果,平台的分类准确率超过99%,这表明三文鱼溯源检测系统在三文鱼地理来源区分方面具有很大的应用潜力。
图6.云平台分类的结果。(a)法鲁三文鱼。(b)虹鳟。(c)挪威三文鱼。(d)智利三文鱼
结论
由于不同产地之间价值差异显著,三文鱼经常成为欺诈行为的目标,因此精准识别其产地具有重要意义。为了解决这一问题,本研究构建了一种结合HSI信息融合策略与深度学习方法的模型,旨在快速、准确地追溯三文鱼的地理来源。研究结果如下:(1)在比较的四种不同的ML模型中,STACK模型表现出较高的分类稳定性和准确性;(2)深度学习在处理高维和复杂数据方面表现出色,其分类性能显著超过ML模型,测试集准确率高达99.5%,MSADBO-CNN-BiGRU模型测试集准确率比优化前的CNN模型提高了0.8%至7%;(3)信息融合的结果表明,与仅使用单一光谱和纹理模型相比,分类准确率有所提高,尤其是融合模型的性能远远超过纹理模型,表明融合模型展现出最佳性能。总之,本研究成功地将深度学习方法与基于HSI的信息融合策略相结合,实现了三文鱼产地的精准追溯,为市场稳定和食品安全提供了保障。同时,该研究为未来基于HSI信息融合策略与深度学习方法的农产品快速、无损追溯研究提供了技术支持。
推荐产品
作者简介
通讯作者:许丽佳,四川农业大学机电学院,博导
参考文献
论文引用自一区文章:Zhiyong Zou , Dongyu Yuan , Qingsong Wu , Qianlong Wang, Menghua Li ,Jiangbo Zhen , Chong Xu , Shutao Yin , Qiang Cui , Man Zhou , Lijia Xu , Salmon origin traceability based on hyperspectral imaging data fusion strategy and improved deep learning method , Food Control 166 (2024) 110740, https://doi.org/10.1016/j.foodcont.2024.110740