稻米水分和脂肪酸含量如何‘看得见’?高光谱成像给出答案
应用方向:
在本研究中,高光谱成像技术(HSI)主要应用于大米水分含量和脂肪酸含量的无损检测与可视化分析。通过结合化学计量学方法,HSI技术不仅能够获取大米的外部物理特征,还能深入分析其内部化学成分,实现精准、高效的质量评估。该技术可用于大米在预存储阶段的快速检测,识别水分和脂肪酸含量异常样本,从而优化储存管理。此外,HSI还可应用于存储过程中的实时监测,直观展示水分和脂肪酸的空间分布,便于及时发现潜在的品质劣化问题。本研究表明,高光谱成像技术在粮食质量检测和储存监测领域具有重要应用价值,为提高粮食安全性、减少存储损耗提供了科学支持,同时也为其他食品及农产品的非破坏性检测提供了借鉴。
背景:
作为世界上最大的大米生产国和消费国,中国的大米种植面积占全球约20%,其质量直接影响粮食安全和经济效益。水分含量和脂肪酸含量是衡量大米品质和储存稳定性的关键指标,过高的水分含量易导致霉变和微生物滋生,而脂肪酸的增加则是大米氧化变质的典型信号。因此,精准、高效、无损地检测大米的水分和脂肪酸含量对于粮食储存管理至关重要。然而,传统的检测方法通常需要破坏样本,并且过程复杂、耗时,难以满足现代粮食存储和加工行业对快速检测的需求。高光谱成像(HSI)技术作为一种集成光谱分析和图像处理的无损检测方法,能够同时获取大米的物理与化学信息,为大米品质的精准检测提供了新的技术路径。
因此,该研究旨在利用高光谱成像技术结合化学计量学方法,实现大米水分和脂肪酸含量的快速、无损检测,为粮食质量控制和存储管理提供科学依据。具体研究内容包括:(1)采用不同的预处理方法对大米和精米的光谱数据进行处理,并建立其水分和脂肪酸含量的全光谱预测模型,最终根据模型性能确定最佳预处理方法。(2)采用两种变量筛选方法,在900–1700nm范围内选择大米和精米水分及脂肪酸含量的关键波长,并从化学角度对所选波长进行分析。(3)比较大米和精米水分及脂肪酸预测模型的性能,并分析稻壳对水分和脂肪酸模型预测效果的影响。(4)利用最佳模型对大米样本的每个像素点进行水分和脂肪酸预测,实现大米水分和脂肪酸含量的可视化分析。
1.实验设计
1.1材料与方法
(1)实验材料与方法
本研究以2021年收获的13个晚稻品种为实验材料,其中包括4个粳稻品种和9个晚籼稻品种,具体信息如表1所示。所有晚稻样品均由浙江省粮库提供。每个品种的晚稻样品均采用自封袋密封包装,并储存于恒温恒湿环境中(温度10℃,湿度50%)。
水分是影响大米脂肪酸值(FAC)变化的主要因素。因此,可以通过向样品中添加不同量的水分来扩展样品的水分含量(MC)和脂肪酸值(FAC)的范围,从而提高模型的稳健性。首先,称取每种大米240克,并将其分成六份,得到78个实验样品。然后向每个样品中添加不同质量的蒸馏水并混合均匀,使得样品中的水分含量呈现出12克/100克、13克/100克、14克/100克、15克/100克、16克/100克和17克/100克的梯度变化。
处理后的大米样品用12 × 17 cm的自封袋密封,在温度为10℃的室内保存20 h,使样品中的水分分布均匀。用已完成光谱采集的大米样品制备精米样品。大米样品先用脱壳机去壳,然后用碾米机磨成精米。本研究中,所有样品的MC按GB 5009.3-2016《食品安全国家标准-食品中水分的测定》中的直接干燥法测定,FAC按GB/T 20569-2006《大米贮藏质量判定规则》的方法测定。
(2)高光谱图像采集与校正
高光谱成像系统由近红外高光谱成像仪(GaiaField-N17E,江苏双利合谱科技有限公司,Dualix Spectral Imaging)、室内试验箱(HSIA-BD)、四盏卤素灯(50W)、升降台、计算机以及配套软件(Optiplex 7080MT/SpecView)组成。该近红外高光谱成像仪的光谱范围为900至1700nm,空间分辨率为640像素,波段数为512,光谱分辨率为5nm。升降台的尺寸和升降范围分别为300×300毫米和90至370毫米。系统如图1所示。
图1. 高光谱成像系统。
使用高光谱成像系统采集了样品的高光谱图像。在高光谱图像采集过程中,大米样品被放置在黑色基板上,平铺成15×15厘米的正方形,精米样品平铺成为13×13厘米的正方形,确保样品的厚度不超过3粒大米的厚度。为了获得清晰且无畸变的高光谱图像,传送带的移动速度和移动距离分别设置为0.6厘米/秒和17厘米。样品与镜头之间的垂直距离为42厘米,光源与水平面的角度为60度,曝光时间为7毫秒。最终,每个样品获得了两张高光谱图像。
之后,对每张原始高光谱图像I0进行了黑白色校正计算。收集到的原始图像数据反映了信号强度,而通过黑白色校正计算可以获取光谱的反射率。我们使用了白色校准板进行空白校准,设定最大发射率(约99%),并用镜头盖进行暗校正,设定最小反射率(约0%)。
(3)光谱提取与预处理
通过对校正后的图像进行分割来提取每个样品的兴趣区域(ROI),以去除黑色背景。首先,从高光谱图像中提取对应于1290nm的图像,并使用最大类间方差法(OTSU)算法获得最佳阈值。高于阈值的灰度图像区域(大米/精米)被标记为“1”,低于阈值的灰度图像区域(背景)被标记为“0”。然后为每个样品创建了一个二值掩模,并将该掩模应用于每个高光谱图像立方体,以实现黑色背景的移除。为了提高预测的准确性和可重复性,每个高光谱图像中大米/精米像素的反射率值被平均化,以获得其平均光谱。然后,对同一样品扫描得到的两个大米/精米高光谱图像提取出的平均光谱再次平均,作为样品的光谱数据。
预处理可以去除高光谱数据中的噪声,例如高频随机噪声和基线漂移,从而提高模型性能。在本研究中,我们采用了五种预处理方法来处理样品的原始光谱,包括多次散射校正(MSC)、标准正态变量(SNV)、Savitzky-Golay(SG)平滑、SG+一阶导数和SG+二阶导数。根据全光谱模型的性能,最终选择了合适的预处理方法。
(4)变量选择
高光谱数据具有高维度和多重共线性的特点,这使得数据处理变得复杂且耗时。为了提高计算速度并实现实时检测,有必要使用一些变量选择方法来选择重要的波长,并降低高光谱数据的维度。这些重要的波长能更好地预测大米/精米样品的MC和FAC。在本研究中,我们采用了竞争自适应重加权采样(CARS)和连续投影算法(SPA)来选择大米/精米中MC和FAC的重要波长。
1.2. 结果与讨论
(1)水分含量(MC)和脂肪酸值(FAC)的统计分析
一种合适的样本划分方法能够为建模选择更具代表性的样本,并提高模型的稳健性。在本研究中,采用了基于联合x-y距离的样本集分割(SPXY)方法,按照2:1的比例将样本划分为校准集和预测集。表2显示了不同集合中样本的MC和FAC的统计结果。从表2可以看出,校准集中的MC和FAC的范围覆盖了预测集中的范围,这符合构建高光谱校准模型的条件。在所有样本中排除了异常样本,包括异常的光谱值、水分值和脂肪酸值。
(2)光谱分析
图2展示了大米和精米在900至1700nm波长范围内的原始反射光谱。从图2可以看出,大米和精米在900至1400nm波长范围内的光谱趋势相同。然而,在1400至1700nm波长范围内,大米的反射光谱逐渐增加,而精米的反射光谱趋于稳定。此外,大米光谱的反射值通常高于精米。这可能是由于大米和精米在颜色、光滑度和透明度方面的不同造成的。在图2中,大约在960、1200和1450nm处有三个明显的峰值。960nm附近的峰值可能是由水中和碳水化合物中O-H的二阶倍频协同作用引起的。1200nm附近的峰值与样品的水分含量(MC)有关,而1450nm附近的峰值归因于O-H伸缩的一阶倍频。由于前后波长范围内的光谱噪声较大,因此舍弃了900至940nm和1670至1700nm的光谱数据。用于建模的光谱数据包含在940至1670nm波长范围内的468个变量。
图2. 大米和精米样品的原始光谱:(a) 大米;(b) 精米。
(3)光谱预处理分析
五种预处理方法被用于处理大米和精米样品的光谱,并且使用偏最小二乘回归(PLSR)算法建立了MC和FAC的校准模型。表3显示了不同预处理方法下MC和FAC样品PLS模型的预测结果。从表3中可以发现,在“大米水分”模型中,使用SNV和SG-2预处理得到的结果是较好的。使用SNV预处理建立的模型的决定系数(R²C)相对较高,达到了0.9682。然而,该模型不稳定,稳健性较差,预测相关系数(R²P)仅为0.9466。因此,SG-2预处理的模型比SNV预处理的模型表现更好。在“大米脂肪酸”模型中,除了SG-2外,其他预处理方法的R²P未达到0.8,且R²P与R²C差异显著,因此这些模型的稳健性较差。因此,SG-2是“大米脂肪酸”模型中最佳的预处理方法。对于“精米水分”,SG-2预处理的模型具有更高的R²C和R²P。总之,SG-2是在“大米水分”、“精米水分”和“大米脂肪酸”三个预测模型中最佳的预处理方法。这三个模型的R²P和均方根误差(RMSEP)分别为0.9639、0.9528、0.8238和0.0032、0.0035、2.1517。而在“精米脂肪酸”模型中,SG平滑是最佳的预处理方法,该模型的R²P和RMSEP分别为0.8427和1.7806。
从表3可以看出,大米中MC模型的性能优于精米中的模型。这是因为稻壳含有水分,其吸水能力高于精米。因此,当大米样品被水处理时,稻壳吸收的水分比精米多。所以大米的光谱包含了比精米更多的水分信息,导致大米中MC模型的性能优于精米。相比之下,精米中FAC模型的性能优于大米。稻壳的本质是一种纤维,主要由纤维素、半纤维素、木质素等成分构成。这表明稻壳不含有脂肪酸,而存在于大米光谱中的稻壳干扰信息将影响建模过程中脂肪酸的预测。因此,获得的光谱信息可能受到稻壳的干扰,导致精米的预测精度下降。所以使用高光谱图像预测大米的脂肪酸时,稻壳会对预测精度产生特定影响。此外,过多的波长并不能更有助于提高预测速度和模型的稳健性。因此,进行波长变量选择是必要的,以减少冗余波长,提高模型稳定性,并实现实时高光谱检测。
(4)变量选择
由于使用SG或SG-2预处理的MC和FAC模型获得了最佳结果,因此对这些光谱进行了CARS和SPA方法处理,以选择对水分和脂肪酸有显著影响的波长。然后,使用这些选定的波长通过PLSR开发了水分和脂肪酸的校准模型,并比较了“大米水分、精米水分、大米脂肪酸和精米脂肪酸”四个模型的性能。从表4可以看出,CARS选择的基本波长数量分别为17、40、17和13,而SPA选择的基本波长数量分别为6、11、9和10。SPA选择的重要波长数量更少,使得实际应用更为简便。CARS模型的R²P分别为0.9643、0.9445、0.7528和0.8480。SPA模型的R²P分别为0.9650、0.9567、0.8436和0.8573。SPA模型具有更高的R²P,且模型更为精确。CARS模型的RPD值分别为5.3750、4.3784、2.0565和2.6227。SPA模型的RPD值分别为5.5484、4.9091、2.5854和2.7070。SPA模型的RPD值更高,表明模型更为稳定。
此外,SPA模型的性能优于全光谱模型,这表明SPA选择的波长包含了MC或FAC几乎所有的有效信息。与全光谱模型的结果类似,SPA模型中大米的MC预测精度高于精米,而大米的FAC预测精度低于精米。这进一步证明了我们在第3.3节分析的可信度。图3展示了SPA变量选择的结果。从图3(a, c, e, g)可以看出,随着所选波长变量数量的增加,RMSE值逐渐减小。我们的目标是在尽可能选择较少波长的前提条件下获得较低的RMSE值。图3(b, d, f, h)显示了所选特征波长的分布。总之,“大米水分”、“精米水分”和“大米脂肪酸”的最佳模型是“SG2-SPA-PLS”,而“精米脂肪酸”的最佳模型是“SG-SPA-PLS”。
图3. SPA对大米/精米中水分和脂肪酸的波长选择结果。(a) 大米中水分的RMSE变化 (b) 大米中选定水分波长的分布 (c) 精米中水分的RMSE变化 (d) 精米中选定水分波长的分布 (e) 大米中脂肪酸的RMSE变化 (f) 大米中选定脂肪酸波长的分布 (g) 精米中脂肪酸的RMSE变化 (h) 精米中选定脂肪酸波长的分布。
SPA选择的波长如表5所示。对于MC模型,主要波长970、1150和1450nm分别归因于O-H伸缩的一阶、二阶和三阶倍频。对于FAC模型,脂肪酸的显著峰值分布在945、994、1105、1382和1527nm,主要来自C-H的第一和第二倍频以及-CH2基团的伸缩。约1160nm的吸收峰由-HC-CH-键形成,这可以解释选择的1141nm波长。选择的光谱波长939.06、964.17和967.31nm主要来自O-H键的弯曲振动。选择的波长1095.9、1596.59和1329.81nm中,1098nm的峰值属于C-H键的第三倍频多重振动,1586nm的峰值归因于N-H键的第二倍频多重振动,1320nm的峰值与C-H键的弯曲振动相关。图4显示了MC和FAC的实际值与预测值之间的偏差。从图4可以看出,MC的预测值和实际值高度吻合。这表明MC的预测模型具有很高的准确性,预测值和实际值之间的差异很小。FAC的预测值和实际值的吻合度不如MC,但预测值和实际值也非常接近。这表明尽管FAC的模型性能略逊于MC,但它也能准确预测大米和精米中的FAC。
图4. 大米/精米中水分和脂肪酸预测结果的散点图:(a) 大米中的水分;(b) 精米中的水分;(c) 大米中的脂肪酸;(d) 精米中的脂肪酸。RVM:水分的实际值;PVM:水分的预测值;RVFA:脂肪酸的实际值;PVFA:脂肪酸的预测值。
(5)稻壳影响分析
由于稻壳的高吸水能力,大米中MC模型的性能优于精米,且大米光谱中包含了更多的水分信息。而大米中FAC模型的性能不如精米。因为稻壳不含有脂肪酸,而存在于大米光谱中的稻壳干扰信息可能会影响脂肪酸的预测。然而,在进行波长选择后,大米和精米中MC或FAC的预测精度更为接近,看起来稻壳的影响消失了。因此,通过Fearn提出的方法验证了稻壳对MC和FAC预测精度的影响。第一种方法是计算在95%置信水平下区间是否包含0。如果包含零,则偏差在5%水平上没有显著差异。从表6可以看出,计算出的大米和精米MC预测误差的区间包含0,而FAC的区间不包含0。这表明大米和精米FAC预测误差之间存在显著差异,因此稻壳对FAC的预测精度有影响。
(6)模型预测可靠性分析
模型的可靠性分析有助于我们判断模型是否能够应用于实际中。因此,为了对模型的可靠性进行分析,我们进行了箱线图和T检验。箱线图是一种统计图表,用于展示一组数据的离散程度,反映数据分布的特征。T检验则利用t分布理论推断差异发生的概率,并比较两组数值之间的差异是否具有显著性。
如图5(a)所示,大米和精米中MC的预测偏差在±0.75%以内,波动范围较小。大米中MC的最大和最小预测偏差分别为0.987%和0.007%。精米中MC的最大和最小预测偏差分别为1.028%和0.002%。这表明水分的预测精度高,模型表现良好。此外,大米中MC的预测精度高于精米,且大米中MC的预测偏差主要集中在0附近。如图5(b)所示,大米中FAC的预测偏差大于精米,精米中FAC的预测偏差主要分布在±2附近。大米中FAC的最大和最小预测偏差分别为5.811%和0.599%。而精米中FAC的最大和最小预测偏差分别为4.649%和0.108%。这表明精米中FAC的模型表现优于大米。总之,可以得出结论,所提出模型的预测偏差值小,模型性能可靠。
图5. 大米和精米水分和脂肪酸预测偏差值的箱线图:(a) 水分;(b) 脂肪酸。
通过对大米和精米中的水分和脂肪酸的预测值与真实值进行T检验分析。如表7所示,得到的T检验值P大于0.05。这表明所建立模型的预测值与真实值之间没有显著差异。因此,这些模型在预测水分和脂肪酸方面表现良好。
(7)水分含量(MC)和脂肪酸值(FAC)的可视化
可视化可以帮助我们了解不同地区大米样品的MC和FAC分布情况。首先,提取大米样品中每个像素的光谱,然后使用最优模型SPA-PLSR预测每个像素的MC和FAC,并获取每个像素的MC和FAC预测值。使用不同颜色代表每个像素的MC和FAC,并生成伪彩色图像,实现对大米样品中MC和FAC的像素级可视化。图6显示了不同水分梯度下大米样品MC的可视化结果。在图6中,图像右侧的颜色条中不同的颜色对应大米中不同的MC值。红色表示较高的MC,而蓝色表示较低的MC。可以看出,大米样品的MC越高,可视化图像中红色区域越大;大米样品的MC越低,可视化图像中蓝色区域越大。这与大米样品的实际MC相符,表明MC模型能准确预测每个像素的MC。此外,可视化图像中大米样品的MC分布不均匀,可能是由于样品处理过程中水分吸收不均造成的。图7显示了大米样品FAC的可视化结果。在图7中,图像右侧的颜色条中不同的颜色对应大米中不同的FAC值。红色同样代表较高的FAC,而蓝色代表较低的FAC。可以观察到,随着大米样品FAC的增加,可视化图像中红色区域变得更大,而FAC降低时蓝色区域变得更大。这与大米样品的实际FAC相符,表明FAC模型能准确预测每个像素的FAC。可视化可以直观反映大米中MC和FAC的空间变化,能够在像素级别了解MC和FAC的分布。因此,在储藏检查和储存监测过程中,可以检测到大米非常小范围内的异常MC和FAC,确保大米质量的安全。
图6. 大米水分含量的可视化图。(a) 12-13克/100克水分含量 (b) 13-14克/100克水分含量 (c) 14-15克/100克水分含量 (d) 15-16克/100克水分含量 (e) 16-17克/100克水分含量 (f) 17-18克/100克水分含量。
图7. 大米脂肪酸含量的可视化图。(a) 脂肪酸含量 = 8.42毫克/100克 (b) 脂肪酸含量 = 16.13毫克/100克 (c) 脂肪酸含量 = 23.91毫克/100克 (d) 脂肪酸含量 = 25.56毫克/100克。
结论
在本研究中,作者利用HSI和化学计量学对大米和精米样品中的MC和FAC进行了检测。通过PLSR算法结合选择的显著波长变量,作者开发了MC和FAC的模型。此外,作者还分析了稻壳对模型性能的影响,并进行了MC和FAC的可视化分析。结果表明,SPA方法比CARS更适合于为MC和FAC选择显著波长。在“大米-水分”、“精米-水分”、“大米-脂肪酸”和“精米-脂肪酸”数据集中,SPA选择的波长数量分别为6、11、9和10,SPA模型的RP²和RMSEPs分别为0.9650、0.9567、0.8573、0.8436和0.0031、0.0033、1.6956、2.0270。使用特征波长建立的模型性能与全光谱模型相当,而模型中使用的波长数量大幅减少。因此,在选择了特征波长后,这种方法可以用于大米储存前MC和FAC的快速检测,以及储存期间的实时监测。大米的MC和FAC都可以通过可视化图进行估算。此外,稻壳对MC模型的性能影响不显著,但对FAC模型的性能有显著影响。未来,将进一步研究消除稻壳对脂肪酸检测预测精度的影响,并在实际应用中检测大米的MC和FAC。
推荐产品
作者简介(人名+单位+博导/硕导)
孙通,浙江农林大学光电工程学院,硕导
参考文献
论文引用自二区文章:Yihan Song, Shuosen Cao, Xiuxiang Chu,Yimin Zhou, Yiqing Xu, Tong Sun, Guoxin Zhou, Xingquan Liu. Non-destructive detection of moisture and fatty acid content in rice using hyperspectral imaging and chemometrics. Journal of Food Composition and Analysis. 121 (2023) 105397. https://doi.org/10.1016/j.jfca.2023.105397.