高光谱在冬虫夏草含量及真伪鉴别中的应用
摘要:目的 以冬虫夏草粉末为研究对象,利用高光谱成像技术建立对冬虫夏草粉末的真假鉴别及含量判断的无损检测模型。方法 将真伪样品粉末分别按9:1、8:2、7:3、6:4、5:5等不同比例进行混合,通过光谱范围为940 nm~2500 nm的高光谱成像仪分别获取真伪样品、不同比例真伪混合样品的高光谱影像数据,经过主成分分析(PCA)初步判别真伪样品的差异性,再结合偏最小二乘法(PLS)对真伪粉末样品的含量进行分析判断。结果 不同比例真伪混合物中冬虫夏草粉末的识别度为97.0%-98.78%,伪冬虫夏草粉末的识别度为83.10%-99.3%。 结论 基于高光成像技术可以实现对冬虫夏草粉的真假辨别,并可准确地判别出冬虫夏草粉末的有效含量。
关键词: 高光谱成像技术;冬虫夏草粉末;真假鉴别;含量判断
冬虫夏草最初载于《本草从新》[1],主产于我国四川、云南、青海、西藏、甘肃等省区,是我国名贵中药材之一。与人参、鹿茸并称为补品“三宝”,具有良好的医疗保健作用。由于冬虫夏草人工抚育技术尚未突破,其来源仅靠野生采挖,产量较少,价格昂贵,少数不法分子为谋取暴利而采取以次充好、掺假充真等手段,导致市场上冬虫夏草的各种伪品层出不穷,严重危害消费者和患者的身体健康。因此,完善虫草的品种鉴定研究,准确地判定其来源,对药品的监督和检验显得尤为必要。
本文运用近红外高光谱成像技术对冬虫夏草粉末的真假鉴别及含量进行无损检测的判断。与传统的中药检测技术如色谱法、质谱法和光谱法[ 2-4] 等方法相比,高光谱成像技术把二维成像和光谱技术融为一体,其高光谱数据包含光谱和图像信息,可以同时表征被测对象的外部特征和内部信息,优势在于采集到的图像信息量丰富,识别度较高和数据描述模型多。由于物体的反射光谱具有“指纹”效应,不同物不同谱,同物一定同谱的原理来分辨不同的物质信息,它不追求单一成分的控制,其整体性和模糊性可以提供丰富的中药信息,能够更加有效地体现中药成分的综合作用,从而更好地鉴别中药真伪,评价中药质量。高光谱技术近年来逐渐受到生物医学、精细农业、食品安全等许多领域的重视。例如,外在品质检测如水果、蔬菜表面损伤、淤痕[5-6];内部品质检测如水果的可溶性固体含量、水分含量、坚硬程度[7-8],猪肉的嫩度[9-10],鳕鱼的新鲜程度[11],菠菜叶片硝酸盐含量等[12];食品安全检测主要指食品中是否含有可能损害或威胁人体健康的物质,如苹果、哈密瓜表面排泄物污染检测[13-15],鸡肉排泄物污染检测[16],玉米、辣椒等黄曲霉毒素检测等。
本研究利用高光谱成像仪“图谱合一”的特点,分析冬虫夏草粉末、蛹虫草粉末、地蚕粉末的光谱差异,以期准确地判别出混合粉末中冬虫夏草粉末的有效含量。
高光谱成像数据采集采用四川双利合谱科技有限公司的GaiaSorter高光谱分选仪系统。该系统主要由高光谱成像仪,CCD相机、光源、暗箱、平移台、计算机组成。
虫草粉样品是由青海唐古拉药业公司提供,其中包括3个标准样品,2个伪品(分别为地蚕、蛹虫草)。
2.1 样品的采集与处理
将青海唐古拉药业公司提供的样品粉末各取5g放置于培养皿上,标号,用于高光谱相机的光谱采集。其中伪品2个标号为9号、10号(分别为地蚕、蛹虫草),3个标准样品6号、7号、8号,同时将8号与10号样品粉末分别以9:1、8:2、7:3、6:4、5:5等不同比例进行混合,得到1~5号样品。
2.2 高光谱数据的采集
样品的采集高光谱成像系统,扫描方式为推扫式成像技术,该仪器的光谱扫描范围为940 nm ~2500 nm,每个样品的采样间隔为2.5 nm,每个样品的测定速度一般小于 1分钟。在获取样品的高光谱影像后,需要对采集的光谱图像进行图像校正才能得到样品的反射率,图像校正公式如下:
式中,Rref 是校正过的图像,DNraw是原始图像,DNwhite为白板校正图像,DNdark是黑板校正图像。
样品的典型高光谱如图1所示。红色为8号样品、蓝色和绿色分别为9号、10号样品。
图1 8号、9号、10号样品典型光谱
Fig.1 Reflectance spectra of the 8号、9号、10号 samples
3.1 主成份分析
由于主成分图像都是由原始数据中的各个波段下的图像经过线性组合而成,根据 (其中,为第m个主成分,为该主成分的权重系数,为单个波段的原始图像)。比较该线性组合的权重系数,如果权重系数绝对值越大,对主成分图像贡献就越大。最大权重系数所对应的波长下的图像为最佳特征波长图像。为了选取最佳的波长组合,必须保证它们的权重系数绝对值尽可能大,同时还要保证它们之间有一定的波长间隔。将测试原始数据进行降噪处理后,通过主成分分析变换(PCA)进行背景扣除后,再次进行主成分分析变换(PCA)后结果如图2所示。
图2 主成分分析的结果
Fig. 2 The results of principal component analysis
通过主成分分析,可以明显将9号、10号两个伪样品与其它样品进行区分,由此可以判断9号与10号样品为伪样品。
3.2 偏最小二乘法
偏最小二乘法(PLS)是一种数学优化的技术,它主要是通过最小化误差的平方和来找到一组数据的最佳函数匹配,然后用最简的方法求得一些绝对不可知的真值,而令误差平方之和为最小。偏最小二乘法(PLS)就相当于将多元线性回归分析、典型的相关分析以及主成分分析方法融合在一起的数学方法。偏最小二乘法(PLS)主要是通过主成分分析法将多为空间数据的曲线压缩到较低维的空间数据上,使其原曲线分解为多种主成分分析曲线,而不同的曲线的主成分分别代表不同的主分和因素间对曲线的贡献率,选取贡献率较大的主成分,去除有干扰组分和干扰因素的主成分,仅仅将贡献率较高的主成分与质量参数进行回归。
本研究将8号样品与10号样品的粉末分别按9:1、8:2、7:3、6:4、5:5等不同比例进行混合,得到1~5号样品。将1~5号样品作为未知样品进行偏最小二乘法变换(PLS)实现分类判别,判断8号与10号样品的混合比例,结果如下表1-表5所示。
从表1到表5可知,1号到5号样品中8号样品冬虫夏草粉末的成分识别度在97.0%到98.78%之间;蛹虫草粉末的成分识别度在83.10%到99.3%之间;未识别成分所占比例在0.57%到0.84%之间。
从总体上看,基于PCA变换后的高光谱影像,利用偏最小二乘法可准确地识别出肉眼无法分辨的冬虫夏草和蛹虫草粉末。其中当冬虫夏草和蛹虫草粉末进行9:1混合时,91.1%识别为冬虫夏草粉末,8.31%识别为蛹虫草粉末,未识别成分占0.59%;当冬虫夏草和蛹虫草粉末按8:2混合时,78.26%识别为冬虫夏草粉末,20.14%识别为蛹虫草粉末,未识别成分占0.60%;当冬虫夏草和蛹虫草粉末按7:3混合时,71.47%识别为冬虫夏草粉末,28.80%识别为蛹虫草粉末,未识别成分占0.73%;当冬虫夏草和蛹虫草粉末按6:4混合时,59.04%识别为冬虫夏草粉末,40.36%识别为蛹虫草粉末,未识别成分占0.57%;当冬虫夏草和蛹虫草粉末按5:5混合时,51.50%识别为冬虫夏草粉末,47.66%识别为蛹虫草粉末,未识别成分占0.84%。
表1 1号分类判别结果
Tab.1 The result of No.1 Classification
Number |
Predicted |
Accuracy |
8号 |
1841 (91.1%) |
98.78% |
10号 |
168 (8.31%) |
83.10% |
Not Classified |
12 (0.59%) |
--- |
Total 2021 (100%) |
2021 (100%) |
99.41% |
表2 2号分类判别结果
Tab.2 The result of No.2 Classification
Predicted as: |
Predicted |
Accuracy |
8号 |
1570 (78.26%) |
97.83% |
10号 |
424 (20.14%) |
99.3% |
Not Classified |
12 (0.60%)0 |
--- |
Total 2006 (100%) |
2006 (100%) |
99.40% |
表3 3号分类判别结果
Tab.3 The result of No.3 Classification
Predicted as: |
Predicted |
Accuracy |
8号 |
1463 (71.47%) |
97.9% |
10号 |
569(28.80%) |
96% |
Not Classified |
15 (0.73%) |
--- |
Total 2047 (100%) |
2047(100%) |
99.27% |
表4 4号分类判别结果
Tab.4 The result of No.4 Classification
Predicted as: |
Predicted |
Accuracy |
8号 |
1458 (59.07%) |
98.45% |
10号 |
996(40.36%) |
99.10% |
Not Classified |
14 (0.57%) |
--- |
Total 2468 (100%) |
2468(100%) |
99.43% |
表5 5号分类判别结果
Tab.5 The result of No.5 Classification
Predicted as: |
Predicted |
Accuracy |
8号 |
1164 (51.50%) |
97.0% |
10号 |
1077 (47.66%) |
95.32% |
Not Classified |
19 (0.84%) |
--- |
Total 2260 (100%) |
2260(100%) |
99.16% |
4 讨论
通过以上对冬虫夏草粉末样品在近红外波段的反射高光谱图像采集,经过主成分分析,可有效的对冬虫夏草粉末的真伪进行初步的鉴别。进一步通过偏最小二乘法分析对样品区域进行分析判断,可对样品的有效成分含量进行鉴别,其中冬虫夏草粉末的成分识别度在97.0%到98.78%之间;蛹虫草粉末的成分识别度在83.10%到99.3%之间。但由于目前样品采样数量较小,对于成分含量判断的准确性还需进一步实验验证。
实验初步验证了高光谱成像技术在虫草粉末鉴别的可行性。进一步还需通过实验和分析判断出理想的特征波段,以降低数据采集量,并进一步优化数据分析模型与数据处理速度,从而达到在线检测的速度与准确性要求。
地址:北京市海淀区中关村大街19号新中关B座北翼1701-1706室
电话:010-62634840
传真:010-82618238
邮箱:info@dualix.com.cn