基于高光谱图像技术的隐形字快速识别研究
[导读] 著名作家、诗人、评论家、政论家、学者高尔基曾利用牛奶在白纸上写字,待白纸风干后,字迹也随之消失,从而达到隐形传递消息的目的。那怎样恢复白纸上的字迹呢?根据史书记载,将白纸用火烤一下,字迹就会慢慢的变得清晰起来,这是因为牛奶中含有蛋白质,而蛋白质在60摄氏度左右变性,凝固,显现出来,而纸的燃点达到130度以上,因此用火烤一下可以使牛奶字迹清晰。但是用饱和盐水、眼液、淀粉水在白纸上写字,待白纸风干后,字迹消失了,然而利用火烤的方法却无法将白纸上的字迹识别出来。因此需要借助其他办法来快速识别任何液体书写的隐形字迹。
将牛奶、饱和盐水、眼液分别在白色A4纸上写上字,待溶液晒干后利用短波红外相机(1000nm-2500nm)对其分别进行测试,获取其在短波红外波段的高光谱图像和光谱信息。SWIR短波红外相机光谱分辨率为8-10nm,像素为384x288,波段数为288个。测试设备及SWIR短波红外相机如图1所示。
图1 测试设备及SWIR短波红外相机
对获取的高光谱图像数据进行黑白帧校正得到图像的光谱反射率数据,同时对反射率数据进行坏点(NAN)进行修复,剔除掉异常值,从而得到牛奶、饱和盐水、眼液及背景(白纸)的光谱反射率数据,如图2所示。从图2可知,干牛奶与未干牛奶,其在白纸上写的字迹光谱反射率差异较大;当牛奶晒干后,字迹的光谱反射率与白纸十分相似,变化规律也趋向一致,对光谱进行放大分析可知,牛奶字迹的光谱反射率总体上高于白纸的光谱反射率。对于饱和盐水字迹而言,干饱和盐水字迹与未干饱和盐水字迹在光谱反射率上差异较为明显,特别是在水汽吸收带1420 nm和1910 nm附近差异更为显著;当饱和盐水晒干后,饱和盐水字迹的光谱反射率与白纸的光谱反射率变化趋势一致,但是白纸的光谱反射率高于饱和盐水字迹的光谱反射率。运用眼液在白纸上写上字,待眼液晒干后,去牛奶字迹、盐水字迹一样,肉眼无法识别出是什么字,利用短波红外相机测试其光谱反射率发现,眼液晒干后,其字迹的光谱反射率与白纸的光谱反射率变化趋势依然一致,但是眼液字迹的光谱反射率高于白纸的光谱反射率。
图2 牛奶、饱和盐水、眼液及背景(白纸)的光谱反射率
由于高光谱遥感数据波段多,波段间存在很大相关性,为了克服维数灾难,利用最小噪声分离变换进行波段选择,达到优化数据,去除噪声和数据降维的目的。
最小噪声分离变换( MNF)是对主成分变换( PCA) 的一种改进方法。PCA 是一种线性变换,变换后各主成分分量彼此之间互不相关,随着主成分的增加该分量包含的信息量减小,第一主成分包含的信息量最大,第二主成分与第一主成分无关且在剩余成分中包含的信息量最大,依此类推。但PCA对噪声比较敏感,在变换后的主成分分量中,信息量大的信噪比不一定高,当某个信息量大的主成分中包含的噪声的方差大于信号的方差时,该主成分分量形成的图像质量就差。针对 PCA 变换的不足,Green 和 Berman 提出最小噪声分离变换( MNF),它不但能判定图像数据内在的维数( 波段数) ,分离数据中的噪声,而且能减少随后处理中的计算需求量。MNF 变换是基于图像质量的线性变换,变换结果的成分按照信噪比从大到小排列。经过MNF变换大部分噪声集中在特征小的分量中。而不像 PCA变换按照方差由大到小排列,从而克服了噪声对影像质量的影响。
图3列举了牛奶隐形字原图(手机拍摄)、MNF变换前5个成分。从图中可知原图看不到任何字迹模样,但经过MNF变换后,第1、2、3、4成分能较好地识别出隐形字迹,其中第2成分隐形字迹识别效果最佳。第1成分中隐形字较亮的部分是因为牛奶尚未完全风干,第2成分隐形字较亮、较暗的部分同样是因为牛奶尚未完成风干,导致MNF变换中其信息较为显著,如图2可知干牛奶区域和未干牛奶区域的光谱反射率曲线差异较为显著。第3、4、5成分隐形字的灰度不完全一致,也是因为牛奶未完全风干的原因。
图3 牛奶隐形字原图及MNF前5个成分
图4列举了饱和盐水隐形字原图(手机拍摄)、MNF变换前5个成分。从图中可知原图看不到字迹模样,但经过MNF变换后,第1、3成分能较好地识别出隐形字迹,其中第1成分隐形字迹识别效果最佳。第2、4、5以及往后的成分均无法识别出饱和盐水的字迹。第1成分中隐形字较亮的部分和第3成分隐形字较暗部分是因为牛奶尚未完全风干的原因,从图2可知干饱和盐水区域和未饱和盐水区域的光谱反射率曲线差异较为显著。
图4饱和盐水隐形字原图及MNF前5个成分
图5列举了眼液隐形字原图(手机拍摄)、MNF变换前5个成分。从原图中依然无法看到隐形字迹,但经过MNF变换后,第1成分能较好地识别出隐形字迹,第2、3、4、5以及往后的成分均无法识别眼液书写的字迹。
图5眼液隐形字原图及MNF前5个成分
针对高光谱数据信息量丰富,但数据冗余且包含噪声的特点,本文基于最小噪声分离变换算法有效地对不同液体书写的隐形字高光谱图像进行降维处理,分离了图像中的有效信息和噪声,减小了后期处理的数据量,提高了数据处理效率。通过对隐形字高光谱数据进行最小噪声分离变换,从而清晰地识别出了隐形字体,实验结果对于文物考古、刑侦领域识别隐形字迹提供了参考和借鉴。
地址:北京市海淀区中关村大街19号新中关B座北翼1701-1706室
电话:010-62634840
传真:010-82618238
邮箱:info@dualix.com.cn