文章详情

高光谱技术在红枣分类识别中的应用

高光谱技术在红枣分类识别中的应用

一、测试原理及方法:

    高光谱成像技术是近二十年来发展起来的基于非常多窄波段的影像数据技术,其最突出的应用是遥感探测领域,并在越来越多的民用领域有着更大的应用前景。它集中了光学、光电子学、电子学、信息处理、计算机科学等领域的先进技术,是传统的二维成像技术和光谱技术有机的结合在一起的一门新兴技术。

    高光谱成像技术的定义是在多光谱成像的基础上,在从紫外到近红外(200-2500nm)的光谱范围内,利用成像光谱仪,在光谱覆盖范围内的数十或数百条光谱波段对目标物体连续成像。在获得物体空间特征成像的同时,也获得了被测物体的光谱信息。

 

目标物体-成像物镜-入射狭缝-准直透镜-PGP-聚焦透镜-CCD棱镜-光栅-棱镜:PGP

1 成像原理图

光谱仪的光谱分辨率由狭缝的宽度和光学光谱仪产生的线性色散确定。最小光谱分辨率是由光学系统的成像性能确定的(点扩展大小)。

    成像过程为:每次成一条线上的像后(X方向),在检测系统输送带前进的过程中,排列的探测器扫出一条带状轨迹从而完成纵向扫描(Y方向)。综合横纵扫描信息就可以得到样品的三维高光谱图像数据。

 

2 像立方体

 

 

 

镜头:22mm镀膜消色差镜头;光谱范围:900nm-1700nm,光谱分辨率:5.36nm@1129.58nm

探测器像素:320x256;内置控制、扫描机构;内置电池;软件:控制完成自动曝光、自动对焦、自动扫描速度匹配;数据处理:黑白、辐射度、均匀性、镜头等校准;光谱查看。

3 高光谱成像仪

  本文不同种类的红枣作为研究对象,利用近红外相机(光谱范围900nm-1700nm)采集测试对象的高光谱数据。

4 样本的RGB图(R:1235nm G1409nm B:1536nm

对原始数据进行主成分分析(Principal Component Analysis, PCA),去除波段之间的多余信息、将多波段的图像信息压缩到比原波段更有效的少数几个转换波段下。同时利用由于光谱仪采集得到的光谱信号中既包含实验所需的有用信息,同时由于仪器精密度等原因带来随机噪声,最常用的消除噪声的方法Savitzky-Golay(SG)卷积平滑法,通过多项式来移动窗口内的数据进行多项式最小二乘拟合信号平滑,既消除噪声又保留了光谱轮廓。由于各个样本间分布不均匀、样本大小不一样、样本表面散射及光程变化等都会产生散射影响,采用多远散射校正(multiplicative scatter correctionMSC)的方法可以有效的消除这些散射影响。

5 PCA处理

分别选取样本上的两个区域标注为骏枣-A和灰枣-B,以此为标样对其他样品进行归类识别。对已经划分出来的类别进行PLS-DA算法处理,评估划分出来类别成分。

A、 分别在前面几种不同预处理方法的基础上,对样品进行主成分分析聚类。并对数据做PLS-DA算法处理,PLS-DA方法是基于PLS回归的一种判别分析方法,在构造因素时考虑到了辅助矩阵以代码形式提供的类成员信息,因此具有高效的鉴别能力。

B、 利用主成分分析得到的载荷图提取对各类植物识别敏感的特征波长。以特征波长为输入变量,从每种植物的样本中随机抽取2/3组成建模集,通过这组样本的光谱及其对应的基础数据,利用簇类的独立软模式 soft independent modeling of class analogy(SIMCA)分类法建立识别模型,对样本进行分类。

     SIMCA方法为每个类建立了独立的主成分分析(principal component analysis,PCA)模型,然后依据该模型对未知样品进行分类。然而,该方法在建立模型时没有考虑到其他的类,因此,在每个类的模型中,有些因素在获取类中明显的变化时只能反映出有限的鉴别信息。当多维数据不同类中的子空间都非常接近时,由于类之间不必要的重叠,从而存在产生非优化鉴别模型的危险。 

    获取灰枣和骏枣的特征光谱,可以看出,两种栆的特征光谱位置基本一致,只是其光谱反射率会有一些差别。具体成因还需进一步分析。

6 灰枣(红色)和骏枣(绿色)特征高光谱

 

7 SIMCA方法分类识别结果

 

通过获取感兴趣的平均光谱,利用(SIMCA)分类法建立识别模型,对样本进行分类。预测骏枣-A所占比例为65.6%,灰枣-B所占比例为34.4%


 

 

8 SIMCA方法分类统计结果

 

川公网安备 51011202000202号