
文章详情
基于连续小波变换与高光谱成像技术的霉变花生精准识别研究(上)
日期:2025-04-30 19:59
浏览次数:78
摘要:
应用方向:
本研究结合高光谱成像技术和连续小波变换(CWT),聚焦于霉变花生的精准识别,通过提取光谱敏感特征区分健康与霉变样本。这一方法展示了高光谱技术在食品质量与**检测中的重要应用价值,尤其在霉变与**感染监测、农产品自动分选和在线监控等方面具有广泛潜力。相比传统检测方法,高光谱技术实现了非接触、快速、绿色环保的检测方式,为食品**监管及智能农业提供了高效解决方案。
背景:
花生作为全球广泛种植和消费的重要油料作物,具有很高的营养价值。然而,由于其特殊的组成成分,花生极易受到**(...
应用方向:
本研究结合高光谱成像技术和连续小波变换(CWT),聚焦于霉变花生的精准识别,通过提取光谱敏感特征区分健康与霉变样本。这一方法展示了高光谱技术在食品质量与**检测中的重要应用价值,尤其在霉变与**感染监测、农产品自动分选和在线监控等方面具有广泛潜力。相比传统检测方法,高光谱技术实现了非接触、快速、绿色环保的检测方式,为食品**监管及智能农业提供了高效解决方案。
背景:
花生作为全球广泛种植和消费的重要油料作物,具有很高的营养价值。然而,由于其特殊的组成成分,花生极易受到**(如黄曲霉)的感染,进而产生强致癌性的黄曲霉**(AFB1)。这种**不仅对人类和牲畜健康构成严重威胁,还可能导致农民、加工商及分销商的经济损失。
现有的黄曲霉**检测方法(如薄层色谱、高效液相色谱等)尽管准确,但存在耗时、操作复杂、依赖专业人员等局限性,不适用于自动化检测场景。而近红外光谱及高光谱成像技术因其非接触性及高效性,逐渐成为食品质量评估领域的重要工具。然而,高光谱成像数据的高维特性给实时检测系统带来了计算负担,特征降维成为后续数据处理的必要步骤。
连续小波变换(CWT)作为一种有效的特征提取方法,可在不同波长和尺度上分解光谱数据,从而识别出细微的光谱特征。尽管CWT在某些领域已显示出其优越性,但其在谷物和油料作物**感染检测中的应用仍较少。本研究旨在结合CWT和高光谱成像技术,开发一种高效、可靠的霉变花生识别方法。具体的研究目标为:(1)探索霉变花生的光谱特性;(2)确定适用于霉变花生检测的*佳CWT特征;(3)比较CWT提取的小波特征与传统波段选择方法的分类性能。
实验设计
1.1材料与方法
(1)花生样品制备
从市场上购买了三种花生品种:花育(HY)、四粒红(SLH)和小白沙(XBS)。手工挑选出完好无损的健康花生,并将其分成两部分:一部分妥善保存作为健康样本,另一部分用于获取霉变花生样本。为了获得霉变花生样本,将花生放入容器中,并置于37°C的恒温箱中,相对湿度设定在85~90%,持续10天以促进曲霉菌属的快速繁殖。从第11天起,温度调整至30°C,相对湿度保持不变。分别在第20天和第30天取出花生作为不同霉变阶段的霉变样本。然后,对于HY品种的花生,随机选取8个健康、霉变20天和霉变30天的样本,并使用黄曲霉**B1(AFB1)快速检测试纸进行评估。对于另外两种花生品种,每种随机选取10个健康、霉变20天和霉变30天的样本,并使用AFB1快速检测试纸进行评估。AFB1快速检测试纸*低检测限为5 ppb。该产品采用竞争性抑制金**层析法原理。当样本溶液中的 AFB1 浓度超过检测限时,检测线不会显现颜色反应,结果判定为阳性;当样本溶液中的 AFB1 浓度低于检测限时,检测线呈现紫色反应,结果判定为阴性。在实验过程中,健康花生样本经 AFB1 快速检测试纸检测,其 AFB1 含量均低于 5 ppb,据此假设所有健康花生样本均为健康。相反,霉变花生样本经检测发现 AFB1 含量均超过 5 ppb,因此假设所有霉变花生均为霉变。为排除水分含量对实验结果的干扰,健康与霉变的花生仁分别在 60°C 的干燥箱中干燥 24 小时。
对于每种花生品种,我们获取了七张高光谱图像(三张用于训练,四张用于测试)。图1展示了用于获取这七张高光谱图像的花生样本(HY)的照片。前三张图像显示了用作训练数据的花生样本,**张展示了健康的花生样本,**张展示了第20天获得的霉变花生样本,*后一张展示了第30天获得的霉变花生样本。后四张图像展示了用作测试数据的花生样本;其中前两张是健康花生和第20天获得的霉变花生的混合物,另外两张是健康花生和第30天获得的霉变花生的混合物。*终,共成像了547个花生样本(HY:154个,XBS:175个,SLH:218个),包括252个健康花生样本和295个霉变花生样本。在这些样本中,232个花生样本,包括79个健康样本和153个霉变样本,被用作训练数据;315个花生样本,包括173个健康样本和142个霉变样本,被用作测试数据。


图1.用于获取七张高光谱图像的花生样本(HY)照片:顶部三张图像用于训练数据集,底部四张图像用于测试数据集
(2)高光谱成像系统与图像采集
高光谱图像采集使用的是GaiaSorter(江苏双利合谱科技有限公司)设备。它由四个部分组成:一个光谱成像系统、一个照明系统、一个传送台和一个计算机。光谱成像系统由一个高光谱相机(Image-λ-N25E-HS)组成,其光谱范围为920至2530纳米,该相机连接到一个标准的C口变焦镜头(F/2, f = 22.5 mm, HSIA-OLES22)。照明系统由四个200瓦的溴钨灯(HSIALS-T-200W)组成。传送台由一个样品台和集成的电动精密传送台(HSIAT500)构成。计算机安装了SpecVIEW系统控制软件。
花生样本被放置在一个10厘米×10厘米的黑色托盘中以获取高光谱图像,如图1所示。所获得的图像共有288个波段,光谱分辨率为5.6纳米。此外,为了校正所采集的高光谱图像,我们收集了一张白参考图像,并通过完全关闭相机光圈记录了一张黑参考图像。
(3)高光谱图像预处理与光谱提取
图像采集完成后,将所得到的高光谱图像使用黑参考图像和白参考图像进行校正。另外,在捕获高光谱图像时,随机噪声是不可避免的,因此在进行进一步数据处理之前需要对数据进行了滤波。在本研究中,采用了五点平滑滤波器来处理高光谱数据。
非花生像素不仅在后续数据处理中无用,甚至可能对分析结果产生干扰,因此被标记为背景并赋予零值。为了提取紧密相连且无法通过简单阈值分割的花生区域,采用了标记控制的水洗算法生成掩模图像。随后,利用该掩模图像有效去除背景信息。在此基础上,进一步进行了预处理操作,包括图像裁剪以及低信噪比波段的移除。*终,筛选出波长范围为1000-2486nm的 265个波段用于分析
在图像空间分割上,采用了区域生长算法,其本质是将具有相似属性的像素组合在一起。对于每个区域,指定一个种子点作为生长的起点;然后,比较周围的像素点以确定它们是否包含在区域内。在本研究中,应用了四邻域区域生长算法到掩模图像上,以连接同一核区域内的像素,并为它们分配一个序列号。然后,每个花生仁都可以通过序列号轻松追踪,这有利于实现花生分选的工业自动化。
对于健康的花生样本,我们从每种花生的训练图像中随机选取了100个像素。对于发霉的花生,首先从训练图像中手动选择发霉的像素作为感兴趣区域(ROI);然后,从每种花生的ROI中随机选取50个像素。因此,共计获得了600个花生像素样本,其中包括300个健康花生像素和300个不同程度**感染的发霉花生像素。所选取的花生像素样本如图2所示。


图2.选定花生像素样本的分布情况
(4)方法
特征波长提取:
连续小波变换(CWT)是一种强大的方法,用于在不同尺度和分辨率下检测和分析高光谱数据中的微弱信号。本质上,CWT是一种线性操作,通过使用母小波函数在不同的波长和尺度上,可以将高光谱反射光谱转换为一系列系数。在本研究中,由于吸收特征的形状类似于准高斯函数,因此选择了墨西哥帽作为母小波基。为了减轻计算负担,仅保留了二进制尺度(21, 22, 23, …, 和 27)上的小波功率;因为总波段数为267,所以大于27 = 128的尺度上的分解分量不再携带有意义的光谱信息。
杰弗里斯-马图西塔(J-M)距离是一种灵活直观的特征可分性指数,用于衡量两个不同类别之间的特征,并广泛用于指导特征选择。杰弗里斯-马图西塔距离(J-M距离)的范围是0到2,它提供了两个类别之间可分性的一般度量。J-M距离越大,意味着两个类别之间分离的概率越高,反之亦然。在本研究中,J-M距离被用来评估不同尺度和波长下的小波系数,以进行小波特征(WF)的选择。
为了识别发霉花生仁,需要一种特征选择方法来识别*重要的特征,因为许多WFs由于连续分解是冗余的,因此要选择有意义的小波特征。首先,使用Mexican Hat作为母小波,通过CWT对每个花生仁的原始高光谱反射数据进行分解,分解尺度为21、22、23,……,27。这样,原始光谱就被转换成了在不同波长和尺度上的一组小波系数。其次,通过计算健康和发霉花生样本之间的J-M距离,构建了J-M距离尺度图。*后,根据J-M距离降序排列特征,并应用一个阈值J-M距离来划分前1%的特征。由阈值划分的特征在J-M距离尺度图上形成了一个分散的特征区域。理论上,所有在特征区域内的特征都是被选择的小波特征。然而,它们携带了冗余的光谱信息,因为同一区域内的特征是在连续的波长位置和尺度上产生的。因此,对于每个特征区域,使用具有*大J-M距离的特征来代表该特征区域捕获的光谱信息。
SPA是一种前向变量选择算法,通常用于减少模型中的变量数量,提高建模的速度和效率。它从单一波长开始,然后在每次迭代中加入一个新的波长,直到达到指定的波长数量。新选择的变量是在之前选择的变量正交子空间上具有*大投影值的变量。因此,SPA提取的有用变量子集具有*小的共线性。*优的变量数量通过均方根误差(RMSE)来确定。在我们的研究中,SPA被用来选择*优的波段以与WFs进行比较。
分类模型:
我们将健康花生标记为1,发霉花生标记为2。为了评估WFs以及SPA选择的*优波段的性能,我们使用了两种分类模型:偏*小二乘判别分析(PLS-DA)和支持向量机(SVM)。通过计算健康花生和发霉花生的整体分类准确率来评估WFs的性能。在PLSR中,由于预测响应很少直接产生等于1和2的二元结果,而是接近1或2的结果,因此使用了1.5作为分类的阈值。此外,PLS-DA模型中理想的潜在变量数量是通过五折交叉验证下RMSE的值来确定的。在SVM中,径向基函数(RBF)核被用作SVM分类框架的核。在评估方法中,通过计算灵敏度、特异性和总体准确性(OA)来评估分类模型的性能。
为了更清晰地说明图像处理步骤,图3展示了一个流程图。虚线框中的部分专门针对训练数据,用于确定*佳波段和特征权重。验证图像则跳过此部分,直接使用与训练图像相同的*佳波段和特征权重。

图3.图像处理流程图
1.2.结果与讨论
(1)花生的光谱反射率
图4展示了健康和霉变花生的反射光谱,这些光谱是通过计算不同类别样本光谱的平均值得出的。在健康花生的反射光谱中可以看到六个显著的吸收峰,分别位于大约1208纳米、1472纳米、1747纳米、1938纳米、2145纳米和2329纳米(用黑点标记),主要可以归因于与花生中的水分、蛋白质和油脂成分相关的CH、NH和OH的吸收。在1000-1500纳米的波长范围内,健康和霉变花生的光谱曲线形状明显不同。当花**生霉变时,1118纳米处的反射率降低,导致吸收峰减弱。在1365-2486纳米的波长区域,霉变花生的反射值高于健康花生,这可能归因于**污染引起的散射和吸收特性。**的侵入可以使花生仁胚乳变得多孔,这可能导致霉变花生比健康花生散射更多的光线,这种散射会导致在反射模式下吸收更少的近红外辐射。

图4.健康与霉变花生的光谱响应:黑点表示健康花生的吸收峰,垂直虚线表示由SPA选择的*佳波长变量。