基于高光谱成像的枇杷含水率空间分布特征及其新鲜度判定方法
应用方向:
高光谱成像技术在农业与食品领域展现出了广阔的应用前景,尤其在水果等农产品的无损品质检测与智能分级。通过获取果实在不同波段下的光谱与空间信息,高光谱成像能够实现对内部含水率分布的精准表征与可视化,为果实新鲜度评价和品质分级提供可靠依据。同时,该技术可用于果实成熟度与贮藏状态监测,辅助优化采后处理与冷链管理过程。在实际应用中,高光谱成像还可与智能算法和自动化分选设备相结合,构建在线检测与分级系统,提升农产品质量控制水平和加工效率,对推进智慧农业和农产品精细化管理具有重要意义。
背景:
枇杷作为一种高水分、高呼吸强度的鲜食果品,在采后贮藏和流通过程中极易发生失水、软化和品质劣变,而含水率的变化是影响其新鲜度和商品价值的关键因素之一。传统的枇杷含水率与新鲜度检测方法多依赖取样、破坏性测定或主观经验判断,难以实现快速、无损和空间分布层面的精准评估,无法满足现代果品品质分级和精细化管理的需求。高光谱成像技术能够同时获取样品的空间信息和光谱信息,在无损条件下反映果实内部水分状态及其空间分布特征,为果品水分检测与品质评价提供了新的技术途径。因此,该研究探索了利用高光谱成像技术对枇杷含水率分布进行可视化分析,并在此基础上实现枇杷新鲜度的科学分级,以提升枇杷品质监测的客观性、准确性和实用性。
作者信息: 尚静,贵阳学院,硕士生导师
期刊来源:Journal of Food Composition and Analysis
研究内容
该研究以枇杷为研究对象,围绕其含水率分布特征与新鲜度分级需求,探索高光谱成像技术在果实内部品质无损检测中的应用潜力。研究通过高光谱成像系统,获取枇杷在可见—近红外波段范围内的高光谱数据,并对样品进行系统的光谱与空间信息分析。在此基础上,提取与含水率变化密切相关的光谱特征,建立枇杷含水率预测模型,实现果实内部水分分布的可视化表达。同时,结合含水率分布特征与品质指标,对枇杷新鲜度进行分级判别。研究证明了高光谱成像技术用于枇杷含水率无损检测与新鲜度分级的可行性,为果品品质评价与分级提供一种快速、直观且非破坏性的技术手段。
实验设计
新鲜枇杷样品(横向直径:35-55 mm)从位于中国贵州省的果园收集,共采集了120个无缺陷、形状相对均匀的样品,采集当天将样品运送至实验室,然后按样品编号均匀分为4组,22 ± 3 ℃保存,1天后开始实验,持续4天。每天,在实验中使用一批30个样品。在实验过程中收集每个样品的高光谱图像,随后获得样品的水分含量(MC)值。
本研究使用了推扫式高光谱成像(HSI)系统(GaiaField-F-V10,双利合谱,中国)获取枇杷的高光谱反射图像。该HSI系统主要包括图像光谱仪、CCD相机(像素:696 × 1313)、变焦镜头(焦距:23mm)、四盏200W卤素灯(HSIA-LST-200 W)、传输装置(HSIA-T400-IMS)、暗箱(HSIAT400-IMS)和计算机。变焦镜头与传输平台之间的距离设定为400毫米,CCD相机的曝光时间为12.6毫秒,光谱分辨率为3.5纳米,空间分辨率设置为0.2毫米/像素。枇杷样品被放置在传输平台上,并以1厘米/秒的速度移动。
为了减轻传感器暗电流引起的不均匀光强度分布和噪声的影响,对枇杷的原始高光谱图像进行反射率校正。之后将校正图像导入ENVI 5.4软件后中,选取整个枇杷的表面作为感兴趣区域(ROI),以ROI内所有像素的平均光谱作为每个枇杷样品的光谱,由于提取的光谱曲线两端存在噪声,选择390-1030 nm范围内的波长作为有效光谱。
研究方法
在高光谱图像采集过程中,仪器性能、随机误差和环境因素都会引起基线漂移和随机噪声等问题,因此,为了校正光谱差异并减轻干扰信息的影响,采用MSC和SNV对原始光谱进行预处理。使用联合x-y距离(SPXY)算法划分校准集与预测集,比例为3∶1。
在每次高光谱图像采集中,相机在 390–1030 nm 波段范围内采集了 256 个光谱图像波段,其中包含大量无关且高度共线的数据。为提高模型构建的效率,有必要剔除那些会增加建模复杂度的冗余信息。在本研究中,采用竞争自适应重加权采样(CARS)、遗传算法(GA)和逐步投影算法(SPA)对特征波长进行筛选,并进一步确定*优的特征波长选择方法。
基于全光谱数据和 MC 参考值,分别采用偏*小二乘回归(PLSR)和主成分回归(PCR)构建预测模型。基于特征波长和 MC 参考值,进一步建立了多元线性回归(MLR)、极限学习机(ELM)和反向传播神经网络(BPNN)三种模型。回归模型的性能采用多种指标进行评估,包括校正集的决定系数(R²_C)和预测集的决定系数(R²_P),均方根误差(校正集 RMSEC 与预测集 RMSEP),以及预测集的相对预测偏差(RPD)。
采用偏*小二乘判别分析(PLS-DA)、多项逻辑回归(MLogR)和反向传播神经网络(BPNN)三种分类器,构建分类模型以区分不同贮藏时间下枇杷的新鲜度等级。在本研究中,采用混淆矩阵、分类准确率以及受试者工作特征(ROC)曲线对分类模型的整体性能进行评估。
结果
图1给出了全部枇杷样本的原始反射光谱以及不同贮藏时间下的平均光谱。可见,各贮藏时段的光谱曲线形态相似,但反射强度存在明显差异(图1b),这主要归因于枇杷水分含量(MC)随贮藏时间的变化。
图1 枇杷样本光谱 a) 原始反射光谱;b) 不同贮藏时间的平均光谱。
为提升预测模型性能,采用 SNV 与 MSC 两种光谱预处理方法消除原始光谱中的干扰信息。通过基于不同预处理建立的 PLSR 与 PCR 模型对枇杷水分含量(MC)的预测效果可知,光谱预处理显著改善了模型表现,其中 SNV 预处理效果*优;同时,PLSR 模型整体性能优于 PCR 模型。
CARS 通过交叉验证确定*佳特征波长数,以实现光谱特征的高效筛选。设置 Monte Carlo 采样次数为 50、交叉验证折数为 5,随着采样次数增加,交叉验证均方根误差(RMSECV)呈先降后升趋势,并在第 30 次采样时达到*小。此时优选出的波长子集共包含 14 个特征波长。在遗传算法(GA)中,设置种群规模为30,交叉概率0.5,变异概率0.01,迭代次数100。以交叉验证均方根误差(RMSECV)*小为准则,筛选出用于预测枇杷水分含量(MC)的*佳波长组合,共获得27个特征波长。SPA 以模型 RMSE *低时的波长数作为*终特征。随着有效波长数增加,RMSE 先下降;当波长增至某一数量后,RMSE 降幅趋于平缓。本研究中,RMSE 在第 23 个特征波长处不再单调降低,故将 SPA 提取的 23 个波长定为关键变量。
以优选的特征波长替代全谱,用于枇杷MC预测。基于CARS、GA、SPA特征波长建立的MLR、ELM和BPNN模型显示,无论采用哪种特征提取方法,MLR模型的表现均优于ELM和BPNN;进一步比较发现,以CARS特征建立的MLR模型又显著优于GA和SPA对应模型。其中,SNV-CARS-MLR组合效果*佳,其R²c、R²p与RPD分别达到0.85、0.82和2.40,RPD>2.0表明该模型具有优异的稳定性和预测能力。图2给出了预测值与实测值的散点对比。
图2 SNV-CARS-MLR 模型散点图 横轴:实测水分含量(%),纵轴:预测水分含量(%); R²p = 0.82,RPD = 2.40,预测值与实测值高度吻合。
为直观观察枇杷水分含量的细微差异并辅助新鲜度分级,将高光谱图像逐像素光谱输入*优预测模型(SNV-CARS-MLR),计算各像素 MC 值并生成伪彩分布图。图3 给出 4 个典型样本(对应新鲜度等级 I–IV)的 MC 分布图。图中采用红–蓝线性色标(右侧色带)直观显示 MC 由高到低的变化;每幅图旁标注的数字为该样本整体平均 MC。
图3 不同贮藏时间枇杷的MC分布图 (色标由红到蓝表示 MC 从高到低,数字为样本平均 MC 值)
水分含量(MC)是衡量果实新鲜度的核心指标,MC 越高,果实越新鲜。本研究将枇杷新鲜度划分为 I–IV 四个等级。随后,以 CARS、GA、SPA 提取的特征波长分别建立 PLS-DA、MLogR 与 BPNN 新鲜度判别模型,基于CARS、GA、SPA构建的MLogR模型在校正集上准确率达100%,优于PLS-DA与BPNN;然而,在预测集上,BPNN系列模型表现*佳,其中CARS-BPNN以93.33%的判别率高居榜首。混淆矩阵(图4)进一步显示:GA-PLS-DA将5个真实IV级样本误判为III级;GA-MLogR出现1个III→IV和2个IV→III的错分;CARS-BPNN仅出现2个IV→III的错分,误差*小。ROC曲线(图5)亦证实CARS-BPNN的AUC*高。综上,CARS-BPNN在枇杷新鲜度分级中表现*优,校正集与预测集判别准确率分别为95.56%与93.33%。
图4. 混淆矩阵a) GA-PLS-DA 模型;b) GA-MLogR 模型;c) CARS-BPNN 模型。
图5. GA-PLS-DA、GA-MLogR 与 CARS-BPNN 模型的 ROC 曲线
结论
本研究探讨了利用HSI实现枇杷MC的快速无损预测、可视化其水分分布,并判别不同贮藏时间下的新鲜度等级。首先,以 MSC 与 SNV 算法对全波段进行预处理,建立 PCR 和 PLSR 模型,筛选*佳预处理方法;随后,在 CARS、GA、SPA 提取的特征波长基础上,构建 MLR、ELM 与 BPNN 模型,以确定枇杷 MC 的*优预测方案。结果显示,SNV-CARS-MLR 模型表现*佳,其 R²c、R²p 与 RPD 分别达到 0.85、0.82 与 2.40,RPD > 2.0 表明模型具有优异稳健性。进一步将该模型逐像素应用于枇杷高光谱图像,生成 MC 分布伪彩图。在新鲜度判别环节,CARS-BPNN 模型显著优于其他方案,校正集与预测集识别准确率分别为 95.56 % 与 93.33 %。综上,HSI 可作为一种快速、无损的手段,用于枇杷 MC 预测、分布可视化及新鲜度分级。