想知道你的普洱熟茶是冰岛还是班章吗?高光谱与卷积神经网络助您轻松识别
作者利用高光谱成像结合卷积神经网络,构建了一种针对普洱熟茶产地的快速、无损且高精度识别方法。作者认为,CNN具备从高维、高非线性数据中自动提取全局和局部特征的能力,相比传统机器学习更适合处理高光谱数据。基于这一认识,本文尝试将近红外高光谱成像与AlexNet模型结合,用于普洱熟茶产地识别,以弥补现有研究在普洱熟茶产地判别方面的不足,并为茶叶市场防伪和品质监管提供新的技术手段。
作者信息:陈满骄,四川轻化工大学,硕导
期刊来源:Journal of Food Composition and Analysis
研究内容
本文以普洱熟茶产地的快速、无损识别为研究目标,旨在解决传统人工感官鉴别主观性强、理化分析方法复杂低效的问题。为此,研究构建了一种基于近红外高光谱成像(HSI)与深度学习相结合的识别方法:首先采集不同产区茶叶的高光谱图像,并通过黑白校正、异常样本剔除及光谱预处理提升数据质量;随后提取一维光谱数据与二维灰度图像数据,并以二维灰度图作为输入构建改进的AlexNet卷积神经网络模型,实现对茶叶产地特征的自动学习与分类;同时,建立PLS-DA和SVM模型作为对比,评估深度学习方法的优势;*后结合t-SNE对特征进行可视化分析,并通过外部验证集检验模型的泛化能力。
实验设计
该研究所用茶样为后发酵普洱熟茶,原料采自六大普洱茶主产区的认证茶园鲜叶,经发酵制得,分别为:临沧茶区冰岛(BD)、勐海茶区班章(BZ)、易武茶区宫廷易武(GT)、保山茶区高黎(GL)、思茅茶区景迈(JM)以及大理茶区下关沱茶(XG)。每种茶取15 g作为一个样本,总计90 g。为验证预测模型的性能,每种茶额外采集约200片茶叶用于构建验证集。
该研究中的HSI系统由GaiaField-N17E-HR光谱相机(江苏双利合谱科技有限公司)、四组50 W卤素光源(OSRAM ,德国)以及配备高光谱采集软件的计算机组成。近红外相机的工作光谱范围为886.00–1735.34 nm,空间分辨率为640 × 666像素,光谱分辨率为1.7 nm,包含512个光谱波段。为获取清晰准确的图像,系统参数设置如下:相机曝光时间为2.5 ms;图像红、绿、蓝值分别为928.19、935.46和916.67;扫描速度为0.65 mm/s;相机增益为1。数据采集时,将0.5克茶叶样品置于直径120 mm、高度15 mm的培养皿中进行高光谱图像采集,每片茶叶作为样本。每种茶叶品种采集30张图像,共计获得180张(30 × 6 = 180)高光谱图像。*终使用光谱采集软件(SpecVIEW)对采集的高光谱图像进行校准,并保存校准后的图像。
采集的高光谱样本包含待测样本(即茶叶)及无用背景信息。但由于普洱熟茶叶片形状不规则且颜色与背景相似,难以实现背景与茶叶的完全分离。为此,研究采用大津阈值算法结合分水岭算法对茶叶进行背景分割,从而获得目标感兴趣区域(ROI),并从中提取数据。*终提取出两类数据:(1)一维光谱数据;(2)二维灰度图像数据。其中光谱数据通过计算ROI内所有像素点的平均光谱值获得。
研究方法
为进一步提升数据质量并增强模型性能,研究采用孤立森林(IF)算法进行异常数据剔除,关键参数设置如下:树数量为100,每棵树样本数为512,污染比为0.1,异常分数阈值设为0.5(分数低于0.5视为正常数据,高于0.5视为异常数据)。
环境光干扰和电子噪声等干扰因素可能导致高光谱数据产生噪声,进而影响预测模型的性能与准确性。研究采用SG卷积平滑法、多元散射校正(MSC)及标准正态变异(SNV)三种方法,对茶叶样本的二维灰度图像数据和一维光谱数据进行预处理。此外,作者还探索了MSC+SG叠加预处理方法在构建普洱熟茶地理原产地预测模型中的应用价值。
高光谱数据通常包含数百个波段,其中可能存在大量信息高度相关的冗余波段。研究采用两种混合特征选择方法:区间偏*小二乘法-变量组合群体分析迭代保留信息变量法(iPLS- VCPA - IRIV)和区间偏*小二乘法-变量重要性投影迭代保留信息变量法(iPLS-VIP- IRIV),从原始及预处理光谱数据中提取相关特征波长。
在模型构建方面,深度学习方法采用的是是AlexNet。由于AlexNet为二维CNN模型,故从茶叶高光谱图像中提取二维灰度图像数据以匹配模型输入格式。为确保模型识别精度,对网络进行两处改进:单GPU训练与模型深度调整。该模型共包含8层(图1),其中1–5层为卷积层(Conv1–Conv5),6–8层为全连接层(FC6–FC8)。为抑制过拟合,Conv1–Conv5后采用ReLU激活函数,FC6与FC7后引入Dropout正则化。
图1. AlexNet模型结构
为比较AlexNet深度卷积神经网络在预测普洱茶叶地理来源时的计算性能与预测精度,该研究基于茶叶的一维光谱数据构建了两种传统机器学习模型——偏*小二乘判别分析法(PLS-DA)和支持向量机(SVM)。PLS-DA采用网格搜索法遍历所有可能的参数组合,以确定*优潜在变量数。 SVM 模型中的核参数g和惩罚系数C等参数均通过网格搜索法进行优化。采用准确率(Acc)作为评估分类模型性能的指标。
为验证AlexNet模型特征提取的有效性,研究采用t-SNE算法对高维特征数据进行可视化分析。将AlexNet模型*后一层的特征向量通过t-SNE映射至二维空间。若所得数据分布呈现清晰边界,则表明数据已实现有效聚类。
结果
茶叶样品原始光谱曲线中光谱在起始与结束处存在严重畸变。为消除这些畸变,对从茶叶高光谱图像中提取的原始光谱数据进行波段相关性分析,阈值设定为0.7。BD与GT茶样的波段相关性结果分别见图2(a)和(b)。分析发现,BD与GT具有高度相似性,高相关红色*域对应的波段占全波段的93.75%,而其他颜色*域仅占6.25%。据此,剔除相关系数低于0.7的32个波段(886.00–890.99 nm和1692.12–1735.34 nm),保留信噪比(S/N)较高的波段(894.31–1690.46 nm)用于后续分析。
图2. 基于全波段的波段相关性分析结果:(a) BD;(b) GT。
图3(a)和3(b)分别展示了“BD”与“GT”两个茶叶品种中正常样本与异常样本的光谱曲线。光谱曲线的顶部和底部被归类为异常样本,而正常样本的光谱曲线则均匀分布于中间区域,曲线整体分布较为杂乱。如图3(b)所示,一些光谱曲线呈现明显异常趋势的样本也被成功识别并归类为异常样本,说明IF算法能够有效识别并剔除各类茶叶样本光谱数据中的异常信息。
图 3:异常样本的光谱曲线:(a) BD 品种;(b) GT 品种。
图 4 展示了六种不同茶叶品种的平均光谱曲线。由于这六个品种均为普洱熟茶,内部成分相似,因此其光谱整体趋势大致相同。其中,BZ、GL、JM 和 XG 四个品种的整体光谱反射率高于另外两个品种。然而,局部图谱显示,在 900–960 nm 波段范围内,BZ 品种的光谱反射率低于其他几个品种。
图 4:茶叶样品的平均反射光谱
AlexNet 模型的超参数设定为:学习率为 0.00001,迭代次数为 300,mini-batch 大小为 64。在剔除异常数据后,采用SG、MSC、SNV以及 MSC+SG对光谱数据进行预处理,并由此生成二维灰度图像。随后,利用原始灰度图像与预处理后的灰度图像分别构建 AlexNet 模型,以探究预处理对 AlexNet 预测模型准确率的影响。在测试集中,基于 MSC+SG 方法预处理后的数据所构建的 AlexNet 预测模型表现*佳,其准确率达到 95.66%,比使用未处理数据构建的同一模型高出 2.98%。
在CNN中,若**层卷积核尺寸过大,可能会忽略图像中的微小特征,导致初始特征提取不够精细;反之,若卷积核尺寸过小,则可能在初始特征提取阶段缺乏全局信息,从而影响后续层级的特征提取效果。该研究中,**层卷积核的原始尺寸为 9×9。为了判断该尺寸是否合理,另外采用了三种不同尺寸的卷积核(11×11、6×6 和 3×3)进行对比实验。总体而言,**层卷积核尺寸为 9×9 时,所构建的 CNN 模型具有*高的准确率。
图 5(a) 展示了训练前各茶叶品种特征的 t-SNE 可视化结果。BD 和 GT 两个茶叶品种形成了较为紧凑的聚类,而其他四个品种的样本则聚集在一起。所有茶叶品种的特征位置分布杂乱,且存在显著的重叠,表明这六个茶叶品种在训练前的数据无法直接对每个品种进行分类。然而,在训练之后,可以明显看出,同一茶叶品种的特征聚类非常紧密,各品种之间的边界清晰、距离分明,仅有少数茶叶样本被错误地分布到其他聚类中(图 5(b))。这一结果表明,同一品种普洱茶的特征能够被有效识别,AlexNet 模型可以区分不同茶叶品种的特征,从而实现分类。
图 5:训练前后高维特征的 t-SNE 可视化结果:(a) 训练前;(b) 训练后
与输入CNN模型的二维灰度图像类似,该研究对各类茶叶样本的一维平均光谱数据也采用了相同的四种预处理方法(SG、MSC、SNV 以及 MSC+SG)进行处理。随后,利用原始光谱数据和预处理后的光谱数据分别构建了两种机器学习模型——PLS-DA 和 SVM,以探索光谱数据的*佳预处理方法。在测试集上的分析结果表明,基于预处理后的光谱数据所构建的 PLS-DA 和 SVM 模型,其性能均优于基于原始光谱数据构建的对应模型。采用 SG 算法预处理后的光谱数据所构建的模型准确率*高,SVM 和PLS-DA模型分别达到了89.41%和 87.44%。因此,后续分析中采用 SG 方法对一维光谱数据进行预处理。
该研究采用两种特征波长筛选算法——iPLS-VCPA-IRIV 和 iPLS-VIP-IRIV——从光谱数据中提取特征波长。iPLS-VCPA-IRIV 和 iPLS-VIP-IRIV 算法分别从全光谱数据集中提取了 11 个和 10 个特征波长(如图 6 所示)。所选特征波长主要集中在 900–1000 nm、1400–1450 nm 以及 1500–1650 nm 波段。
图 6:不同提取方法的特征波长分布结果:(a) iPLS-VCPA-IRIV;(b) iPLS-VIP-IRIV。
基于不同特征筛选算法提取的数据以及全光谱数据,分别构建了 PLS-DA 和 SVM 两种模型。将使用特征波长构建的 PLS-DA 和 SVM 模型的准确率与使用全光谱数据构建的对应模型进行比较,发现经过特征提取后,两种模型的性能均有所下降。总体而言,尽管特征提取方法极大地简化了模型,但并未优化基于一维数据的机器学习模型的性能。
之后,比较了AlexNet模型及两种机器学习模型识别六种茶叶品种的准确率。AlexNet模型在训练集分析中的准确率均超过99.7%。SVM 与PLS-DA模型的准确率分别约为93%和91%,这两种机器学习模型在识别六种茶叶品种特征差异方面仍不及CNN。测试集中AlexNet模型的*佳准确率达95.66%,而 SVM 与PLS-DA模型的*佳准确率分别为89.41%和87.44%,且两种机器学习模型在特征提取后性能进一步下降。因此AlexNet模型在普洱茶品种识别中表现优于 SVM 与PLS-DA模型,这归因于CNN对数据特征的高效提取能力。
为了评估基于各类普洱茶样品二维灰度图数据所构建的 AlexNet 模型的泛化能力,该研究将外部验证集输入该模型进行分析,识别结果如图 7 所示。模型在对包含六个茶叶品种(BD、BZ、GL、GT、JM 和 XG)的验证集进行分析时,准确率分别为 100%、97%、97.5%、98%、96.5% 和 97%。从图 7 中可以直观地看出,除 BD 外,其他五个品种的普洱茶均存在少量误判。所有茶叶品种的分类错误数量均在 0 至 7 个样本之间,准确率均高于 96.5%,表明 AlexNet 模型的整体分类效果优异。
图 7:茶叶验证集识别结果可视化