文章详情

高光谱成像智能检测系统:大米水分/脂肪酸含量无损分析与可视化平台(中)

日期:2025-04-28 03:57
浏览次数:123
摘要:在本研究中,高光谱成像技术(HSI)主要应用于大米水分含量和脂肪酸含量的无损检测与可视化分析。通过结合化学计量学方法,HSI技术不仅能够获取大米的外部物理特征,还能深入分析其内部化学成分,实现精准、高效的质量评估。该技术可用于大米在预存储阶段的快速检测,识别水分和脂肪酸含量异常样本,从而优化储存管理。此外,HSI还可应用于存储过程中的实时监测,直观展示水分和脂肪酸的空间分布,便于及时发现潜在的品质劣化问题。本研究表明,高光谱成像技术在粮食质量检测和储存监测领域具有重要应用价值,为提高粮食**性、减少存储损耗提供了科学支持,同时也为其他食品及农产品的非破坏性检测提供了借鉴。

1.2.结果与讨论

(1)水分含量(MC)和脂肪酸值(FAC)的统计分析

一种合适的样本划分方法能够为建模选择更具代表性的样本,并提高模型的稳健性。在本研究中,采用了基于联合x-y距离的样本集分割(SPXY)方法,按照2:1的比例将样本划分为校准集和预测集。表2显示了不同集合中样本的MC和FAC的统计结果。从表2可以看出,校准集中的MC和FAC的范围覆盖了预测集中的范围,这符合构建高光谱校准模型的条件。在所有样本中排除了异常样本,包括异常的光谱值、水分值和脂肪酸值。

img3 

(2)光谱分析

图2展示了大米和精米在900至1700nm波长范围内的原始反射光谱。从图2可以看出,大米和精米在900至1400nm波长范围内的光谱趋势相同。然而,在1400至1700nm波长范围内,大米的反射光谱逐渐增加,而精米的反射光谱趋于稳定。此外,大米光谱的反射值通常高于精米。这可能是由于大米和精米在颜色、光滑度和透明度方面的不同造成的。在图2中,大约在960、1200和1450nm处有三个明显的峰值。960nm附近的峰值可能是由水中和碳水化合物中O-H的二阶倍频协同作用引起的。1200nm附近的峰值与样品的水分含量(MC)有关,而1450nm附近的峰值归因于O-H伸缩的一阶倍频。由于前后波长范围内的光谱噪声较大,因此舍弃了900至940nm和1670至1700nm的光谱数据。用于建模的光谱数据包含在940至1670nm波长范围内的468个变量。

img4 

图2. 大米和精米样品的原始光谱:(a) 大米;(b) 精米。

(3)光谱预处理分析

五种预处理方法被用于处理大米和精米样品的光谱,并且使用偏*小二乘回归(PLSR)算法建立了MC和FAC的校准模型。表3显示了不同预处理方法下MC和FAC样品PLS模型的预测结果。从表3中可以发现,在“大米水分”模型中,使用SNV和SG-2预处理得到的结果是较好的。使用SNV预处理建立的模型的决定系数(R²C)相对较高,达到了0.9682。然而,该模型不稳定,稳健性较差,预测相关系数(R²P)仅为0.9466。因此,SG-2预处理的模型比SNV预处理的模型表现更好。在“大米脂肪酸”模型中,除了SG-2外,其他预处理方法的R²P未达到0.8,且R²P与R²C差异显著,因此这些模型的稳健性较差。因此,SG-2是“大米脂肪酸”模型中*佳的预处理方法。对于“精米水分”,SG-2预处理的模型具有更高的R²C和R²P。总之,SG-2是在“大米水分”、“精米水分”和“大米脂肪酸”三个预测模型中*佳的预处理方法。这三个模型的R²P和均方根误差(RMSEP)分别为0.9639、0.9528、0.8238和0.0032、0.0035、2.1517。而在“精米脂肪酸”模型中,SG平滑是*佳的预处理方法,该模型的R²P和RMSEP分别为0.8427和1.7806。

img5 

从表3可以看出,大米中MC模型的性能优于精米中的模型。这是因为稻壳含有水分,其吸水能力高于精米。因此,当大米样品被水处理时,稻壳吸收的水分比精米多。所以大米的光谱包含了比精米更多的水分信息,导致大米中MC模型的性能优于精米。相比之下,精米中FAC模型的性能优于大米。稻壳的本质是一种纤维,主要由纤维素、半纤维素、木质素等成分构成。这表明稻壳不含有脂肪酸,而存在于大米光谱中的稻壳干扰信息将影响建模过程中脂肪酸的预测。因此,获得的光谱信息可能受到稻壳的干扰,导致精米的预测精度下降。所以使用高光谱图像预测大米的脂肪酸时,稻壳会对预测精度产生特定影响。此外,过多的波长并不能更有助于提高预测速度和模型的稳健性。因此,进行波长变量选择是必要的,以减少冗余波长,提高模型稳定性,并实现实时高光谱检测。

(4)变量选择

由于使用SG或SG-2预处理的MC和FAC模型获得了*佳结果,因此对这些光谱进行了CARS和SPA方法处理,以选择对水分和脂肪酸有显著影响的波长。然后,使用这些选定的波长通过PLSR开发了水分和脂肪酸的校准模型,并比较了“大米水分、精米水分、大米脂肪酸和精米脂肪酸”四个模型的性能。从表4可以看出,CARS选择的基本波长数量分别为17、40、17和13,而SPA选择的基本波长数量分别为6、11、9和10。SPA选择的重要波长数量更少,使得实际应用更为简便。CARS模型的R²P分别为0.9643、0.9445、0.7528和0.8480。SPA模型的R²P分别为0.9650、0.9567、0.8436和0.8573。SPA模型具有更高的R²P,且模型更为**。CARS模型的RPD值分别为5.3750、4.3784、2.0565和2.6227。SPA模型的RPD值分别为5.5484、4.9091、2.5854和2.7070。SPA模型的RPD值更高,表明模型更为稳定。

img6 

此外,SPA模型的性能优于全光谱模型,这表明SPA选择的波长包含了MC或FAC几乎所有的有效信息。与全光谱模型的结果类似,SPA模型中大米的MC预测精度高于精米,而大米的FAC预测精度低于精米。这进一步证明了我们在第3.3节分析的可信度。图3展示了SPA变量选择的结果。从图3(a, c, e, g)可以看出,随着所选波长变量数量的增加,RMSE值逐渐减小。我们的目标是在尽可能选择较少波长的前提条件下获得较低的RMSE值。图3(b, d, f, h)显示了所选特征波长的分布。总之,“大米水分”、“精米水分”和“大米脂肪酸”的*佳模型是“SG2-SPA-PLS”,而“精米脂肪酸”的*佳模型是“SG-SPA-PLS”。

img7 

img8 

图3. SPA对大米/精米中水分和脂肪酸的波长选择结果。(a) 大米中水分的RMSE变化 (b) 大米中选定水分波长的分布 (c) 精米中水分的RMSE变化 (d) 精米中选定水分波长的分布 (e) 大米中脂肪酸的RMSE变化 (f) 大米中选定脂肪酸波长的分布 (g) 精米中脂肪酸的RMSE变化 (h) 精米中选定脂肪酸波长的分布。

SPA选择的波长如表5所示。对于MC模型,主要波长970、1150和1450nm分别归因于O-H伸缩的一阶、二阶和三阶倍频。对于FAC模型,脂肪酸的显著峰值分布在945、994、1105、1382和1527nm,主要来自C-H的**和**倍频以及-CH2基团的伸缩。约1160nm的吸收峰由-HC-CH-键形成,这可以解释选择的1141nm波长。选择的光谱波长939.06、964.17和967.31nm主要来自O-H键的弯曲振动。选择的波长1095.9、1596.59和1329.81nm中,1098nm的峰值属于C-H键的第三倍频多重振动,1586nm的峰值归因于N-H键的**倍频多重振动,1320nm的峰值与C-H键的弯曲振动相关。图4显示了MC和FAC的实际值与预测值之间的偏差。从图4可以看出,MC的预测值和实际值高度吻合。这表明MC的预测模型具有很高的准确性,预测值和实际值之间的差异很小。FAC的预测值和实际值的吻合度不如MC,但预测值和实际值也非常接近。这表明尽管FAC的模型性能略逊于MC,但它也能准确预测大米和精米中的FAC。

img9 

img10 

图4. 大米/精米中水分和脂肪酸预测结果的散点图:(a) 大米中的水分;(b) 精米中的水分;(c) 大米中的脂肪酸;(d) 精米中的脂肪酸。RVM:水分的实际值;PVM:水分的预测值;RVFA:脂肪酸的实际值;PVFA:脂肪酸的预测值。


川公网安备 51011202000202号