
高光谱数据的 “去伪存真”,原始信号到反射率的转化路径,以烟叶数据为例解析
什么是高光谱?
高光谱成像(Hyperspectral Imaging, HSI)是一种融合了光谱维度和空间维度的成像技术。空间维度记录目标在二维平面上的空间分布(类似普通相机得到的图像信息)。在每个像素点上,能够获取连续且高分辨率的光谱曲线(通常覆盖可见光、近红外,甚至中远红外波段),这表示光谱维度。因此,高光谱图像可以理解为一个“三维数据立方体”:两个维度对应图像的 空间分布(x, y),一个维度对应 光谱信息(λ)。相比普通彩*图像只有红、绿、蓝三条波段信息,高光谱图像能同时包含数十到上百条窄波段数据,极大地丰富了物体的光谱特征。
为什么不同物质有不同的光谱曲线?
不同物质之所以呈现出不同的光谱曲线,是因为它们对电磁波的吸收、反射与透射特性取决于其分子结构和物理化学性质。分子中的化学键会在特定波长产生振动或转动吸收,从而形成特征吸收峰;晶体结构和电子能级也会影响光的散射与吸收,使材料在某些波段表现出独特的反射特性。同时,宏观状态如粗糙度、含水量和密度等也会进一步改变光谱表现。因此,不同物质在光谱维度上具有独特的“光谱指纹”,高光谱成像正是通过捕捉这些差异,实现物体识别和定量分析。
高光谱常见的数据
1. DN 值(Digital Number)
DN 就是相机探测器把光信号转成的数字值,本质上是“像素灰度”。它不是物理量,会受到曝光时间、增益、暗电流等影响。同样一张白板,在长曝光下 DN 会更高。
DN 是“相机看到的数字”,但还不是“真实光强”。
2. 辐射度(Radiance / Irradiance)
辐射亮度 Lλ单位波长、单位面积、单位立体角的辐射功率,常用单位W·m−2^·sr−1^·nm−1。成像光谱仪面向目标时,更直接获取的是目标的辐射亮度。
通过积分球/标准光源标定可得到每个波段的响应系数 ak,bk,把 DN 映射到 L:
其中 Sk为系统辐射响应度(把“每曝光时间的净 DN”换算成物理量的比例系数),t为曝光时间。
3. 反射率
在高光谱成像中,探测器*初采集到的数据是辐射亮度,即目标物体在不同波段上向外辐射或反射的能量强度。然而,这一原始信号不仅包含物体自身的信息,还受到光源强度、环境条件以及仪器响应等多种因素的影响。因此,为了获得能够反映物体本征特性的光谱信息,需要将辐射亮度数据经过校正,转化为反射率。
反射率是指物体在特定波长下对入射光的反射能力,它是一个与外界光照条件相对无关的物理量,能够直接反映物质的光谱特性。为了完成从辐射亮度到反射率的校正,通常需要进行白板和暗场校准。白板校准利用高反射率、光谱特性已知的标准白板作为参考,通过测量其反射光强来消除光源和仪器系统对信号的影响;暗场校准则是在完全无光或遮挡情况下测得探测器本身的噪声水平,用于去除背景噪声干扰。经过白板和暗场校准后,*终得到的反射率数据可以有效排除外部因素的影响,更准确地体现不同物质的真实光谱特征。黑白校正的公式为:
式中:R是校正后的反射率数据;I是原始光谱数据;W是标准白板图像数据;B是关闭镜头的暗电流图像数据。
以不同烟叶高光谱数据为例(图1),能够看出,原始未校准下的图像背景和样品区域整体亮度受光源分布和仪器响应的影响。从DN值上无法判断样品曲线的物质特征,校正后该波段下的图像整体灰度分布更加均匀,目标区域与背景对比更加清晰,消除了光源和探测器响应带来的系统性干扰。且经过校正后的反射率曲线,纵轴归一化到 0–1 区间,代表物体在不同波长下的真实反射比例。此外,从图1也能够看出各 ROI 曲线由于物质不同,所反映出的光谱特征也不同。
图1. 反射率校正前和校正后的光谱曲线