技术文章

Technical articles

当前位置:首页技术文章建模效果差?一文吃透高光谱 ROI 精准提取方法

建模效果差?一文吃透高光谱 ROI 精准提取方法

更新时间:2026-05-19点击次数:22

引言:

在高光谱成像(HSI)的科研与工业应用中,我们常说“数据质量决定模型上限"。而高光谱数据是一块巨大的“数据魔方",包含了海量的空间与光谱信息。如何从复杂的背景中精准地剥离出目标对象?

感兴趣区域(ROI)的选择,正是连接原始影像与建模分析的关键桥梁 。它不仅直接影响光谱信号的稳定性和特征的可解释性,更是决定后续模型性能的核心环节 。本文将深入探讨四种主流的 ROI 提取策略,通过花生籽粒、苹果病害等实战案例,带你掌握高光谱数据处理的“点睛之笔"。

感兴趣区域(ROI)选择

在高光谱成像(HSI)数据分析中,ROI(Region of Interest,感兴趣区域)选择是建模与机理分析的关键步骤,直接影响光谱稳定性、特征可解释性以及模型性能。常用的ROI选择方法可系统地分为以下几类:

1.1 ROI选择方法

(1)单波段阈值法

在高光谱图像中,不同物质在特定波长处的反射率存在显著差异。通过选取对目标与背景区分度较高的特征波段,将三维高光谱数据在该波段上投影为二维灰度图像,并利用灰度阈值分割提取目标区域。该方法适合背景去除、大目标整体ROI提取。该方法设高光谱数据为,选取特征波段得到单波段图像。通过阈值T将像素划分为前景(ROI)与背景。公式如下

python代码示例:

Hypercsan分析软件

(2)PCA/MNF变换辅助ROI选择

主成分分析(PCA)和最小噪声分离(MNF)通过线性变换将高维光谱数据映射到低维特征空间,使主要信息成分与噪声成分分离,从而增强不同组织或区域之间的对比度,结合(1)或其他方法便于ROI识别。该方法高光谱图像中每个像素光谱进行协方差分解,求解特征值与特征向量,再低维投影以得到降维后的特征空间。

python代码示例:

Hypercsan分析软件


(3)K-means聚类ROI选择

假设同一物理区域像素光谱在特征空间中具有相似性,通过聚类算法将全图像素自动划分为若干光谱相似的类别,从中选取目标类别作为ROI。

python代码示例:

Hypercsan分析软件

(4)分水岭结合连通域ROI选择

在阈值分割获得初始二值ROI后,单纯的连通域分析可能将相互接触的目标区域合并为同一连通对象。为实现对粘连区域的有效分离,引入分水岭分割与连通域分析相结合的方法。分水岭分割将图像灰度值视为地形高度,通过模拟水位上升过程,在局部极小值对应的区域形成集水盆地,不同盆地相遇时产生的分界线即为分水岭边界,从而实现对相互接触区域的精细分割。为避免过分割,首先利用连通域分析限定分割范围,并在分水岭分割后对结果进行连通域筛选与约束,最终获得结构独立、边界清晰的ROI区域。

python代码示例:

5.2方法案例

(1)单波段阈值法

花生籽粒ROI高光谱提取为例(图1)。首先对比花生和背景反射率,选择成像清晰并且背景和花生反射率差值最大的波段图像。通过分析发现,在1120 nm处的波段图像中背景和花生部分反射率差值最大。所以,提取1120nm处的波段图像(图1a)。然后,通过阈值法得到二值化掩膜图像(图1b)。在得到的掩膜图像中,背景部分像素值为0,花生部分像素值为1。最后应用得到的掩膜图像与高光谱图像矩阵(图1c)中的每个波段图像进行相乘。便可得到去除背景且只保留花生部分的高光谱图像(图1d)。图1e和f分别为去除背景之后的高光谱图像中背景和花生的光谱数据。

图1 单波段阈值法

(2)PCA/MNF变换辅助ROI选择方法

以苹果腐烂区域ROI分割为例(图2)。PC1和MNF1成分图像承载了图像大部分的信息;PC2和MNF2成分图像反映了图像中的亮度饱和情况,早期腐烂区域较周围正常区域明显,但是有些地方亮度饱和不利于早期腐烂区域的分割;PC3和MNF3成分图像适合用于早期腐烂的识别,苹果早期腐烂区域变得高亮,与周围正常区域表皮对比明显,便于利用图像处理对早期腐烂区域进行分割提取。PC4和MNF4成分图像更多反映苹果表面的斑点、纹理等外观信息。通过单阈值(阈值为200)分割PC3和MNF3成分图像便可以提取苹果腐烂ROI。图2(a)为单阈值分割PC3后分割的结果,图2(b)是经过膨胀、腐蚀、小区域填充等形态学处理后叠加上苹果轮廓后的图像,出现了一些误分割现象;图2(c)为单阈值分割MNF3后分割ROI的结果,图2(d)是经过膨胀、腐蚀、小区域填充等形态学处理后叠加上苹果轮廓后的图像,没有出现误分割现象。

图2 PCA/MNF变换辅助ROI选择方法

(3)K-means聚类ROI选择

以小麦籽粒分割及胚芽ROI分割为例(图 3),结果表明小麦籽粒胚芽区域(蓝色)均能够被准确识别并实现语义分割。相比之下,大多数胚粒的胚乳区域(红色)同样实现了有效分割,但其分割准确性略低于胚芽区域。

图3 K-means聚类ROI选择方法(上:1201 nm的小麦籽粒灰度图像;下:k-均值聚类的ROI)

(4)分水岭结合连通域ROI选择

以粘连玉米籽粒ROI分割为例,图4(a)展示了在1200 nm波长下获取的健康玉米籽粒图像。随后,对获取的高光谱图像进行主成分分析(PCA),以增强玉米粒与背景之间的对比度,并实现玉米粒区域的初步提取。采用 Otsu 阈值分割方法对主成分得分图像进行处理,用于分离玉米粒与背景,如图4(b)所示。图4(c)为放大的籽粒剖面图,图像中叠加了分割边界,可以清楚地观察到部分玉米粒之间存在相互接触的现象。这些相互接触的籽粒在初始分割结果中被标记为同一连通区域。然而,无论是基于对象的分析方法还是基于像素的分析方法,均要求每个玉米粒作为一个独立区域,以便获取单个籽粒或籽粒内部像素的平均光谱信息。因此,有必要对连通区域进行进一步细分,实现籽粒级ROI的精确提取。由于相邻玉米粒之间通常存在明显的凹陷区域,在灰度空间中表现为低值区域,类似于分水岭模型中的“分水线",因此能够在图像中形成清晰的籽粒分割边界。基于上述原理,采用分水岭分割算法对初始连通区域进行进一步分割,从而实现单个玉米粒级对象的提取,分割结果如图4(d)、(e)和(f)所示。

图4 分水岭结合连通域ROI选择方法

参考文献

1. Xuan Chu, Wei Wang, Xinzhi Ni, Chunyang Li, Yufeng Li,Classifying maize kernels naturally infected by fungi using near-infrared hyperspectral imaging,Infrared Physics & Technology, 105, 103242 (2020).

2. Andreas Kartakoullis, Nicola Caporaso, Martin B. Whitworth, Ian D. Fisk, Gaussian mixture model clustering allows accurate semantic image segmentation of wheat kernels from near-infrared hyperspectral images, Chemometrics and Intelligent Laboratory Systems, 259, 105341 (2025).

3. Zhang, B., Fan, S., Li, J. et al. Detection of Early Rottenness on Apples by Using Hyperspectral Imaging Combined with Spectral Analysis and Image Processing. Food Anal. Methods 8, 2075–2086 (2015).

4. Bu, Y., Luo, J., Li, J. et al. Non-destructive estimation of the bruising time in kiwifruit based on spectral and textural data fusion by machine learning techniques. Food Measure 18, 6872–6885 (2024)