原名:A Multiscale Superpixel-Level Group Clustering Framework for Hyperspectral Band Selection
译名:一种用于高光谱波段选择的多尺度超像素级组聚类框架
期刊:IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING
发表时间:2022.02
DOI:10.1109/TGRS.2022.3150361
1.研究背景
高光谱图像(HSI)包含数百个连续光谱波段,这提供了丰富的光谱信息,能更好地表征特征。然而,过度的高维度也给后续处理带来了维度灾难。幸运的是,波段选择(BS)提供了一种直接和有效的方法来挑选出具有丰富信息和低相关性的带的子集。虽然近年来研究者提出了许多高光谱BS方法,特别是基于聚类的方法,但对相邻波段的上下文信息和材料的空间结构信息还没有得到很好的研究。
一方面,在进行聚类过程时,通常认为光谱波段是无序的,忽视了光谱波段的上下文信息。因此,人们提出了基于分组的BS方法,如自适应子空间划分策略(ASPS)和快速邻域分组方法(FNGBS)等。另一方面,超像素分割将图像分割为多个具有相似空间结构的语义子区域。上下文相似性允许具有同质性的区域聚集在一起。通过预处理或后处理对HSI分类进行了广泛的研究。但对高光谱图像波段选择的超像素分割尚未得到很好的利用。
2.研究方法
基于自适应分组和基于超像素的距离度量的思想,本文提出了一个针对高光谱图像波段选择的多尺度超像素级组聚类框架(MSGCF)。图1显示了MSGCF方法的原理图。首先,为了保持HSI的空间结构信息,采用多种超像素分割生成多尺度的超像素地图,使多种超像素分割算法具有互补性,能够适应不同尺度的土地覆盖类型。其次,引入分组和聚类范式联系波段间上下文信息。这里采用相邻波段的超像素级距离的最大点作为划分点,将波段划分为一组,将相关性强的相邻波段划分为同一组。第三,开发了一种具有超像素级距离度量的超像素级快速密度聚类方法(SuFDPC)来预先进行组级聚类。最后,通过基于排序的投票策略,通过考虑信息熵和出现频率来获得波段选择结果。
图1 MSGCF方法的原理图
3.研究结果
(1)实验设置
实验数据集:Indian Pines Dataset (IP),Kennedy Space Center Dataset (KSC),Houston 2013 Dataset (HU),Salinas Valley Dataset (SV)
定量指标:总体精度(OA)和Kappa系数
对比方法:基于排序的ID和MVPCA,基于聚类的K-centers和AP,基于排序和聚类的FDPC、EFDPC和OCF,两个组聚类方法ASPS和FNGBS,UBS,基于深度学习方法ACNN,BSNet和DARecNet
(2)对比实验结果(以IP数据集为例)
①不同对比方法的分类精度:以IP为例,图2表示在IP数据集上选择5-50个波段,不同对比方法的分类精度。在该图中,可以容易地看出,基于排名方法(ID和MVPCA)分类精度总是比聚类方法低,因为选择的波段通常是高度相关的。ACNN算法在波段个数较少时,分类精度低,波段个数增加,分类精度也有所提升。UBS由于各材料的内部光谱特性尚未得到很好的利用,因此,分类精度并不能令人满意。此外,基于分组方法(FNGBS)由于三种基于深度学习方法。然而,随着波段数量的增加,分类精度并不一定增加,这是由于额外的波段可能会引入冗余和噪声。本文方法在大多数情况下具有最好的分类精度,验证了本文方法的有效性。
图2 IP数据集不同波段数量下的分类性能:使用KNN分类器(a)OA和(b)Kappa;使用RF分类器(c)OA和(d)Kappa;使用SVM分类器(e)OA和(f)Kappa
②为了验证该MSGCF方法的鲁棒性,图3显示了在IP数据集上每个类的训练样本在3-50的分类效果。上升曲线表明,训练样本的数量越大,分类精度越高。本文方法MSGCF具有最高的分类精度。
图3 IP数据集不同训练样本下的分类性能:使用KNN分类器(a)OA和(b)Kappa;使用RF分类器(c)OA和(d)Kappa;使用SVM分类器(e)OA和(f)Kappa
③采用波段相关性来测量所选波段的代表性。结果如图4所示,在大多数情况下,MSGCF具有最低的相关性。相比之下,MVPCA和ID方法选择了具有高相关性的波段,这是因为她们在挑选波段时忽略了波段的相关性。
图4 在IP数据集上的不同方法对
不同数量的选定波段的相关性
表1列出了当选择10个训练样本情况下在不同数据集上的分类精度,本文方法MSGCF具有最优的分类精度。该方法将结构描述和上下文信息嵌入到所选的波段中,这些优势使MSGCF能够选择具有较强代表性和低冗余度的波段。
表1 不同比较方法在4个HSI数据集
(10个训练样本)上的分类精度
(3)多尺度超像素分割的消融研究
验证三种不同超像素分割方法融合的合理性,所提出的MSGCF与单一超像素分割方法和两种超像素分割方法版本进行了比较,结果如图5所示。从这些曲线中可以看出,MSGCF的分类结果,即三种超像素分割方法的融合,比其他只包含一种或两种分割方法的结果具有更高的精度和稳定性。结果表明,三种分割方法的融合是最佳选择,验证了多尺度超像素分割策略组合的合理性。
图5 多尺度超像素分割的消融结果使用RF类器不同波段数量(a) OA和(b) Kappa;不同训练样本数量(c) OA和(d) Kappa
4.结论
本文提出了一种针对高光谱波段选择的MSGCF,简称为MSGCF。由于互补的三个不同的超像素分割方法(ERS,SLIC和SNIC),多尺度超像素分割融合方案来适应各种土地覆盖类型的特点,生成一系列多尺度超像素地图,提供了丰富的空间结构信息。随后,引入分组和聚类范式来进行联系波段间的上下文信息。分组过程进行自适应的方式而不是预设组的数量,因此可以保证该方法的泛化。本文还提出了一种SuFDPC在组内进行波段聚类,适用于有限的波段聚类情况。最后,通过一种基于排序的投票策略,得到了基于信息熵和出现频率的波段选择结果。通过这些步骤,MSGCF能够选择具有最强识别能力的信息最丰富的波段。在四个真实的HSI数据集进行了消融分析,验证了多尺度超像素分割融合的必要性以及超像素级波段分组和聚类模块的有效性。同时,与其他先进对比方法比较,MSGCF方法优于其他对比算法,验证了MSGCF方法的优越性。
5.引用格式
Jia S, Yuan Y, Li N, et al. A multiscale superpixel-level group clustering framework for hyperspectral band selection[J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 1-18.
转自:“科研圈内人”微信公众号
如有侵权,请联系本站删除!