投稿问答最小化  关闭

万维书刊APP下载

佳作分享| 学习用于高光谱异常检测的张量低秩表示

2023/5/23 15:53:41  阅读:85 发布者:

简讯:低秩表示(LRR)方法已广泛应用于高光谱异常检测,因为它们具有分离背景和异常的潜力。然而,现有的LRR模型通常将3-D高光谱图像(HSI)转换为2-D矩阵,不可避免地导致HSI中固有的3-D结构特性的破坏。为此,本文提出了一种用于高光谱异常检测的新型张量低秩和稀疏表示(TLRSR)方法。所提出的模型通过精心设计的交替方向乘法器(ADMM)有效求解。通过实验与现有算法进行比较,确定了所提出的方法在高光谱异常检测任务中获得优异表现。本文相关成果已整理发表在IEEE Transactions on Cybernetics.

1.研究背景

高光谱异常检测的目标是将感兴趣的物体与背景分离。例如,村庄背景中的飞机和桥梁背景中的车辆通常被称为异常值。异常检测可以被认为是一个无监督的二分类问题。解决该问题的关键,是探索异常与背景的差异。异常通常出现概率较低,并且它们的光谱特征与相邻地物有较大差异。

基于统计特征的研究,在过去三十年中提出了经典的Reed-Xiaoli(RX)算法及其变体。RX是从广义似然比发展而来的恒虚警率算法,一般假设背景符合多元高斯分布。RX检测器计算来自高光谱图像(HSI)场景的样本的均值向量和协方差矩阵,以获得测试像素与其周围背景之间的马氏距离。全局RX考虑来自整个图像的背景像素的统计数据,而局部RX使用局部统计数据。然而,两个缺点降低了这些RX算法的检测性能:单一正态分布描述的背景假设很少适用于实际的高光谱应用;背景的均值和协方差矩阵容易受到噪声像素和异常的影响。

许多研究人员积极尝试研究其他HSI固有属性,例如背景部分的低秩表示(LRR)和异常的稀疏性。由于HSI波段的相关性,由HSI背景矢量化波段组成的矩阵是低质的。异常通常以低概率占图像的一小部分,这自然会导致异常具有稀疏属性的假设。因此,已经提出了几种LR和稀疏矩阵分解(LRaSMD)方法,但它们过分关注稀疏分量而忽略了背景分量。为缓解这一限制,研究人员开展了大量研究,但基于LRaSMD的方法的检测性能受到矢量化HSI波段和丢弃有用的多阶信息的限制。

HSI包含两个空间维度和一个光谱维度,本质上被视为三阶张量。大多数现有算法,都忽略了HSI3-D张量特性。近年来,基于张量的方法在HSI异常检测中受到了关注。研究人员开发了大量基于Tucker分解的方法,使用解混方法提取异常的光谱特征。尽管如此,Tucker分解对秩进行处理时具有明显的局限性。一个HSI张量通过Tucker分解被分解成一个小的核心张量和三个矩阵。在进行计算过程之前,需要预先定义三个等级,这势必会给应用带来困难。因此,当前基于张量的方法的发展必须考虑有效的分解模型。

2.研究方法

本文提出方法的示意图如图1所示。为了减轻计算负担,通过执行PCA减少HSI图像的光谱维数;之后,通过加权TNNLF1稀疏促进范数进行字典构建;最后,本文采用张量低秩和稀疏表示(TLRSR)来精确分离LR背景分量和稀疏异常,而不会破坏固有的3-D结构。

1. PCA-TLRSR模型的示意图。

A.用于高光谱异常检测的TLRSR

由于HSI中混合像素的存在,HSI数据往往来自多个子空间。在这种情况下,LRRRPCA更合适,因为RPCA假定基础数据位于单个子空间中。LRR旨在通过字典A探索XLR线性表示。

(1) 其中AZLR背景部分,A表示背景字典,Z为对应的表示系数,E表示与异常相关的稀疏部分。LRR模型沿HSI的谱维度捕获低秩,但破坏了固有的HSI张量结构。为了缓解这种限制,本文考虑了张量LR线性表示,它比HSI数据分析的向量线性表示表现得更自然。一个HSI张量X被张量LRR分解为

(2) 给定一个观察到的X和一个字典A,两个未知张量ZE有许多解。为了解决这个问题,本文需要更多的标准来约束ZE。一方面,每个像素的光谱特征对应一种材料或混合材料。因此,每个像素的光谱位于至少一个子空间中。总体HSI光谱倾向于从子空间的联合中提取。张量线性表示有助于描述和分析LR子空间,避免向量化张量数据。添加tubal rank最小化以约束系数张量Z的张量低秩。另一方面,异常固定地发生在大多数波段的一小部分像素中,并在光谱方向上实现了密集的性能。本文应该进一步限制联合光谱空间稀疏性。综合考虑以上因素,Tensor LRR的优化问题写为

(3) 然而,问题(3)是非凸的,但可以通过用TNN替换rankt(·)转化为如下的凸优化:

(4) 该算法平等地考虑最大或最小的奇异值,几乎不会导致rankt(Z)的适当近似。除此之外,本文将加权核范数(WNN)引入问题(4)得:

(5) ADMM是解决问题(5)的一种直接有效的方法。通过引入辅助变量W,本文将该变量与目标和约解耦。等式(5)可表示为

(6) 的无约束增广拉格朗日函数转换为以下问题:

(7) 其中Q1Q2是拉格朗日乘数,μ是自动调整的惩罚参数。本文通过更新一个变量并固定其他变量来解决问题(7)。更加详细计算可查看原文。

B.TLSR的字典构造

高质量的字典A在所提出的算法中起着至关重要的作用。设计字典的简单方法是直接使用自身的HSI张量X,类似于LRR的策略。然而,HSI张量X包含异常,字典A应该由LR背景部分组成。上述策略几乎没有考虑HSI异常检测的真实情况,容易导致性能变差。字典A预计与具有异常的纯背景相关。为了解决这个问题,本文采用正则的RPCA来保留背景信息。

(8) 除此之外,本文通过ADMM以高计算效率解决了这个问题。问题(8)的增广拉格朗日函数为

(9) 其中P是拉格朗日乘数。LS通过交替最小化F来更新。两个子问题都有闭式解。LR背景部分L是为后续TLRSR的字典A得到的,即A=L。基于加权TNNL稀疏范数,字典构建过程也避免了将3-DHSI数据重塑为2-D矩阵,并保留了固有的空间-光谱结构。

3.实验结果与讨论

本文进行了真实数据实验,以评估所提出的PCA-TLRSRHSI异常检测中的性能。使用了三个真实世界的HSI数据集,包括:1)Urban数据集;2)圣地亚哥数据集;3)机场数据集。

A.检测性能

本实验旨在测试所提出的PCA-TLRSR与其他基线相比的检测性能,包括两种RX方法(即经典全局RX和离散小波变换(DWT));四种LRaSRMD方法(RPCALSMADLRSAR[24]以及图形和TV正则化LRR(GTVLRR));张量表示方法TRPCA;和深度学习方法(DeCNN-AD))。除了对结果异常图进行目视观察外,本文采用受试者工作特征(ROC)曲线和ROC曲线下面积(AUC)来定量评估一系列比较方法的检测精度。

ROC曲线绘制了检测概率(PD)和误报率(FAR)对于广泛的可能阈值的变化关系。这条曲线下的面积计算为AUC,其理想结果为1

HYDICE-Urban数据表现为例:在图2中目视观察了不同方法的检测图。尽管TRPCA很好地保留了地图中心的桥梁轮廓,但遗憾的是忽略了最重要的异常。GlobalRXDWTRXRPCALSMAD获得了类似的结果,但几乎没有检测到海中的异常。LRSARGTVLRRDeCNN-AD具有相似的异常图,其生成效果优于前一种算法。所提出的PCA-TLRSR在所有比较算法中实现了最清晰的检测图。图3显示了HYDICE-Urban数据集的不同异常检测器的ROC曲线。与视觉观察一致,TRPCA在所有方法中具有最低的价值。RPCALSMAD产生比全局RXDWTRX更好的性能。尽管PCA-TLRSRPD一开始低于LRSARGTVLRRDeCNNAD,但当FAR等于且高于0.03时,所提出的PCA-TLRSR提供了最佳性能。

2.HYDICE-Urban数据中所有比较方法的检测图。(a)HYDICE-城市场景的彩色合成。(b)参考地图。(c)全球接收。(d)载重吨接收。(e)皇家航空航天局。(f)LSMAD(g)远程雷达。(h)TPCA(i)GTVLRR(j)DeCNN-AD(k)PCA-TLRSR

3.HYDICE-Urban数据集不同方法得到的ROC曲线

B.讨论

1)PCA和词典构建的影响:本节分析了PCA预处理步骤和词典训练步骤对每个数据集的AUC分数的贡献。图4显示了所提出方法在有和没有PCA预处理步骤的情况下的计算时间和AUC值。由于降维步骤,与TLRSR相比,PCA-TLRSR在不同数据集上的运行时间显着减少。同时,对于UrbanAirport-1以及三个数据集,PCA-TLRSR的检测性能保持良好甚至有所提高。

4.计算TLRSRPCA-TLRSR的时间和AUC值。使用和不使用字典构建策略的PCA-TLRSR的计算时间和AUC值。使用 TNN 或加权 TNN 计算 PCA-TLRSR 的时间和 AUC 值。

为了说明字典构建策略的有效性,本文测试了有和没有这个训练步骤的PCA-TLRSR的计算时间和AUC。结果比较如图4所示。计算时间随着字典构建略有上升,而PCA-TLRSRAUC分数随着字典训练步骤显着增加,特别是对于Airport-123。显然,字典构建对提高检测性能起着至关重要的作用。

2)PCA-TLRSR框架中使用的WNN的影响:本文通过说明性示例为PCA-TLRSR框架中使用的WNN的会计有效性提供证据。图3显示了使用TNN和加权TNNPCA-TLRSR的计算时间和AUC值。所提出的具有标准核范数和WNN的方法具有相似的计算时间。PCA-TLRSR框架中使用的加权TNN有利于提高每个数据集的检测性能。

3)参数分析:本文讨论两个参数的鲁棒性。图5显示了两个参数对AUC值的贡献和敏感性。很明显,PCA-TLRSR求解器对两参数完全稳健。如图5(a)所示,当λ在[0.0010.01]范围内时,三个AUC值曲线相对于λ上升。在λ=0.01达到峰值后,这些曲线呈下降趋势。

5.AUC值曲线变化

4)计算复杂度和运行时间:表1报告了不同方法在HSI异常检测实验中的运行时间。GlobalRX是所有比较方法中最快的一种,但它很难获得令人满意的检测性能。PCA-TLRSR的计算时间与DWTRXRPCALSMAD相似,甚至在SanDiegoAirport-12中排名第二。作为一种基于深度学习的方法,DeCNN-ADTPCA更快和每个数据集上的GTVLRR。由于考虑到低秩和空间光谱平滑性,GTVLRR比其他算法更耗时。

1不同算法的运行时间比较(S)

4.研究结论及贡献

在本文中,本文提出了一种用于HSI异常检测的新型PCA-TLRSR模型。TLR框架用于保留固有的HSI3-D结构。PCA预处理步骤用于加速由各种张量操作引起的TLRSR。设计了一种张量字典策略来提取LR背景部分,将其作为TLRSR的字典。加权TNNL范数可有效分离TLR和稀疏张量分量。本文为优化求解程序开发了ADMM。在不同的HSI数据集上的实验结果证明了本文提出的方法的优越性能。

为了进一步的工作,可以探索一种新的卷积核范数技术来利用HSI的高阶结构进行异常检测。作为DFT的自然推广,这种卷积核范数比TNN更适合解决张量分解问题,这无疑对未来的研究具有重要意义。

本研究的主要贡献总结如下:

1)据本文所知,这是第一次在高光谱异常检测中扩展张量LR表示的概念,它利用了HSI3-D固有结构。借助张量域的多子空间学习和沿联合光谱空间维度的稀疏性约束,本文以更准确的方式分离LR背景和异常。

2)基于加权TNN和稀疏促进范数,本文提供了一种新颖的字典构建策略。该字典由LR背景张量组成,通过加权TNN的自适应收缩有效地保留了该张量。

3)为了在基于张量的模型的计算精度和复杂性之间取得平衡,本文将PCA作为预处理步骤,并提出了基于PCA的张量LRSAR(PCA-TLRSR)模型。本文设计了交替方向乘法器(ADMM)来更有效地求解生成的模型。

5.引文格式:

WANG M, WANG Q, HONG D, et al. Learning Tensor Low-Rank Representation for Hyperspectral Anomaly Detection [J]. IEEE Trans Cybern, 2022, PP.

转自:“科研圈内人”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com