综合多特征的极化SAR图像建筑物U-Net分类方法
李 梅,沈麒凯,陈启浩,刘修国
(中国地质大学(武汉)地理与信息工程学院, 武汉 430070)
摘要:针对合成孔径雷达(SAR)图像不同类型建筑物的区分问题,该文提出了一种基于U-Net的极化SAR图像建筑物分类方法。该方法将极化SAR数据的Pauli分解参数、规范化圆极化相关系数和G0统计纹理参数作为U-Net的输入,建立建筑物分类U-Net模型,同时考虑建筑物的高度和单体面积的情况下,将建筑物分为高层、中层、低层小面积、低层厂房类大面积建筑物4类。对武汉市城区GF-3极化SAR数据的各类建筑物分类精度均在80%以上,最高达94.2%。该方法与仅使用单类别特征的U-Net网络方法以及卷积神经网络方法相比,分类结果更完整、建筑边界更准确,也更适合于复杂中心城区的不同类型建筑物的分类。
0 引言
随着城市化进程的加快,城市规划、土地管理、公共资源分配、居住环境评估等对建筑物类型及其空间分布信息的及时获取提出了更高要求。合成孔径雷达 (synthetic aperture radar, SAR)以其全天候、全天时的成像能力及对地物目标结构信息的探测能力,已成为监测城市快速发展的重要手段[1]。极化SAR获得的更全面的目标信息[2]使得对不同类型建筑物的进一步分类成为可能。
为了准确提取建筑物或分类城区,极化SAR图像中建筑物的极化、统计、纹理等特征被提取、分析和利用。这些特征主要包括:①利于分析和描述建筑物散射特性的极化目标分解参数,如Pauli分解[3]、模型分解或改进的模型分解参数[4]等;②能突出建筑与其他目标差异的极化相关系数,如圆极化相关系数[5]、规范化圆极化相关系数[6]等;③可描述目标相干斑统计特性的统计信息,如威希特(Wishart)分布[4,7]、G0分布[8]等。其中,G0统计模型适合对异质区建模,更利于提取建筑物[9];④反映建筑物排列特点的纹理信息,如灰度共生矩阵纹理特征[7]、统计纹理参数[9]等,纹理特征已被证明为建筑物提取的重要特征之一。当然,多特征综合利用是目前极化合成孔径雷达(polarimetric SAR,PolSAR)建筑物提取的一个重要趋势[2,4,10]。
建筑物提取或城区分类算法从支持向量机[11]、随机森林[12]向深度学习方法[13]发展。卷积神经网络(convolutional neural network, CNN)作为深度学习方法的代表,其在极化SAR图像分类中的利用从实数卷积神经网络[14]、复数卷积神经网络[15]到特征驱动的卷积神经网络[2],并且文献[3]证明了将极化特征作为输入的特征驱动卷积神经网络效果好于输入相干矩阵。然而,CNN在信息提取过程中受到输入图块大小的制约,过小无法充分获得有效信息,过大则容易产生过平滑现象[16]。为此,拥有语义分割能力的网络被引入极化SAR图像分类,U-Net[17]作为其中一种模型,其解码编码结构与跳跃连接结构能够很好地克服输入图块大小的制约并使得不同层次特征得到充分应用,已在极化SAR分类中得到应用。
现有极化SAR图像建筑物提取或城区分类还没有深入到对不同类型建筑物的进一步分类,考虑到U-Net可充分利用极化SAR数据不同层次特征的能力以及不受建筑物面积大小对样本制作影响的优势,本文提出一种利用U-Net的极化SAR图像建筑物分类方法,该方法将极化SAR数据的Pauli分解参数、规范化圆极化相关系数和G0统计纹理参数作为U-Net模型的输入,将建筑物分为高层建筑物、中层建筑物、低层小面积建筑物、低层厂房类大面积建筑物。
1 方法
极化SAR图像中的建筑物与植被、水体等背景地物之间以及不同类型建筑物之间的极化散射特征、统计特性、纹理特征等存在差异。本文引入U-Net网络,综合利用极化、统计纹理等多特征以对极化SAR图像中的建筑物精细分类,方法流程如图1所示。主要步骤包括建筑物特征提取生成U-Net输入特征集、U-Net模型构建、分类型建筑物样本建立及网络训练、U-Net建筑物类型等。
按照建筑物的高度可将建筑物分为高层建筑物(15层以上)、中层建筑物(7~15层)、低层建筑物(1~6层),同时考虑到在低层建筑物中厂房类大面积建筑物与其他居住、商用等用途的低层小面积建筑物有着明显的不同,在SAR影像上表现也不同,因此将低层建筑物分为两类:低层小面积建筑物(简称低矮建筑物)和低层厂房类大面积建筑物(简称厂房类建筑物)。最后得到4类建筑物:高层建筑物、中层建筑物、低层小面积建筑物、低层厂房类大面积建筑物。典型的4类建筑物的特征分析见表2。
由Pauli分解三分量RGB合成图可见,厂房和中高层建筑物的二面角散射较强。厂房边缘二面角散射最强,厂房中心因较平整后向散射较弱且奇次散射增加;存在取向角或夹杂植被的低层小面积建筑区内45°取向二面角散射分量很强;高层建筑物二面角散射最强且叠掩现象明显。规范化圆极化相关系数在建筑区的特征值总体较高,总体上能较好反映建筑分布情况。厂房区特征值明显高于周围非建筑物,低层小面积建筑区特征值较小,部分高层建筑的特征值很小。G0统计纹理参数能很好地反映建筑区的边界,在绝大部分建筑区的特征值较小。厂房中心因异质性小而G0统计纹理参数较大,厂房边缘特征值较小;高层建筑区的G0统计纹理参数最小,均匀排列或夹杂植被的中低层建筑区特征值高于其他建筑。
U-Net作为一种语义分割网络,借鉴并发展了全卷积网络的全卷积思想,能学习不同大小目标的不同维度特征并且对每一个像素点进行分类,同时跳跃连接的引入,使得该网络能够在少量的数据下进行训练并且收敛,能够将目标的高维整体信息与低维细节信息综合利用,以充分保留目标细节信息。U-Net结构如图2所示。
本文构建的建筑物分类U-Net中,输入通道数为5,输入特征为PauliRGB、规范化圆极化相关系数、G0统计纹理参数,输入样本大小为128像素×128像素,卷积核大小为3像素×3像素,移动步长为1,详细网络参数如表3所示。
利用训练好的建筑物细分U-Net模型,通过一定重合度的“切割-预测-合并”方法,对极化SAR图像中不同类型建筑物进行细分。
1)切割。将目标图像进行切割,使得目标影像切割后的大小满足网络模型的输入。在切割时根据目标影像的需求设置重叠度。设置重叠度是为了在影像拼接过程中避免拼接时产生明显的接边痕迹,因此设置重叠度的大小需要既能保证边缘处完整拼接又不影响整体影像的预测,需要在0~0.5之间,并且不过高也不过低,因此选取重叠度为0.3。若在切割目标图像时产生多余范围图像,需从反方向切割图像获取一景图像作为模型的输入。
2)预测。将每一个切割后的图像作为U-Net的输入,同时在输出端获取每个切割图像的预测结果。
3)合并。对每个分割图像的预测结果进行合并。在合并过程中,若重叠部分像元的预测结果出现偏差,则通过该像元所属类别的概率值的大小确定,若所得值相同,通过周边像元的类别统计结果赋值。
最后,可以通过适当增加冗余计算以消除拼接线,使得最终预测结果更加准确。
2 实验与分析
2.1 实验数据
本次实验选取GF-3卫星于2018年10月21日获取的湖北武汉市的全极化SAR数据,其方位向、距离向的分辨率约8 m。考虑到对各类建筑物的覆盖情况,选取3个实验区,如图3中蓝线框所示的区域a、b、c。实验区a的厂房居多,多为大面积建筑物;实验区b中4类建筑物的比例较为接近,且分布较均匀;实验区c位于中心城区,中高层建筑物较多。参考的真实地表数据来源于同时期采集的武汉市城区建筑矢量,结合光学遥感数据和实地情况确定矢量数据中建筑物各类别。实验区真实的不同建筑物分布如图5 (a3)、(b3)、(c3)所示。
2.2 样本构建及U-Net训练
为了训练U-Net网络,从武汉三镇选取样本区,共构建了约241个涵盖不同类型建筑物的样本块,选取其中168张用于训练和测试,剩下73张用于验证,验证集约占总数据集的30%。提取的极化SAR建筑物特征集使用对应的真实地表分布作为标识图,并按一定步长裁剪以构建训练样本集,方法见图4。其中,L为裁剪步长,裁剪窗口沿方位向和距离向移动,本文使用L=64的步长,裁剪窗口大小为网络输入时所需的图像大小。
对U-Net训练的输入,考虑到计算资源的限制,将30个图块作为一次epoch的输入。输出时设置4类建筑物和非建筑物共5个通道的结果。U-Net训练过程中,使用交叉熵损失函数的方法来对最终的损失值进行计算,利用后向传播算法对模型参数进行训练,选取能够自适应优化的Adagrad算法作为学习步长,为每个参数分配相应的学习率。U-Net训练至损失值小于0.005即停止训练。
2.3 实验结果及分析
利用训练好的建筑物细分U-Net,对实验区a、b、c的建筑物精细分类结果如图5 (a4)、(b4)、(c4)所示。与地面真实分布图对比可知,本文方法不仅准确提取出3个实验区的建筑物,而且很好地将4类建筑物进行区分。实验区a内的厂房、中层、低层小面积建筑物分类结果与地面参考非常一致;实验区b内的4类建筑物分类结果与地面参考吻合很好;实验区c内主要为交错分布的高层、中层建筑物,分类结果与地面参考较为一致,但存在少许混淆。实验区a、b、c的总体精度(overall accuracy,OA)分别为97.24%、96.01%和95.01%,Kappa系数分别为0.908 8、0.915 7和0.832。
3个区域的建筑物类型区分混淆矩阵如图6所示,各类建筑物的生产者精度均在80%以上,最高达94.2%。主要的误分出现在4类建筑物中,少数漏分为非建筑物,主要原因是部分建筑物分类结果的完整性不够。实验区a中厂房类、低层小面积、中层建筑物的生产者精度均在92%以上;高层建筑物误分为非建筑物的概率最高,为15.51%,主要位于图5(a4)右上角的小面积高程建筑物。实验区b中每类建筑物相对较大面积成片分布,生产者精度都在92%以上。实验区c中主要分布的高层、中层建筑物的生产者精度均在87%以上,该区域右上角成片老城区中低层建筑被漏检,中心城区高层、中层建筑物交错的复杂区域存在一定的误分。该方法对厂房等大面积分布的建筑物分类精度相对更高。当然,对中心城区高层、中层分布复杂的小面积建筑物会存在一定的漏分和误分现象。
2.4 对比实验及分析
为了进一步分析本文方法特点,对比分析本文方法和仅使用PauliRGB的U-Net网络方法、多特征卷积神经网络方法,实验结果如图5所示,实验精度如表4所示。其中,单特征U-Net网络方法输入通道数为3,仅采用Pauli分解的3个特征作为网络输入,其他网络参数与本文相同。参与对比的卷积神经网络主要参数为:两个卷积层的卷积核个数分别为500和100,两个全连接层的个数分别为200和84,卷积核大小为、移动步长为1,池化层大小为;网络中所有偏置值的初始化为0,其他参数从方差为1的高斯分布中随机选取;训练集以每批次500个进行网络训练,训练时的学习率为0.01;训练中将loss值低于0.000 5视为完全拟合并结束训练。
总体上,本文方法对各类建筑物的分类结果更加完整,尤其在实验区b和实验c的优势明显。在同样使用U-Net网络的情况下,与仅使用PauliRGB特征相比,多特征综合更能提高总体分类精度,在高层建筑物、中层建筑物和低层小面积建筑物较多的实验区b、实验c更为明显。在特征相同的情况下,卷积神经网络方法结果如图5(a4)、(b4)、(c4)所示,其结果细碎、建筑物边界不清晰,且存在明显的漏检,并且实验区b、实验c总体精度明显低于本文方法,其中实验区c中使用卷积神经网络的方法对高层、中层建筑物难以区分。3种方法对厂房等大面积建筑物的分类效果都较好,但U-Net方法能将目标的高维整体信息与低维细节信息综合利用以充分保留目标细节,分类结果更完整、建筑边界更为准确。利用极化、统计纹理等多特征输入的U-Net方法,可充分利用极化SAR数据不同层次信息,也更适合于复杂中心城区的高层、中层建筑物的精细分类。
3 结束语
本文提出的基于U-Net的极化SAR图像建筑物精细分类方法,综合利用Pauli分解参数、规范化圆极化相关系数、G0统计纹理参数等特征,发挥U-Net对多维度信息利用的优势,可准确对极化SAR图像中的厂房、低层小面积、中层和高层建筑物进行精细分类。对武汉市3个典型城区GF-3极化SAR数据的实验结果表明了本文算法的有效性,各类建筑物分类精度均在80%以上,最高达94.2%。相比基于卷积神经网络分类方法,本文利用U-Net综合多特征的分类方法能综合利用高维整体信息和低维细节信息,分类结果更完整、建筑边界更为准确;与仅使用Pauli分解特征的U-Net网络方法对比,输入极化、统计纹理等多特征的U-Net,可充分利用极化SAR数据多方面信息,更适合于复杂中心城区的不同类型建筑物的精细分类。如何进一步解决对中心城区高层、中层分布复杂的小面积建筑物的漏分和误分情况,是下一步工作的重点。
参考文献
[1] 吴文福,邵振峰,杨会巾.全极化SAR图像的建筑物提取研究[J].测绘科学,2019,44(11):143-147. (WU Wenfu,SHAO Zhenfeng,YANG Huijin.Extraction of buildings from full-polarimetric SAR imagery[J].Science of Surveying and Mapping,2019,44(11):143-147.)
[2] 王贺,张路,徐金燕,等.面向城市地物分类的L波段SAR影像极化特征提取与分析[J].武汉大学学报(信息科学版),2012,37(9):1068-1072. (WANG He,ZHANG Lu,XU Jinyan,et al.Evaluation of L-band polarimetric SAR images for urban land cover classification[J].Geomatics and Information Science of Wuhan University,2012,37(9):1068-1072.)
[3] 陈启浩, 聂宇靓, 李林林, 等. 极化分解后多纹理特征的建筑物损毁评估[J]. 遥感学报, 2017, 21(6):955-965.
(CHEN Qihao, NIE Yuliang, LI Linlin, et al. Buildings damage assessment using texture features of polarization decomposition components[J]. Journal of Remote Sensing, 2017, 21(6): 955–965.)
[4] 刘修国, 姜萍, 陈启浩, 等. 利用改进三分量分解与Wishart分类的极化SAR图像建筑提取方法[J]. 测绘学报, 2015(2):206-213.
(LIU Xiuguo, JIANG Ping, CHEN Qihao, et al. Buildings extraction from polarmetric SAR image using improved three-component decomposition and Wishart classification[J]. Acta Geodaetica et Cartographica Sinica, 2015, 44(2):206-213.)
[5] MORIYAMA T, YAMAGUCHI Y, URATSUKA S, et al. A study on polarimetric correlation coefficient for feature extraction of polarimetric SAR data[J]. IEICE Transactions on Communications, 2005, 88(6): 2353-2361.
[6] AINSWORTH T L,SCHULER D L,LEE J S.Polarimetric SAR characterization of man-made structures in urban areas using normalized circular-pol correlation coefficients[J].Remote Sensing of Environment,2008,112(6):2876-2885.
[7] ZHAI Wei,SHEN Huanfeng,HUANG Chunlin,et al.Fusion of polarimetric and texture information for urban building extraction from fully polarimetric SAR imagery[J].Remote Sensing Letters,2016,7(1):31-40.
[8] FREITAS C C, FRERY A C, CORREIA A H. The polarimetric �distribution for SAR data analysis[J]. Environmetrics, 2005, 16(1): 13-31.
[9] LI Linlin,LIU Xiuguo,CHEN Qihao,et al.Building damage assessment from PolSAR data using texture parameters of statistical model[J].Computers & Geosciences,2018,113:115-126.
[10] AZMEDROUB B, OUARZEDDINE M, SOUISSI B. Extraction of urban areas from polarimetric SAR imagery[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2016, 9(6):2583-2591.
[11] 姜萍,刘修国,陈启浩,等.利用多尺度SVM-CRF模型的极化SAR图像建筑物提取[J].遥感技术与应用,2017,32(3):475-482. (JIANG Ping,LIU Xiuguo,CHEN Qihao,et al.A multi-scale SVM-CRF model for buildings extraction from polarimetric SAR images[J].Remote Sensing Technology and Application,2017,32(3):475-482.)
[12] DU P J,SAMAT A,WASKE B,et al.Random forest and rotation forest for fully polarized SAR image classification using polarimetric and spatial features[J].ISPRS Journal of Photogrammetry and Remote Sensing,2015,105:38-53.
[13] DE S, BRUZZONE L, BHATTACHARYA A, et al. A novel
technique based on deep learning and a synthetic target database for
classification of urban areas in PolSAR data[J]. IEEE Journal of Selected
Topics in Applied Earth Observations and Remote Sensing, 2017, 11(1): 154-170.
[14] ZHOU Yu,WANG Haipeng,XU Feng,et al.Polarimetric
SAR image classification using deep convolutional neural networks[J].IEEE
Geoscience and Remote Sensing Letters,2016,13(12):1935-1939.
[15] ZHANG Zhimian,WANG Haipeng,XU Feng,et al.Complex-valued
convolutional neural network and its application in polarimetric SAR image classification[J].IEEE
Transactions on Geoscience and Remote Sensing,2017,55(12):7177-7188.
[16] ZHANG Ce,PAN Xin,LI Huapeng,et al.A
hybrid MLP-CNN classifier for very fine resolution remotely sensed image
classification[J].ISPRS Journal of Photogrammetry and
Remote Sensing,2018,140:133-144.
[17] WU Wenjin,LI Hailei,LI Xinwu,et al.PolSAR
image semantic segmentation based on deep transfer learning:realizing smooth
classification with small training sets[J].IEEE Geoscience
and Remote Sensing Letters,2019,16(6):977-981.
作者简介:李梅(1998—),女,湖北武汉人,硕士研究生,主要研究方向为极化SAR建筑物提取。
E-mail:cuglimei@163.com
基金项目:国家自然科学基金项目(41771467)
通信作者:陈启浩 副教授 E-mail:cugcqh@163.com
转自:“测绘学术资讯”微信公众号
如有侵权,请联系本站删除!