投稿问答最小化  关闭

万维书刊APP下载

佳作分享| ISPRS:基于可解释人工智能的红树林遥感识别方法IMMA及其机理解析

2023/6/19 9:37:18  阅读:155 发布者:

红树林是生长在热带、亚热带海岸潮间带的木本植物群落,能够提供岸线保护、物种保育、固碳等生态服务。卫星遥感技术因具有大范围、可重复、低成本等优势,被广泛应用于红树林生态系统监测中。基于遥感识别红树林分布的研究集中于数据生产方面,即通过机器学习方法和目视校正获得不同时空尺度的红树林分布数据。但是,针对红树林遥感识别机理的研究尚处于空白阶段,制约了现有方法的进一步优化和改进。

中国科学院东北地理所王宗明团队的赵传朋博士和贾明明副研究员针对红树林遥感识别机理,提出了通过随机森林决策规则解析与重构的新方法,发表论文Identifying mangroves through knowledge extracted from trained random forest models: an interpretable mangrove mapping approach (IMMA)”。应用上述方法,在红树林分布制图(ISPRS Journal of Photogrammetry and Remote Sensing2020)、红树林误分类原因(Remote Sensing, 2021)、红树林识别方法(International Journal of Applied Earth Observations and Geoinformation, 2022)研究基础上,以随机森林为起点,重构了一条特征数量少、准确度高、稳健性强的新的决策规则,实现了可解释的红树林制图方法(Interpretable Mangrove Mapping ApproachIMMA),为可解释机器学习提供了一套新的知识抽取方法,可有效推广应用到任意分类问题。

结果显示,在未经任何后处理情况下,仅使用5个特征的决策规则(B12 < 0.06 & B8/B2 > 3.50 & elevation < 4.70 & mangrove vegetation index (MVI) > 2.92 & normalized difference index4 (NDI) < 0.07)达到82.3%的总体精度,证实其有效性。在此基础上进一步分析该规则,发现:B12 < 0.06B8/B2 > 3.50分别与高含水率和低含水率土地覆被重叠,红树林恰好落在二者的交集中。据此,可以推测土地覆被的含水率是红树林遥感识别的潜在机理。

●研究背景●

来源野外踏查

红树林是一类木本植物群落,由潮间带环境下协同进化的不同科属植物构成。按照对温度的适应能力,这些红树植物分为嗜热窄布种(如正红树、水椰、海桑)、嗜热广布种(如木榄、红海榄、海漆)和抗低温广布种(秋茄、白骨壤和桐花树),导致类内差异性大的问题;受滨海土壤因素影响,潮间带后缘的植物同样发展了耐盐能力,不同植被的混杂生长,导致类间可分性低的问题;同时,潮间带环境恶劣、可达性低,因此红树林分布遥感识别具有挑战性。

为了保证数据可用性,现有研究采用先分类、再后处理的方式实现红树林分布遥感识别。但是,数据精度的提升来自于分类方法、还是后处理步骤尚不清晰。未经后处理的分类结果多被当作中间数据,没有被有效验证和分析。在红树林误分类原因、红树林识别方法角度,本人已开展的研究证实了数据精度更多依赖于后处理步骤。但是,红树林如何被遥感识别的问题尚未被解决。

从分类方法角度,红树林分布遥感识别可分为黑箱算法与白箱算法。深度学习通过大量样本实现特征自动构建与分类;机器学习则通过样本和给定特征挖掘不同类别的决策面,进而实现分类。这类方法由样本驱动,具有更高的准确性,但其决策过程难以被人类所理解。知识驱动的方法具有更好的可解释性,但相关知识的构建和更新都需要消耗大量资源。

从黑箱算法中抽取知识,或可实现高准确性和可解释性的红树林分布遥感识别新方法(IMMA),进而解答红树林如何被遥感识别的问题。

●研究方法●

1 已训练随机森林模型的展开图示。

针对这一问题,提出了新的知识抽取方法,具体为:

1)根据训练样本、特征和模型参数,训练随机森林模型。

2)将已训练随机森林模型展开,得到特征、关系、阈值构成的元组。按照关系,将决策规则集合离散化为特征向量和相关特征的阈值向量。

3)参照遗传算法,按照特征出现频率构建种群,并根据相应阈值频率推断最优解,带入到内层遗传算法以优化相应阈值。

4)对于得到的一系列解集,按照适应度值进行排序,优选特征数量少、准确度高的特征及其阈值作为潜在解。

5)通过局部分类结果筛选选定的潜在解,获取经过重构的决策规则。

●主要结论●

应用上述方法,以Sentinel-2影像和高程数据为例,实现了2020年中国红树林遥感识别知识的抽取,得到仅由5个特征组成的决策规则:B12 < 0.06 & B8/B2 > 3.50 & elevation < 4.70 & mangrove vegetation index (MVI) > 2.92 & normalized difference index4 (NDI) < 0.07,在未经任何后处理的情况下总体精度达到82.3%。与深度学习方法分类结果比较,可以发现:本研究的结果更加简练、整洁。

2 红树林遥感识别方法IMMA与深度学习分类结果的比较。其中,目视解译、Capsules-UnetUnet结果均来自于Guo et al. (2021)

直接应用这一决策规则,以美国南佛罗里达大沼泽地区为案例,发现其总体精度为78.8%。考虑到所抽取的知识更适用于东方群系红树林,若采用美国本地已训练随机森林模型,或可得到更适应西方群系红树林的决策规则。

针对红树林如何被遥感识别的问题,进一步解析红树林遥感识别方法IMMA各组成部分的作用。可以发现:B12 < 0.06B8/B2 > 3.50分别对应高含水率土地覆被(Fig. 3a)和低含水率土地覆被(Fig. 3b),二者的交集已有效包含红树林。可以推测,土地覆被的含水率或是红树林遥感识别的潜在机理。

3 红树林遥感识别方法IMMA各组成部分的作用。

本研究构建了一套知识抽取方法,在此基础上得到了特征数量少、准确度高、稳健性强的新决策规则,实现了红树林遥感识别方法IMMA,分析了红树林如何被遥感识别的潜在机理。本研究在黑箱算法和知识驱动红树林遥感识别方法之间构建了一座桥梁,即从黑箱算法抽取知识、从知识进一步优化黑箱算法。

论文信息

论文标题

Identifying mangroves through knowledge extracted from trained random forest models: An interpretable mangrove mapping approach (IMMA)

发表期刊

ISPRS Journal of Photogrammetry and Remote Sensing

论文全文链接

https://authors.elsevier.com/c/1hBV33I9x1mzLL

作者档案

 

第一作者:赵传朋,中国科学院东北地理与农业生态研究所特别研究助理,研究方向为滨海湿地遥感。

E-mail: zhaochuanpeng@iga.ac.cn

 通讯作者:贾明明,中国科学院东北地理与农业生态研究所副研究员、《Frontiers in Marine Science》副主编、《遥感学报》编委,研究方向为滨海湿地植物群落遥感分类机理,滨海湿地植物生理生态参数遥感反演等。

E-mail: jiamingming@iga.ac.cn

 

共同作者:王宗明,中国科学院东北地理与农业生态研究所研究员、《遥感学报》副主编,研究领域为湿地生态环境遥感。

E-mail:zongmingwang@iga.ac.cn

研究团队:中国科学院东北地理与农业生态研究所地理景观遥感学科组,包括张柏、王宗明、毛德华、任春颖研究员,贾明明副研究员,以及30多位博士、硕士研究生和项目聘用人员。主要研究方向有湿地植被群落遥感,湿地植被定量遥感,湿地生态环境遥感评估,以及森林生态系统遥感和农田生态系统遥感等。

鸣谢

本研究由东北地理所赵传朋特别研究助理、贾明明副研究员,王宗明研究员,毛德华研究员,罗德岛大学王野乔教授共同完成,得到国家自然科学基金(No. 42171372, 42171379, 42101392, 42201422)、中国科学院青年创新促进会人才项目(No. 2021227)、博士后科学基金(No.2022M713132)、东地所青年科学家小组项目(2022QNXZ03)共同资助。

转自:“科研圈内人”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com