以下文章来源于GEE遥感训练营 ,作者热爱生活与科研
题目:Comparison of common classification strategies for large-scale vegetation mapping over the Google Earth Engine platform
期刊:International Journal of Applied Earth Observation and Geoinformation
第一作者:Marín Del Valle Tomás
发表单位:复旦大学
发表日期:2022年
1. 摘要
研究背景:本研究旨在比较Google Earth Engine平台上常见的分类方法,用于大规模植被映射。植被是地球上生物多样性和生态系统功能的重要组成部分,对于环境监测、资源管理以及气候变化等具有重要意义。然而,在大规模区域进行精确的植被分类仍面临一些挑战,如遥感数据量庞大、复杂地貌条件下分类准确性等。
拟解决的科学问题:本研究拟解决以下科学问题:在Google Earth Engine平台上,如何选择合适的分类器来实现高精度的大规模植被映射?不同分类策略之间是否存在差异,并且哪种方法最适合特定地区或特定类型的植被?
创新点:本研究的创新点包括:比较了Google Earth Engine平台上多种常见的分类策略,为大规模植被映射提供了参考和指导。考虑到不同地貌条件和植被类型的差异,提出了针对特定情况选择最佳分类策略的思路。基于机器学习算法进行特征提取和模型构建,充分利用Google Earth Engine平台的计算能力和存储资源。
2. 研究方法
本研究采用以下方法进行研究:
数据获取与预处理:利用Google Earth Engine平台获取相应区域内多光谱遥感影像数据,并进行辐射校正和云去除等预处理步骤。
特征提取与选择:基于不同传统或机器学习算法,提取合适的植被特征,并使用特征选择方法筛选最具区分度的特征。
分类模型构建与比较:根据不同分类策略,构建相应的分类模型,并进行交叉验证和性能评估来比较不同方法之间的准确性。
结果分析与优化:对比实验结果,分析各种分类策略在大规模植被映射中的效果,并优化最佳方法。
分类框架的总体流程图。该框架分为三个阶段:数据准备、植被掩蔽以及分类策略的实施和评估。中间步骤和每个步骤生成的产品分别用蓝色和橙色表示
3. 研究结果
植被资源与自然资源管理和环境保护密切相关,在可持续发展中发挥着重要作用。遥感技术在植被测绘应用中的使用对于这些资源的可持续管理越来越重要。我们分析了 Google Earth Engine 大规模植被测绘任务中常用的一组代表性策略,以评估它们在对具有异质植被类别、地块配置和农业实践的复杂景观进行分类时的性能。
这些策略基于分类器参数和样本设计的不同组合,并通过特定类别和一般准确度指标进行评估。结果表明,使用光学和雷达数据的密集像素时间序列、类平衡标签和多季节时间框架是对各种植被类别进行大规模制图的最有效策略。相比之下,次优策略的实施在少数群体的准确映射方面尤其成问题。
最后分析表明,随机森林中使用的不同参数对结果没有显著影响,进一步证明了该方法在分类问题上的准确性。这项工作为植被测绘分类算法的设计提供了指导,展示了哨兵数据在大空间和时间尺度上生成准确地图的潜力,并强调了云计算工具对于大规模监测的重要性。这些成果将有助于对中国和其他地区的植被资源和乡村景观进行更加可持续的管理。
研究区。 江苏北部区域覆盖长三角平原5.49万平方公里,包括徐州(XZ)、宿迁(SQ)、连云港(LYG)、淮安(HA)和盐城(YC)等城市
分类方法的特定类别准确性的差异。 每个替代方案与基准策略之间的差异是根据 Wilcoxon 符号秩检验使用每个折叠和频率类别的生产者和用户准确度值计算得出的。 伪中值估计值和置信区间是在 95% 置信水平下计算的
分类策略的总体准确性存在差异。 每个替代方案与基准策略之间的差异是使用每次折叠的总体准确度值通过 Wilcoxon 符号秩检验计算得出的。 伪中值估计值和置信区间是在 95% 置信水平下计算的
基准策略的混淆矩阵。 这些值表示五个交叉验证折叠中每个类别的观察总数的相对数量的平均值(行:分类结果;列:参考数据),以百分比表示
根据 Boruta算法计算出的基准策略的特征重要性。该图显示了一年中每个波段和每天的五次交叉验证折叠的平均归一化平均 z 得分值。z 分数越高,分类模型中变量的重要性就越高
使用基准策略对冬季景观进行分类的结果。 该图显示了分辨率为10 m的7个植被类的空间分布
使用基准策略对夏季景观进行分类的结果。 该图显示了分辨率为10 m的10个植被类的空间分布
研究区植被类别范围的估计值。数值是在城市一级进行汇总
将分类结果与县/区一级选定作物的官方统计数据进行比较。小麦、水稻、玉米、油菜籽和花生面积直接与报告值进行比较。将大豆和森林面积分别与豆类和可用森林指标(森林覆盖百分比、年末成年森林存量)的值进行比较。由于缺乏数据,其他植被类别省略
4. 结果与讨论
在Google Earth Engine平台上,采用不同分类策略可以实现高精度的大规模植被映射。不同分类策略之间存在差异,在处理复杂地貌条件或特定类型植被时表现出不同效果。
随机森林中使用的不同参数值对结果没有显著影响。结果证明了算法设计在多个植被类别的有效分类中的重要性,证实了Sentinel数据在生成高分辨率和准确度的测绘产品方面的有用性,并强调了云计算工具对于开发大规模植被测绘工具的重要性。
这些发现为未来分类框架的设计提供了一般指导方针,这对于促进全球自然资源的可持续管理是必要的。
参考文献:Tomás V D M,Ping J. Comparison of common classification strategies for large-scale vegetation mapping over the Google Earth Engine platform[J]. International Journal of Applied Earth Observation and Geoinformation,2022,115.
转自:“生态遥感前沿”微信公众号
如有侵权,请联系本站删除!