原 名:Mapping of crop types and crop sequences with combined time series ofSentinel-1, Sentinel-2 and Landsat 8 data for Germany
译 名:使用 Sentinel-1、Sentinel-2 和 Landsat 8 数据的组合时间序列绘制德国作物类型和作物序列图
期 刊:Remote Sensing of Environment (IF=13.85)
发表时间:2022.02
DOI:https://doi.org/10.1016/j.rse.2021.112831
1.研究背景
在气候变化、生物多样性丧失、人口增长和对农产品需求上升等全球挑战的背景下,监测农业系统变得越来越重要。为了制定未来可持续农业的战略,需要高分辨率的国家比例尺农业用地地图。然而,由于耕地的地方差异和时间变化特征,对大面积和多年的农业土地覆盖特征的表征仍然具有挑战性。我们在此提出了一种考虑不同环境条件的年度全国农业土地覆盖地图生成流程。我们通过绘制2017年、2018年和2019年德国24个农业土地覆盖类别的地图,对该方法进行了测试,在这3年里,气象条件存在很大差异。我们使用随机森林分类器和来自Sentinel-2和Landsat 8的密集时间序列数据,结合Sentinel-1的月度复合数据和环境数据,评估光学、雷达和环境数据的相对重要性。
2.研究区域
德国总面积为357,376平方公里,其中约51%(2017年)为农业用地,其次是森林,占31%,城市结构和基础设施占14% (2018年)。地形梯度自北向南延伸。海拔200米以下的北部低地平原以年轻的冰川后沉积物为主,质地从纯砂到砂壤土不等。由于土壤养分含量低、持水能力低以及易酸化,通常避免将沙质土壤用于农业用途,而且大部分沙质土壤仍有森林。如果处于农业用途,这些地点主要是马铃薯和黑麦生产,或草原。
图1 研究区位置图
3.数据采集
(1)Sentinel-1数据
我们从德国云计算平台获得了月度VH和VV 的S1后向散射复合数据。这些复合数据来自S1 GRD数据,并使用Sentinel工具箱处理为后向散射数据(GRD边界和热噪声去除、校准和地形校正)。我们下载了2017-2019年VV和VH的月平均合成数据,并将数据重采样到10 m的空间分辨率。我们进一步从月合成数据中推导出雷达植被指数,并将它们纳入分析,因为这些SAR指数被证明对作物类型分类有价值。我们每年总共生成48个Sentinel-1特征4个波段(VV, VH, RVI, VHVV)乘以12个时间步(月分辨率)——在我们的分析中加以考虑。
(2)Sentinel-2和Landsat-8数据
我们将Landsat-8机载操作陆地成像仪(OLI)的1级数据与Sentinel-2A和B机载多光谱仪器(MSI)的1C级数据图像相结合,生成密集的光谱时间序列。我们使用了2017年、2018年和2019年3月1日至9月31日期间拍摄的所有云量低于75%的可用图像。使用FORCE Level-2模块进行了辐射校正(大气和地形、BRDF和邻接效应校正)。基于优化后的FMASK算法对云和云阴影进行屏蔽。利用STARFM代码的纯光谱设置,20米空间分辨率的S2波段被锐化到10米。采用最近邻重采样法将30 m空间分辨率的L8波段与10 m S2像素网格进行匹配。我们使用了两种传感器系统(即蓝、绿、红(VIS)、近红外(NIR)、短波红外(drif1和drif2)波长)的可比光谱波段,加上三个光谱指数,这些指数在之前的研究中已被证明可以改善作物类型分类。
(3)环境数据
我们纳入了与地形、温度和降水相关的预测变量,以解释德国各地的农业生态梯度。我们从德国联邦制图和大地测量局, 提供的10米空间分辨率的数字高程模型(DEM)中导出了地形变量高程、山坡和坡向。此外,我们利用DEM在10 m分辨率下导出了地形湿度指数(TWI)。TWI描述了取决于地形的任何地点的潜在水可用性或湿度。
温度和降水是控制德国农作物生长和发育的重要因素,因为只有2.71%的农业区域得到灌溉。利用1981-2010年高分辨率(1 × 1 km)气候资料描述季节平均气温和降水的气候梯度特征。由于2017-2019年也显示出与平均气候学的区域差异偏差,我们还使用了与地图年份相关的生长季节的月平均温度、降水和土壤含水量。气象和土壤湿度数据也可从德国气象局获得网格化的1 × 1公里数据。总共衍生出39个环境变量作为辅助特征,以解释生长条件的区域和季节变化。
表1 环境数据集的分辨率、来源和使用的特征类型标识符的缩写
(4)参考数据
国际土地信息系统包括土地层面的农业做法(例如,种植的作物类型和土地用途)的详细空间信息,也称为土地信息系统(LPIS)。这些信息由农民和土地所有者每年自行报告。高度的空间和主题细节使IACS数据成为一个极好的参考来源。然而,它们也并非没有数字化错误或虚假声明。还必须指出的是,只报告农业使用的区域,不是所有农民或土地所有者都申请补贴,只有某些作物或土地用途有资格获得欧洲联盟的补贴。因此,LPIS不能提供覆盖所有农业用地的全面覆盖。
4.研究方法
(1)总体技术路线
我们选择德国作为研究区域,因为其高度多样化的农业景观,其特征是影响作物表现和管理决策的农业生态条件的梯度。选择2017年、2018年和2019年作为研究期,因为它们表现出对比鲜明的季节性天气条件,为评估在不同气象条件下作物类型绘图的重复性提供了一个有趣的试验场。到目前为止,在德国还没有公开有关特定年份作物类型分布的明确空间信息。为了深入了解光学数据对SAR和环境数据的重要性,我们比较了基于不同输入特征集的多个模型。
图2 总体技术路线图
(2)训练和验证数据集的划分
我们将LPIS参考数据随机分割为训练包和验证包,通过自相关避免估计精度的偏差,并对所有训练数据使用15 m内向缓冲区,以消除田地边界的混合像素。接下来,对这些包进行栅格化,以适应FORCE数据立方体结构的10 m像素网格。然后,我们分别从训练包和验证包中随机选择每个作物类型类1000个像素。在训练类不平衡严重的机器学习算法时,为了避免潜在的偏差,采用了平等分配方案。为了保证很好地表示类内变异,每个作物类型类别的1000像素以分层随机方式分配,以按比例表示作物类型子类的比例和面积。
表2 LPIS数据集中所选作物类型类的区域
(3)分类方法
我们测试了不同的随机森林参数设置后,以构建500棵树,既可以控制计算成本,同时不牺牲准确性。 对于每一年,使用基于LPIS数据的训练数据集,结合每年相应的全谱时间序列(包括三个指数、相应的S1月产品和环境数据集),建立随机森林模型。模型被应用于预测整个德国的作物类型类别。我们比较了六种不同的输入特征集,以评估光学、SAR和环境数据对作物类型分类的重要性 。对于特征重要性度量,使用部随机森林基尼杂质度量。
表3 基于输入数据子集的分类模型概述
5.研究结果
(1)不同输入特征集的整体分类精度
当将环境数据添加到S1特征集时,三年中准确性提高了约5%。当光学时间序列与环境信息相结合时,总体精度的提高略不明显(3%)。总体而言,结合S2/L8和S1数据获得的准确性与结合S2/L8和环境数据产生的结果相当。当结合所有可用数据源时,获得了最高的总体精度。
随机森林变量的重要性证实了S2/L8波段和指数对分类精度的影响大于S1 VV和VH后向散射的月度复合(图3b)。S2指数和波段特征重要性最高,其次是S1、VH和VV。与S1 VH和VV数据相比,RVI和VHVV比值在我们的RF模型中影响较小。在环境变量中,逐月温度和土壤水分动态的相关性最强,而地形变量组的相关性最低。
图3 作物类型映射输入数据的重要性
比较不同年份的特征重要性发现了两个有趣的主要模式:基于其重要性的特征和特征组的排序在各年之间是一致的;特征重要性的时间模式在各年之间是不同的,除了基于sar的特征。变化的时间模式表明作物物候的年际变化,这在物候剖面中也可见(图4)。NDVI时间序列显示作物冬小麦的早期下降。2018年6月和7月的冬油菜籽和春大麦,可能与提前成熟和收获有关。
图4 2017-2019年选定作物类型的物候分布图。所示为每作物1000像素的平均NDVI (Sentinel-2/Landsat 8)和RVI (Sentinel-1)剖面
(2)类别精度
7种面积大于2%的主要作物类型的地图精度在68%到96%之间(UA和PA)。这包括草地、冬小麦、冬大麦、冬黑麦、青贮玉米、油菜籽和甜菜。更小的斑块在UA和PA估计上差异更大,表明要么低估,要么高估。草地是最具优势的类群,占农业面积的31% ~ 33%,UA≥94%,PA≥82%。由于PA较低,绘制的草地面积比参考面积低3-4%。在这三年中,草地与所有其他类别混淆,但与青贮玉米、冬小麦和小木本特征混淆最多。草莓和胡萝卜的低UA与草地和玉米(青贮)的高估有关,而春谷在冬小麦、春大麦、春燕麦和草地上的预测是错误的。
图5 用户和生产者对单一作物类型和所有三个参考年份(2017年、2018年和2019年)的地图精度
在整个德国,包括那些缺乏训练数据的地区,农田地块似乎划分得很好,且相同,即大多数地块被划分为单一作物类型,特别是对于基于像素的方法。如果将几种作物类型归为一类,这些作物通常属于一个更大的群体。
图6 德国各地不同环境和管理条件地区的作物类型分类特写
(3)与农业普查数据的比较
我们比较了具有LPIS数据(BB、by、LS、MV、RP)的联邦州和没有LPIS数据的联邦州的农业统计数据估算的地图面积和面积之间的一致性,以了解我们的模型预测培训数据未涵盖区域的作物类型等级的效果。我们观察到,在有训练数据的联邦州和没有训练数据的地区,作物类型均表现良好。
图7 作物类型类别的年度农业面积来自农业统计数据和每个联邦州的分类作物类型地图。
6.研究结论
(1)准确的农业区域和土地使用地图是为决策者提供信息的一个重要前提,决策者的目标是制定确保粮食安全的政策,同时保持宝贵的环境资源和服务。我们的研究结果突出了Sentinel-1和密集的Sentinel-2/Landsat 8时间序列的价值,以及在国家层面上具有高度空间和主题细节的作物类型年度制图的环境数据。作物序列模式的确定显示了年度地图在综合作物序列和未来全国范围的作物轮作分析中使用的潜力。在哥白尼计划和陆地卫星计划前所未有的开放数据可用性的背景下,我们提出了一种可重复的工作流程,将光学、SAR和环境数据结合起来,用于考虑年际气象变率的大面积作物类型制图。虽然数据来源的组合优于仅使用光学或雷达数据,但集成密集雷达时间序列而不是每月复合数据的影响仍然需要评估。此外,我们证明,覆盖广泛环境梯度的大面积研究不仅对国家报告很重要,而且对揭示在不同环境条件和数据可用性下用于作物类型测绘的光学和雷达数据的优缺点也很重要。
(2)2017-2019年基于卫星的国家农业土地覆盖地图捕捉了国家农业统计报告的年度趋势。更详细地将玉米分成不同的生产线(谷物、青贮),或将冬季和夏季谷物分成物候相似但经济上不同的品种,仍然具有挑战性。基于包的分析可能有潜力减轻一些剩余的类混淆。未来的研究工作可能旨在进一步改进草地类型、饲料作物和捕获作物的分离。这种分类对于详细的农业生态系统建模方法、模拟硝酸盐淋溶或温室气体排放等过程是至关重要的。
7.引用格式
Blickensdörfer, Lukas, Marcel Schwieder, Dirk Pflugmacher, Claas Nendel, Stefan Erasmi, and Patrick Hostert. "Mapping of crop types and crop sequences with combined time series of Sentinel-1, Sentinel-2 and Landsat 8 data for Germany." Remote sensing of environment 269 (2022): 112831.
转自:“科研圈内人”微信公众号
如有侵权,请联系本站删除!