原名:
Rapid early-season maize mapping without crop labels
译名:
无作物标签的早季玉米快速制图
期刊:Remote Sensing of Environment
发表时间:2023.1
DOI:10.1016/j.rse.2023.113496
1.研究背景:
玉米是世界上产量第二大的作物,为人类提供了至关重要的食物、饲料和燃料。然而,现有的作物类型图产品都是在收获后制作的,借助于全季完整图像时间序列和充分的地面实况,而不是早期季节的预测,降低了这些地图在许多应用中的效用。因此,有必要开发适用于美国和中国以及其他玉米种植区玉米带的早季制图算法。
早季作物制图主要存在两个难点。首先,早季作物制图应独立于当年的作物标签,以保持及时性。在预测早季作物类型之前,制图程序收集当年的作物标签为时已晚。其次,早季作物测绘只能在早季或中季使用有限的卫星观测,而不能在全植被季节使用所有观测。
已有的早季制图方法使用历史地面实况数据或档案作物图,通过分类器转移策略和样本转移策略预测目标年份的作物类型。尽管分类器转移和样本转移策略都没有使用当年的作物标签,但它们严重依赖于历史作物标签,因此很难应用于标签恐慌地区。除了对历史作物标签的依赖外,现有的分类实验也不能以实际的方式处理有限的早季图像时间序列。本文的目的是探索仅在早季使用卫星观测绘制玉米地图的可能性。
2.研究区域:
本文在研究过程中一共选择了四个研究地区:美国的爱荷华州和佐治亚州、中国的黑龙江省和法国的大东部地区。在四个研究区域中,玉米是爱荷华州和黑龙江的主要作物类型,而在法国的大东部地区和佐治亚州是次要作物类型。同时,这四个地区有不同的气候条件、不同的作物结构和不同的作物日历。四个研究领域的多样性使我们有机会测试我们提出的方法的可行性和稳健性。研究区具体位置如图1所示。
研究中使用的数据主要包括:1)Sentinel-2(S2)图像,2)预定义的农田掩码,3)地面实况数据,4)现有作物类型地图,以及5)官方统计数据。S2图像和预定义的农田掩模是我们模型的仅有的两个输入;使用地面实况样本、现有作物地图和官方统计数据来评估所提出方法的性能,并评估我们的早季玉米地图的准确性。
图1 研究区域的位置
3.植被指数的计算与分析:
(1)不同植被指数计算方法
1. 红边位置(REP)
REP是本研究的主要植被指数。红边位置被定义为植被光谱的红边区域(680至780nm)中最大斜率的波长。叶绿素含量的增加会使REP向更长的波长移动。REP已被证明与叶片叶绿素含量具有最强的相关性。基于S2的REP可以通过以下方式进行估计:
2.其他植被指数
其他六个常用的植被指数(VI)也包括在研究中,包括归一化差异植被指数(NDVI)、绿色叶绿素植被指数(CIgreen)、地表水指数(LSWI)、归一化差异红边(NDRE),Datt在1999年提出的指数(Datt99)和红边叶绿素指数(CIred edge)。这六种VI的具体计算方法如表1所示:
表1 用于比较的植被指数汇总
(2)植被指数动态分析
1. 不同作物的植被指数动态变化
由于不同的作物日历和独特的固有特征,不同的作物表现出不同形状的NDVI和REP时间序列,如图2所示。从图2中的NDVI曲线可以看出,NDVI时间序列不是分离玉米和大豆的最佳特征。当使用NDVI时间序列时,传统的时间序列匹配技术可能无法处理玉米、大豆和水稻的分类。而在高峰季节,爱荷华州和黑龙江的玉米和大豆的REP时间序列表现出明显的差异,这有益于区分玉米和大豆。然而,到了季中,玉米和水稻并没有表现出明显的差异。
图2 2020年四个地区主要作物NDVI和REP的时间序列曲线
2. 不同作物之间的REP直方图
为了进一步分析玉米和其他作物之间的类间差异,本文显示了几个10天间隔内主要作物的直方图,如图3所示。在作物生长旺季,玉米的平均REP确实高于大豆、向日葵、棉花和花生。玉米的REP也高于冬春季作物,这是由于酚类物质的差异。然而,玉米的REP与水稻几乎相同,这表明需要通过其他信号将玉米与水稻分离。本文发现玉米的较高REP可以持续至少40天。此外,由于光谱和酚学特征的类内变化,玉米直方图与其他作物的重叠不可避免地存在。不同作物之间叠加的直方图表明了使用REP时的潜在限制。
图3 2020年研究区玉米和其他作物的直方图
4.多时相高斯混合模型(MGMM)
玉米总是比周围的其他夏季作物具有更高的REP,我们使用了一个输入REP的多时相高斯混合模型(MGMM-REP)来区分玉米和其他夏季作物。MGMM-RET的发展基于两个假设:1)玉米种植区的REP直方图可能表现出双峰或多峰信号,因此可以用高斯混合模型拟合;2) 多时间GMM概率输出的集成可以有利于分类性能。
(1)高斯混合模型(GMM)
高斯混合模型(GMM)是一种概率密度函数(PDF),它假设样本由几个具有未知参数的高斯分布组成。GMM总是用于将总样本集分离为几个聚类。GMM的公式如下所示:
在玉米和另一种作物(大豆、棉花、花生、向日葵等)需要分离的简单情况下,如图4所示,k可以设置为2,然后GMM可以简化为以下形式:
图4 高斯混合模型(GMM)图解
(2)重叠率(OLR)
为了测量两个GMM聚类之间的重叠和交叉程度,我们提出了一种新的重叠率(OLR)指标:
(3)多时相GMM(MGMM)
对于给定的周期([t0,t]),对所有GMM概率输出进行积分,以获得平均概率层。OLRi用作权重信息。具有较低OLRi的概率层将被给予较高的权重,具体计算如下所示:
(4)MGMM-REP的实施步骤
在建模开始之前,我们使用预定义的先前农田层排除了非农田像素,在黑龙江区域,本文还使用早季水稻图排除了水稻像素。在去除非农田和水稻像素后,剩余的像素参与以下步骤:1)合成10天平均REP。2)随机抽样,采样指的是从每个10天的中值REP层中的所有像素中选择大量像素。3)运行GMM,一旦建立了一个GMM,就计算OLR来测量该GMM输出的重要性。4)估计玉米概率。5)整合多时间玉米概率。6)制作早季玉米地图。具体流程如图5所示。
图5 基于REP的多时相高斯混合模型(MGMM-REP)的工作流程
(5)精度评估
根据MGMM-REP得出的早季二元玉米地图在爱荷华州和黑龙江制作了两年(2019-2020),在Grand Est和乔治亚州制作了一年(2020)。这些分类地图的准确性是根据地面实况、现有作物地图和官方统计数据进行评估的。美国农业部的CDL被用作参考地图,以评估爱荷华州和佐治亚州分类地图的准确性。具体精度评价指标如下所示:
5.结果讨论
(1)MGMM-REP的精度随作物进度的变化
MGMM-REP的精度因结束日期、年份和地区而异,如图6所示,虚线标记了早季玉米制图的结束日期。一般来说,F1、UA和PA迅速增加,然后随着作物的生长而稳定。UA几乎在整个期间都高于PA,这表明存在大量遗漏错误。
图6 三个精度指标在四个研究区域内随玉米生长的变化
(2)早季玉米地图的准确性评估
1. 早季玉米地图的准确性指标
表2中列出了不同区域的准确性指标。本文的分类图与美国的CDL数据、法国的RPG数据和黑龙江的地面实况数据具有可比性。然而,爱荷华州、佐治亚州和黑龙江对玉米面积的遗漏误差和低估是明显的。此外,玉米优势地区(爱荷华州和黑龙江)的模型性能优于玉米稀缺地区(Grand Est和乔治亚州)。
表2 四个研究区域早季玉米制图混淆矩阵
2. 玉米比例与参考地图的比较
当将我们的分类玉米地图与0.05的CDL进行比较时◦ 在爱荷华州,我们发现我们的分类图低估了15%的玉米比例,如图7所示。这两张地图之间玉米比例的相关系数均高于0.9。玉米比例的RMSE低于8%。2019年,缺失的玉米像素分散在整个州;而在2020年,缺失的玉米像素集中在东北部地区,如图8所示。在黑龙江中,我们的分类图与参考图一致,如图7所示。分类图和参考图之间的玉米比例R高于0.97。这两张地图之间的RMSE低于6%。2020年,这一低估可能达到11%。不一致的像素分布在东部和西部地区,如图8所示。
图7 本文的分类地图和参考地图在0.05°分辨率上的对比
图8 本文的早季地图和参考地图之间的玉米比例差异
3. 玉米面积与统计数据的比较
本文的分类图与所有四个区域的统计数据一致,相关系数高于0.94,如图9所示。在爱荷华州,分类图在2019年和2020年分别低估了13%和11%的玉米面积。在黑龙江,分类估计的玉米面积在2019年高估了5%的玉米面积,而在2020年低估了4%的玉米面积。在Grand Est和佐治亚州,从分类图中得出的玉米面积也与统计数据相匹配。
图9在四个地区的早季分类地图和官方统计数据之间的玉米面积估计比较。
6.讨论:
(1)MGMM-REP的优势
与之前的研究相比,MGMM-REP存在四个优势:1)不需要训练数据,2)使用多个GMM,3)使用OLR,4)不需要时间插值。
具体来说,MGMM-REP独立于任何训练数据(作物标签),这可能是早季作物制图的突破。在没有当前和历史训练数据的情况下,所提出的MGMM-REP对于数据稀缺的地区是有希望的,并且可以追溯多年。除此之外,多个GM的利用有利于模型的性能。由于缺失数据的不规则分布和不同轨道之间的不同观测时间,REP最大值可能在很大程度上包含实质性的空间变化。这些变化与不同作物之间的类间变化无关,会降低模型性能。此外,MGMM-REP不需要对输入图像进行间隙填充,可以处理像素缺失的图像。我们的方法避免了时间插值,从而增加了实践中的灵活性。
(2)REP用于玉米鉴定的能力
尽管一些工作使用了REP进行作物检测制图,但REP在玉米鉴定中的效率以及REP在其他VI中的优势很少被强调。通过与其他常用的植被指数(如NDVI、CIgreen、LSWI、NDRE、Datt99和CIred edge)的综合比较,本文发现REP是MGMM用于早季玉米制图的最佳输入。与其他VI相比,REP在季中表现出更高的类间差异和更低的类内变化,这有助于MGMM-REP的高性能。
(3)不确定性分析
几个错误源限制了MGMM-REP的性能。首先,在运行MGMM-REP之前,我们生成了一个预定义的农田层来排除非农田像素。我们预先定义的农田层可能会将一些休耕的农田归类为草地或荒地,因为它们的光谱外观相似。对农田休耕的忽视可能会导致潜在玉米像素的损失,从而增加我们生成的地图中的遗漏错误。其次,在早期季节有足够的晴空观测是必要的。尽管MGMM-REP可以容忍像素丢失,但当输入图像被云和阴影严重污染时,它可能是无效的。第三,作物光谱的类内变异性会降低模型的性能。类内的高可变性将导致不同GMM分量之间的更多重叠,从而产生不可靠的概率输出。
(4)适用性验证
需要三个步骤来验证MGMM-REP对新的感兴趣领域(AOI)的适用性。1) 查看近年来农田动态。如果近年来耕地面积趋于稳定,那么预先定义的耕地层是有用的;相反,如果耕地扩张、耕地迁移和耕地废弃频繁发生,那么使用预先定义的耕地将是不合适的。2) 调查玉米和其他作物之间的REP差异。这一假设可以通过先验知识进行检验,也可以通过REP直方图和GMM拟合进行检验。如果REP的直方图表现出双峰或多峰,并且可以通过GMM函数很好地拟合,那么这个假设总是成立的。3) 根据统计数据估算玉米的比例。相对较低的玉米比例(次要类别)和极高的玉米比重(主要类别)都会降低模型性能。适度的玉米比例(30%-90%)是实施MGMM-REP的理想选择。
7.总结:
为了克服早季作物制图中作物标签(包括地面实况和档案作物地图)的稀缺性,本研究开发了一种新的无监督方法,即基于REP的多时相高斯混合模型(MGMM-REP),只使用早季的少量Sentinel-2图像。玉米的REP显著高于周围作物(即大豆、棉花、花生和向日葵),这使得转基因小麦能够识别其他夏季作物的玉米。本文的早季地图与现有训练有素的收割后作物地图和官方统计数据非常一致。REP的表现优于其他常用的植被指数,F1从2%增加到47%。无监督的MGMM-REP有可能转移到其他玉米种植区,从而为全球早季玉米地图绘制开辟了一条有前景的途径。
8.引用格式:
You N, Dong J, Li J, et al. Rapid early-season maize mapping without crop labels[J]. Remote Sensing of Environment, 2023, 290: 113496.
转自:“科研圈内人”微信公众号
如有侵权,请联系本站删除!