英文原题:Optimizing Soil Sampling with Information Entropy at Heavy-Metal Sites
通讯作者:尧一骏,中国科学院南京土壤研究所
作者:Jun Man, Yuanyuan Chen, Huifeng Fan, Qiang Chen, Yijun Yao*
近日,中国科学院南京土壤研究所尧一骏研究员团队提出了一种基于信息熵的场地调查方法,能够用于优化重金属场地土壤布点方案。该工作为识别重金属污染空间分布提供了一个有效的工具,并为确定加密布点区域提供了一定的认识。
掌握场地重金属空间分布特征并识别污染状况,是污染场地风险管控的基础,也是控制场地污染和保障环境安全的重要前提。通常的做法是进行土壤采样并使用地统计方法进行空间插值。土壤污染调查作为场地环境管理全流程中的初始阶段,一般分为初步调查和详细调查两个阶段。监测点位的布设方式就决定了能否精准表征出场地土壤的污染状况,不同的布点方式往往会导致空间预测精度上的差异。根据前人研究,土壤样品的位置和数量对于表征土壤中重金属的空间分布至关重要,这就牵涉到采样策略。直观地说,在预测重金属的空间分布时,采样策略就决定了数据价值(即采样数据中包含的信息量)。即使是对于相同数量的采样数据,如果数据中包含的信息量更高,那么空间预测精度也能得到提高。因此,需要对重金属污染场地的土壤采样策略进行优化。
近年来,随着信息理论的发展衍生出了许多不同形式的信息熵。针对上述问题,中国科学院南京土壤研究所尧一骏研究员团队提出了一种基于信息熵的场地调查(IESI)方法,在详细调查之前,实施一个优化设计步骤来指导土壤采样,以优化污染场地的详细调查设计。该工作为识别重金属污染空间分布提供了一个有效的工具,并为确定加密布点区域提供了一定的认识。
给定一个实际场地,我们执行克里金算法,利用初步调查数据(PS)、初调和常规详调数据(PCS)以及初调和优化设计下的详调数据(POS)对该污染场地进行空间插值。得到重金属浓度场的均值估计和方差估计、以及采样点的空间位置(图1)。总的来说,使用PS数据进行空间插值,一些局部污染区域能够被识别出来,但所得重金属浓度均值估计场与参考场仍有较大差别。基于常规设计的详细调查,重金属浓度均值估计场的不确定性的确降低了(图1f),但空间预测精度没有明显提高(图1e)。基于优化设计的详细调查,其详调采样点是在信息熵的指导下得到的,空间位置相对比较分散。可以发现,重金属浓度均值估计场与参考场较为相似(图1h和1k),并且重金属浓度均值估计场的不确定性较小(图1i和1l)。基于香农熵和相对熵的PS、PCS和POS的内插结果的相应RMSE值分别为0.82、0.83、0.76和0.71。以上结果表明,相对熵比香农熵在指导土壤采样上具有更好的优势。
图1:重金属浓度场的均值和方差估计以及不同采样方案对应的采样位置
考虑到优化设计结果的非唯一性,我们重复进行了20次IESI,同时采用了不同数目的详调采样点。计算出了相应的均方根误差(RMSE)(图2a),并得到了RMSE与相对熵之间的散点图(见图2b)。使用POS数据进行空间插值时,RMSE值随详调采样点数目的增加从0.83下降到0.75。当详调采样点数目较少时,RMSE值的变化范围相对较小。总的来说,相对熵随着详调采样点数目的增加而趋向于增加。此外,我们发现相对熵与RMSE值之间存在明显的负相关关系 (P<0.001),表明具有较大相对熵的采样策略往往会产生较小的RMSE值。
图2:(a)不同详调采样点数目下计算得到的RMSE值,(b)相对熵和RMSE值之间的关系
图3给出了几种常用克里金算法(OK, log-OK, UK_L, UK_Q)通过内插PS、PCS和POS数据预测得到重金属浓度均值估计场。在初步调查阶段,由OK、log-OK和UK_Q插值得到的重金属浓度均值估计场较为相似,相应的RMSE值分别为3.60、3.64和3.62。UK_L预测得到的重金属浓度空间分布在水平方向上均匀变化,显示出较大的RMSE值(图3c中RMSE=4.15)。在进行常规的详细调查后,这四种克里金算法结果类似(图3e-3h);与单独使用PS数据相比,重金属浓度场的空间预测精度明显提高。此外,可以看出采用优化设计下的详细调查方案,能够进一步提高重金属浓度空间预测精度。
图3:通过常用克里金算法内插PS、PCS和POS数据得到重金属浓度均值估计场
为了避免单次优化设计带来的偶然误差,我们计算了20次优化设计的RMSE值,并与通过内插PS和PCS数据的RMSE值进行比较(图4)。POS的平均估计RMSE值明显低于PS和PCS,表明其空间预测最准确。值得注意的是,POS和PCS数据的采样点数量是相等的。在POS数据的插值结果中,UK_Q的表现最好,RMSE值最低,说明选择合适的克里金算法有助于提高IESI方法的预测精度。
图4:通过内插PS、PCS和POS数据,计算得到的实际浓度与克里金预测浓度之间的RMSE
我们以一个虚拟的污染场地(图5a)为例,希望能够为加密布点区域的确定提供参考。通过使用PS数据进行空间插值,根据先验统计计算出候选采样点的土壤污染概率并绘制其等高线图(图5b)。进行20次优化设计,计算出候选采样点被选中的频率。结果发现,信息量较大的采样点主要分布在初步调查确定的污染区周围(图5a),土壤污染概率在0.75和0.95之间(图5b)。从根本上肯定了传统设计标准的合理性,即在污染区周围加密布点是必要的。
图5:参考浓度场和候选采样点的土壤污染概率分布
综上所述,对于虚拟的和实际的重金属污染场地,IESI方法都优于常规调查方案。IESI不仅方法可以识别新的污染区和清洁区,并且用较少的采样点达到与常规调查方案相当的空间插值精度。同时,IESI方法还可能识别出初步调查阶段没有发现的新热点区域,避免克里金法的平滑效应。
相关论文发表在ACS ES&T Engineering上,中国科学院南京土壤研究所满俊副研究员为文章的第一作者,中国科学院南京土壤研究所尧一骏研究员为通讯作者。
转自:“ACS美国化学会”微信公众号
如有侵权,请联系本站删除!