2023/4/18 9:18:28 阅读:238 发布者:
以下文章来源于景观地理与可持续发展 ,作者臧泽煊
生态系统服务对人类福祉至关重要,但目前正面临许多自然和人为的威胁。虽然生态系统服务制图与模拟研究能帮助我们减缓、适应和管理这些问题,但是仍然面临很多挑战。具体包括:(1)数据可用性;(2)理解,估计和发现不确定性;(3)连接社会-生态系统服务。随着近期机器学习的技术进步,加上大数据的可用性不断提高,为克服这些挑战提供了新的机会。Kyle等人在本文中回顾了利用机器学习或大数据来克服这些局限性的研究进展,并通过综述56篇相关文献来探讨目前使用机器学习和大数据来解决生态系统服务领域上述3个研究空缺的前景和机遇。本文发表于国际期刊Ecosystem Services。
1
研究背景
机器学习已经成为处理和分析海量数据的一种有价值的工具,也是解决在建模和绘制生态系统服务地图时遇到的关键方法学问题和挑战的一种有效和高效的方法。其他越来越多使用的生态系统服务评估模型和工具包括生态系统服务的人工智能(ARIES)、生态系统服务的社会价值(SolVES)和 iTree。
尽管存在大数据和机器学习算法,但生态系统服务界尚未充分利用这些机会来建模和绘制生态系统服务的供求关系图。因此,将大数据和机器学习算法整合到生态系统服务研究中将有助于将该领域发展成为一个更加坚实、跨学科和广泛的研究领域。
2
研究方法
相关文献研究步骤和方法:
1.使用“Scopus”(https://www.Scopus. com/)来编辑关于机器学习和大数据在生态系统服务研究中的应用的文献
2.正确收集,组织和分析选定论文的数据,对生态系统服务进行标准化分类。
3.分析收集关于使用机器学习算法的数据、使用大数据的数据以及为本次审查确定的三个生态系统服务差距中哪一个是使用机器学习、大数据或两者的结合来填补的数据。
3
核心结果
1. 在 2017年之前,只有少数研究使用了这些工具,随后在2019年稳步增加。单独使用 ML(48%)比单独使用大数据(32%)更常见。2018年以后,文化服务和调节服务的关注度大大增加。其中在中国的研究显然比其他国家的研究更加突出。中国是研究最多的国家,有25%的研究是在中国进行的,29%的第一作者都隶属于中国的研究机构。
2. 机器学习和大数据能被用来克服本报告探讨的三个不足之处(即数据的可获得性、模型和输出结果的不确定性,以及社会-生态系统制图的困难)。大数据有助于填补大多数分析研究中的数据可用性空缺(54%),而大多数生态系统服务研究中的模型和输出的高不确定性主要是通过使用机器学习算法(58%)来研究的,例如随机森林模型和贝叶斯网络模型。利用大数据和机器学习来解决第三个涉及态系统服务的生物物理和社会制图困难的空缺分别为48%和40%。
3. 最常用的机器学习算法是随机森林(24%),其次是贝叶斯网络(14%)。用于实现 ML 的最常见软件是 R (36%),最常使用的是随机森林包,同时也使用各种其他工具包包括“caret”。
4. 评价文化生态系统服务功能的论文主要集中在填补数据可用性空白(约53%的论文填补了数据空白)和社会生态空白(约61%)。大多数研究评估了文化生态系统服务(32%),研究最多的文化服务类型是娱乐服务。调节服务是使用大数据和 ML (26%)的 研究次多的服务类型。
4
讨论
1. 数据可用性和不确定性空缺
大多数研究涉及数据的可用性以及模型和输出的不确定性这个研究空缺类型。数据可用性空缺通常是使用大数据(54%)来填补的,但是 ML 在填补这个空缺(36%)方面也发挥了相当大的作用。这是因为多种机器学习算法,特别是贝叶斯网络,可以有效地在数据稀疏的环境中量化构建生态系统服务及其相关动态。
许多机器学习算法,特别是随机森林和贝叶斯网络模型,能自动提供不确定性的估计,并可以提高模型预测的准确性。此外,ML 增加了可以评估的样本量,这可以帮助减轻模型的不确定性。
2. 社会—生态空缺
考虑到生态系统服务领域是一个相对较新的领域,大多数科学家利用代用数据或专家知识建立服务模型和绘制服务图,依靠社会-生态关系非线性动态的线性假设。大数据(48%)和机器学习(40%)相对平等地解决了生态系统服务的生物物理和社会方面之间的差距,尽管大数据的贡献略多一些。
新的大数据资源可以通过衡量人们的社会行为和偏好,并提高我们对不同地貌范围内生态系统服务的生物物理供应和社会需求之间相互作用的理解,解决第三个差距。
3. 解决生态系统服务空缺的模式
具体使用哪个模式来根据文章评估的服务类型不同有很大变化。传统上,与其他服务类别相比,文化生态系统服务是被制图研究最少、最不足的,这主要是由于有限的数据很难有效解释和捕获这些服务。因为文化服务依赖于的社会和生物物理因素具有主观和无形的特征。分析发现,在文化生态系统服务研究中,有38% 的研究是解决如何连接社会与自然系统的研究空缺,同时有36%研究是着眼于解决数据可用性空缺。最近,随着众包数据的出现,通过各种来源的地理众包数据对文化服务进行建模的情况有所增加。
针对多种生态系统服务的研究往往侧重于解决不确定性空缺,并经常利用基于决策树的机器学习算法,如随机森林、条件推理树和回归树(CART) ,使用评估多种不同服务类别所需的非统一和多方面变量执行分类和回归任务。
4. 解决空缺的技术及文本局限性
不同的机器学习算法有不同的优点和缺点,因此在生态系统服务研究中被用于多种目标场景。几乎所有使用机器学习算法的研究都选择使用监督算法,如随机森林,贝叶斯网络和 Maxent,特别是用于回归和分类任务。
虽然大数据和机器学习为未来的生态系统服务研究提供了机会,但与任何其他数据源或方法一样,也存在局限性。机器学习的使用以及大数据的收集和使用可能需要大量的资源,无论是培训、互联网、软件,还是其他计算或技术资源。在大多数情况下,这些资源已经到位,但只在世界某些地区。例如,本综述中的大多数研究来自中国和西欧,因此建议其他地区需要增加对方面资源的访问和基础设施建设。
5
个人思考
本研究通过收集文献,综述了目前使用机器学习和大数据来解决生态系统服务领域的三个研究空缺的前景。展示机器学习和大数据在生态系统服务研究中的用途,建模和绘制生态系统服务帮助我们减轻、适应和管理这些压力方面的作用。
机器学习和大数据是有用的工具,可以帮助解决生态系统服务研究中的数据可用性、不确定性和连接社会生态。利用大数据和机器学习,在缺乏对生态系统服务的一般和具体研究的区域内改进相关的计算、数据和其他资源以及专门知识,可有助于填补当前知识的空白。
编者声明:本推送内容仅代表编者对于文章的理解,请有兴趣的同学阅读原文,也请各位专家、同学批评指正。
原文出处:
Manley K, Nyelele C, Egoh B N. A review of machine learning and big data applications in addressing ecosystem service research gaps. Ecosystem Services,57,101478.
转自:“经管学术联盟”微信公众号
如有侵权,请联系本站删除!