Zhang, Y., Zhou, Q., Brovelli, M. A., and Li, W., (2022). Assessing OSM building completeness using population data. International Journal of Geographical Information Science, 36(7), 1443-1466.
作者简介:
张宇恒:硕士研究生,中国地质大学(武汉)地理与信息工程学院。
周琪:博士,中国地质大学(武汉)地理与信息工程学院副教授,博士生导师。主要从事全球开放空间数据的质量评价、数据挖掘与分析,支撑联合国2030年全球可持续发展目标评估、国土空间规划等应用领域。(联系方式:zhouqi@cug.edu.cn)
Maria Antonia Brovelli:博士,米兰理工大学教授。主要从事开源地理信息系统、公众科学和地理大数据等方面的研究。
李宛静:硕士研究生,中国地质大学(武汉)地理与信息工程学院。
亮点
(1)提出基于人口数据作为参考建筑数据的“代理”,评估OSM建筑数据完整性的方法。
(2)比较了两种评估方法和基于三种不同分辨率人口数据集的评估效果。
1
概述
OpenStreetMap(OSM)数据是获取建筑数据的重要来源,由全球志愿者提供,因此不可避免地存在数据质量问题。现有研究主要通过对比参考数据来评估OSM数据质量,但是参考(建筑)数据通常不易获取。因此,本研究提出以全球开放获取的人口格网数据作为参考建筑数据的“代理”,评估OSM建筑数据完整性的两种方法(即类型法和回归法)。本文比较了这两种方法,以及基于三种空间分辨率(1公里、100米和30米)的全球人口数据集评估OSM建筑数据完整性的效果,并选取了不同国家的四个研究区域进行验证。
2
评估方法
提出两种方法,即类型法和回归法。方法原理如图1所示。
图1 方法原理图
2.1 类型法
首先,叠加OSM建筑数据和人口格网数据;然后,统计每个格网内的OSM建筑数量和人口数量,并划分为以下四种类型之一。
● 类型 I:无建筑且无人口;
● 类型 II:无建筑但有人口;
● 类型 III:有建筑但无人口;
● 类型 IV:有建筑且有人口。
其中,类型II的格网视作缺少OSM建筑数据。
2.2 回归法
预先确定人口数量与参考建筑数量之间的定量关系。例如,由图1c和1e可知,人口数量约是参考建筑数量的四倍,因此建立定量关系:y=1/4 x。然后,基于该定量关系,估计其它地区OSM建筑数据的完整性。
3
方法验证
3.1 类型法的验证
类似地,根据人口数量和参考建筑数量,确定每个格网的类型。
● 类型 I':无人口且无参考建筑;
● 类型 II':有人口但无参考建筑;
● 类型 III':无人口但有参考建筑;
● 类型 IV':有人口且有参考建筑。
然后,统计混淆矩阵,并计算总体精度(OA)、生产者精度(PA)和用户精度(UA)等指标评估该方法的有效性。
3.2 回归法的验证
建立人口数量与参考建筑数量的线性回归模型,并依据斜率和拟合优度(R2)评估该方法的有效性。
4
实验与结果
选取了英国和新西兰的四个研究区域进行实验分析。实验数据包括:
(1)OSM建筑数据。获取于http://download.geofabrik.de/index.html平台;
(2)参考建筑数据。获取于英国地形测量局(Ordnance Survey)和新西兰土地局;
(3)人口格网数据。1公里和100米空间分辨率人口数据获取于WorldPop;30米空间分辨率人口数据获取于高分辨率人口居住层(HRSL,2015年)。
4.1 类型法的评估结果
图2 类型法的评估结果(混淆矩阵)
图3 类型法的评估结果 [四种类型(I',II',III',IV')的可视化]
由图2和图3可知,大多数格网被划分为类型 I' 或类型 IV',表明基于人口数据评估OSM建筑数据完整性的结果正确。基于1公里和100米分辨率人口数据评估的总体精度(OA)普遍高于80%,表明结果更优。
4.2 回归法的评估结果
图4 回归法的评估结果(散点图)
由图4可知,人口数量与参考建筑数量高度相关,表明人口数量可以作为参考建筑数据的“代理”。多数情况下,基于1公里人口格网数据分析的相关性结果(R2介于0.62到0.91之间)高于基于100米和30米人口格网数据的分析结果(R2介于0.11到0.77之间)。此外,回归模型的斜率可能随研究地区不同而变化。因此,相较于回归法,类型法的普适性更好。
5
结论
(1)验证了以人口数据作为参考建筑数据的“代理”,评估OSM建筑数据完整性的效果。
(2)类型法的普适性更好;基于WorldPop(1公里和100米空间分辨率)人口格网数据的评估效果更好。
该研究成果解决了因缺少参考建筑数据而无法评估众源建筑数据质量(完整性)的不足。该方法将进一步应用于分析全球OSM建筑数据质量。
来源:高性能空间计算智能实验室
转自:“测绘学术资讯”微信公众号
如有侵权,请联系本站删除!