投稿问答最小化  关闭

万维书刊APP下载

北京市人口密度制图,基于Landsat影像和统计数据

2022/12/26 16:29:52  阅读:264 发布者:

基于Landsat影像和统计数据的北京市人口密度制图

段艳慧 赵学胜 张晓莹 张冰瑞

(中国矿业大学(北京) 地球科学与测绘工程学院, 北京 100083)

[摘 要] 人口空间密度数据对于各国家和地区制定发展规划和方针政策具有重要的参考意义,中国人口数据每十年普查一次,耗时耗力且缺乏空间信息。因此,本文通过建立行政区人口密度与不透水面密度之间的关系模型,并结合开源地图(OSM)数据,提出建立30 m像元尺度的人口密度空间分布方法。结果表明,北京市30 m像元最大人口可达36,均值为12,通过对比Worldpop人口密度数据,人口密度在30 m像元尺度上的空间细节信息较行政区尺度有明显的提升,该成果可用于快速获得城市人口空间分布数据,为城市管理和规划人员提供数据参考。

0 引言

人口数据是最为重要的基础地理数据之一,对于国家和地区的相关情况调查、人口状况、管理以及制定各项方针政策等都具有重要的意义,而精细化的人口分布是当前人口地理学研究的热点和难点[1]。人口分布分散,具有动态特征,不同的人口密度对自然资源和环境条件的影响也不同,因此,为了更好地应对我国城镇化发展所面临的各种环境与资源问题,有必要及时、快速地生成人口密度空间分布结果。传统的人口密度计算方法是根据人口普查数据进行计算,但计算时间长、成本高、更新困难[2]。此外,用于公共用途的人口普查数据难以准确、真实地反映人口在空间上的分布规律,中国的县级人口普查数据对于城市规划和管理等方面来说不够细致[3],难以满足城市规划和发展的需要。

在过去的几十年里,许多学者探究了利用不同的遥感和辅助数据估算人口的方法[4-8]。这些研究多针对现有的土地利用数据,而并非所有土地利用类型均有人口分布,例如,水体、耕地、森林等。在土地利用数据中,不透水面(impervious surface area, ISA)是城市中人类活动的主要场所,研究表明,利用ISA可以进行人口估计[9-10]。同时,利用Landsat影像可以准确地估计ISA[11-12]。而由于县级尺度的人口普查数据过于粗糙,需要像元尺度的更详细的人口密度数据。但在小尺度上进行的研究很少,在小尺度上快速而准确地估计人口密度的过程尚不为人知。目前尚缺乏绘制人口密度分布图的合适技术或方法。因此,本文试图通过区()尺度上的人口密度与遥感影像获取的ISA数据之间的关系来绘制30 m像元尺度上的人口密度分布图。

1 研究区和研究数据

1.1 研究区概况

本文选取北京市为研究区,开展基于Landsat遥感影像的人口密度研究。北京(Beijing)位于中国华北平原北部,背靠燕山,毗邻天津市和河北省,是中华人民共和国首都、直辖市、国家中心城市、超大城市,全国政治中心、文化中心、国际交往中心、科技创新中心。北京位于115.7 °~117.4 °E,39.4 °~41.6 °N。截至2020,全市下辖16个区,总面积16 410.54 km2,常住人口2 189.31万人。北京市经济发展水平较高,人口较为集中分布,路网分布密集,是城市化发展高水平的代表城市之一[13]

1.2 研究数据

本研究采用美国陆地卫星计划(Landsat)的第八颗卫星(Landsat8)、开源地图(open street mapOSM)、可见光红外成像辐射仪(visible infrared imaging radiometerVIIRS)-日夜波段(day/night bandDNB)夜间灯光数据、第七次人口普查数据(含乡镇街道级别)Worldpop数据以及行政边界数据。由于使用的数据源不同,因此,首先要对所有的数据进行重投影以保持各数据之间的一致性。采用线性光谱混合分析法(linear spectral mixture analysis,LSMA)[14]Landsat8影像进行处理绘制北京市ISA分布。Worldpop数据作为已有人口密度数据用来对本文方法所作结果进行对比分析。

人口普查数据来自北京市第七次全国人口普查公报(第二号)(北京市统计局)[15]。全市16个区中,常住人口在200万人以上的区有4,分别是朝阳区、海淀区、昌平区和丰台区;100万人~200万人之间的区有5,分别是大兴区、通州区、顺义区、房山区和西城区;100万人以下的区有7,分别是东城区、石景山区、密云区、平谷区、怀柔区、门头沟区和延庆区。

2 研究方法

利用Landsat8影像与北京市2020年人口普查数据绘制人口密度的基本流程如图1所示。

注:①迭代自组织数据分析算法(iterative selforganizing data analysisISODATA)

1 基于Landsat8与普查数据的人口密度流程图

2.1 利用Landsat8影像绘制ISA分布并评定精度

为了使用LSMA方法有效地处理图像,选择合适的端元是至关重要的[16]。由于影像345波段基本涵盖所有的地类信息,所以在从Landsat多光谱波段提取3个组分的散点图时,从中选择3个具有代表性的端元高反照率目标、低反照率目标和植被。然后利用混合像元分解的方法将Landsat8多光谱图像分解为三分体图像。

由于ISA主要存在于高反照率目标和低反照率目标的图像中,因此,去除该图像中的非不透水面区域至关重要。以往的研究表明,归一化水体指数(normalized difference water index, NDWI)在从其他土地覆盖类型中分离出水体是有效的[17-19],因此,可以利用归一化水体指数来去除水体。由于初步ISA结果可能与其他土地覆盖类型相混淆,因此除水体外,需要进行图像后处理来进一步去除图像中的非不透水面区域。

利用谷歌地球的高空间分辨率图像对提取的ISA进行精度验证[20],采用随机抽样的方法选择验证样本,共选取600个样本,其中包含400个非ISA样本和200ISA样本。采用误差矩阵来评估ISA精度,从误差矩阵中计算生产者精度、用户精度和总体精度。

2.2 提取居民区ISA

由于在城市的发展建设中,道路、广场、停车场、机场等地越来越发达,此类设施属于不透水面但并非居住区,因此,为了更加准确地对人口进行估计,需剔除不透水面中的非居民居住区域。OSM旨在为用户提供免费且易于访问的数字地图资源,是现阶段最受欢迎的自发地理信息数据,这类数据与传统的地理空间数据相比,具有丰富、实时、更新速度快等优势[21]。因此,本文利用OSM数据对非居民区进行剔除。

2.3 在行政区划尺度上绘制人口密度并验证

人口密度(/km2)ISA密度在区划尺度上按行政单位计算。选取16个行政区的人口密度数据作为因变量,相应的ISA密度数据作为自变量。对线性和非线性回归模型进行了探讨。利用决定系数(R2)确定行政区尺度上人口密度估计的最佳估计模型。

2020年人口普查数据中可得北京市街道级别的人口数,北京市共有337个街道,随机抽取200个街道进行验证并绘制残差图像。

2.4 绘制30 m像元大小的人口密度分布

区尺度的人口密度分布只是行政单位的平均值,没有考虑不同的土地利用/覆盖类型;因此,这种分布不能准确地表示人口密度分布的空间格局。我们可以假设人口只分布在ISA存在的地方,而没有人口出现在其他土地使用类型,如森林、农业用地和水体等。因此,像元大小处的人口密度可以表示为

(1)

其中,Dpp为像元处的人口密度;Dpa为行政区的人口密度;Aa为行政区面积;fi为像元处的不透水面值;n为该行政区内的ISA像元个数,ISA的像元值为0

3 结果与分析

3.1 ISA精度

要建立基于ISA的人口密度估计模型,关键的一步是对ISA数据进行准确地提取。对ISA的精度评估结果如表1所示,北京市ISA精度的生产者精度和用户精度分别为90.05%86%,总体精度为92.17%。该研究进一步证实了基于LSMA的方法可以有效地从landsat8影像中提取ISA

1 ISA精度评定结果

3.2 行政区尺度人口密度分布

北京市下辖16,总面积为16 410.54 km2,根据2020年全国第七次人口普查数据,北京市总人口为21 893 095人。北京市行政区划人口密度为行政区总人数除以行政区面积,结果如图2所示,可以看出北京市中心城区的人口密度大,围绕中心呈发散状,距离中心城区越远,人口密度越小,西部和北部多为山区,人口密度最小。但由于该方法所得单位面积人口呈均匀分布,在山体、水体或森林等无人居住的地区也存在人口分布情况,因此,需要基于不透水面的像元尺度的人口密度图来解决这一问题。

2 北京市行政区人口密度

[审图号:GS(2019)3333]

3.3 ISA密度与人口密度间模型建立与验证

3.3.1 30 m像元的人口密度模型建立

由于行政区人口密度并未考虑人口与ISA之间的关系,为了进行更小尺度的人口密度图绘制,需要建立人口与ISA之间关系的模型。将人口密度与ISA密度之间进行线性和非线性回归分析。图3展示了人口密度与ISA密度的散点图,表明它们之间的关系可以用指数式(2)表示。

(2)

其中,Dp为人口密度;DiISA密度。决定系数R2=0.941 4,表明在行政区尺度上人口密度估计效果较好。

3 人口密度与不透水面密度关系

利用模型反算行政区划人口密度,并根据式(2)进行30 m像元大小的人口密度的计算,结果如图4(b)所示,4(a)为基于原始ISA生成的人口密度,可以看出,剔除掉非居民区后的人口密度较之前的图像降低了人口密度低估的问题,更加贴近实际情况。图5为北京市Worldpop人口密度数据,放大后可以看出,其人口分布沿道路扩散,且道路上人口密度最大,而道路明显不属于居民地,6则为最终北京市30 m像元人口密度及局部放大图,相比目前已有的Worldpop人口密度数据更加精确和细致。其中,核心城区(东、西城区)91%的人口分布在20人以上的像元中,最大可达每像元36,而密云、怀柔、门头沟和延庆地区每像元的人口均低于20人。该结果与行政区人口密度结果大体相似,依然显示北京市中心城区人口密度大,西、北部山区地区人口密度小。但相比行政区尺度的人口密度图,该图可以显示更多的空间细节,而且弥补了人口出现在无人居住区的不足,更加符合实际人口居住情况。

(a)原始ISA生成的人口密度

(b)居民区ISA生成的人口密度

4 基于原始ISA与居民地ISA30 m人口密度图

[审图号:GS(2019)3333]

5 北京市Worldpop人口密度数据

[审图号:GS(2019)3333]

6 北京市30 m像元人口密度图

[审图号:GS(2019)3333]

3.3.2 30 m像元的人口密度模型验证

建立人口密度与ISA密度之间的模型后,需验证该模型是否可用。利用北京市第七次人口普查乡镇街道级数据对该模型进行验证,得出估计人口与参考人口之间的关系如图7所示,表明了良好的线性关系,说明所建立的人口密度与ISA密度之间的模型可用。估计人口残差如图8所示。

7 估计人口与参考人口关系

8 估计人口残差

4 结束语

本研究基于北京市行政区人口密度与不透水面密度数据之间的关系,30 m像元尺度上的人口密度分布图提供了一种新的方法,首先,利用Landsat8遥感影像提取北京市不透水面并验证其精度。其次,建立行政区人口密度与不透水面密度之间的关系。最后,假设人口只存在于不透水面地区,并用OSM数据剔除道路、停车场等非居民区,将人口数据反算到30 m像元尺度,实现人口密度空间化制图。该方法为人口密度分布的空间格局提供了丰富的信息,具有利用遥感数据快速更新人口密度的潜力,对没有普查数据的发展中国家尤其有价值。但在实际发展中,建筑高度是影响人口密度估算的一个重要因素,因此,需要进行更多的研究,将土地利用类型和建筑物高度纳入遥感数据,以便建立更为完善的人口密度估计模型。

参考文献

[1] 柏中强,王卷乐,杨雅萍,.基于乡镇尺度的中国25省区人口分布特征及影响因素[J].地理学报,2015,70(8):1229-1242.

[2] 刘耀林,方飞国,王一恒.基于手机数据的城市内部就业人口流动特征及形成机制分析——以武汉市为例[J].武汉大学学报(信息科学版),2018,43(12):2212-2224.

[3] LIL W, LU D S. Mapping population density distribution at multiple scales in Zhejiang Province using Landsat Thematic Mapper and census data[J]. International Journal of Remote Sensing, 2016, 37(18):4243-4260.

[4] 郭雨臣,黄金川,林浩曦.多源数据融合的中国人口数据空间化研究[J].遥感技术与应用,2020,35(1):219-232.

[5] 王珂靖,蔡红艳,杨小唤,.基于城镇居民用地再分类的人口数据空间化方法研究——以长江中游4省为例[J].遥感技术与应用,2015,30(5):987-995.

[6] 吴献文,速云中,孙照辉.夜间灯光数据支持下的广州市人口空间化[J].测绘通报,2021(5) :59-62.

[7] 黄金侠,李德平,周亮,.基于多源数据的人口空间化多方法对比研究[J].测绘与空间地理信息,2020,43(12):58-62.

[8] 王雪梅,李新,马明国.基于遥感和GIS的人口数据空间化研究进展及案例分析[J].遥感技术与应用,2004(5):320-327.

[9] DEREK A, JORDAN G, RYAN E, et al. Spatial refinement of census population distribution using remotely sensed estimates of impervious surfaces in Haiti[J]. International Journal of Remote Sensing, 2010, 31(21):5635-5655.

[10] LUD S, WENG Q H, LI G Y. Residential population estimation using a remote sensing derived impervious surface approach[J]. International Journal of Remote Sensing, 2006, 27(16):3553-3570.

[11] GEORGE X, HUA S, JON D, et al. Performances of WorldView 3, Sentinel 2, and Landsat 8 data in mapping impervious surface[J]. Remote Sensing Applications: Society and Environment, 2019, 15(C):100246-100246.

[12] SUN Z C, WANG C Z, GUO H D, et al. A Modified Norma-lized Difference Impervious Surface Index (MNDISI) for Automatic Urban Mapping from Landsat Imagery[J]. Remote Sen-sing, 2017, 9(9):942-942.

[13] 李子彪,李叶,孙可远. 京津冀协同发展规划建设进程及成效的统计监测[J].统计与管理, 2019(7):16-43.

[14] 徐涵秋,王美雅.地表不透水面信息遥感的主要方法分析[J].遥感学报,2016,20(5):1270-1289.

[15] 北京市统计局. 北京市第七次全国人口普查领导小组办公室. 北京市第七次全国人口普查公报~([1])(第二号)[N]. 北京日报,2021-05-20(004).

[16] 李涵. 徐州市区不透水面时空演变及其热环境效应研究[D].徐州:中国矿业大学,2020.

[17] 李志红,李旺平,王玉,.基于离散粒子群算法的2种新型水体提取方法的对比与验证[J].地球信息科学学报,2021,23(6):1106-1117.

[18] 席瑞. 基于长时间序列Landsat卫星影像的泰国呵叻高原土地利用/土地覆被变化遥感监测研究[D].杭州:杭州师范大学,2020.

[19] 苏龙飞,李振轩,高飞,.遥感影像水体提取研究综述[J].国土资源遥感,2021,33(01):9-19.

[20] GUO W, ZHAO C W, ZHANG Y H, et al. Mapping imper-vious surface distribution and dynamics in an Arid/Semiarid Area-A case study in Ordos, China[J]. IEEE ACCESS, 2021(9):19659-19673.

[21] 王明,李清泉,胡庆武,.面向众源开放街道地图空间数据的质量评价方法[J].武汉大学学报(信息科学版), 2013, 38(12):1490-1494.

引文格式: 段艳慧,郭伟,赵学胜,.基于Landsat影像和统计数据的北京市人口密度制图[J].北京测绘,2022,36(8):1096-1101.

基金项目:国家自然科学基金(41930650)

作者简介:段艳慧(1997),,河南鹿邑人,硕士在读,从事人口数据空间化方面的研究工作。

E-mail:gyxdyh123@163.com

通信作者:郭伟,E-mail:weiguo@cumtb.edu.cn

转自:“测绘学术资讯”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com