国家级基础地理实体构建技术的设计与实践
郑义,田海波,张元杰,李雪梅
(国家基础地理信息中心,北京 100830)
摘要:
针对传统测绘生产的矢量要素数据是以二维的形式,对现实世界的数字化抽象表达,难以完全满足在三维数字空间中分析、计算与使用的实际需要问题,该文以我国1:50 000基础地理信息要素数据为主要数据源,研究设计国家级基础地理实体数据构建的生产流程与关键技术,并结合工程实践,详细阐述了地理实体数据转换重构、语义信息补充完善、实体语义关系构建等关键技术的实现过程。形成了一套切实可行的构建地理实体的工艺流程,较好地发挥了地理实体在信息承载、表达、共享和关联等方面的优势。首批国家级基础地理实体数据产品表明,该文阐述的生产流程可以快速有效构建地理实体数据,可为国省市多尺度地理实体的衔接整合提供数据和技术支持。
0 引言
地理实体是人类为了描述和表达地理世界中具有特定空间范围、形态、过程、关系和相关属性地理现象的实体化抽象,其独特的数据形式,以及能够有效承载其他专业信息的特性,使其具有与政府各部门信息进行整合与共享交换的潜力。基础地理实体是指在基础测绘的职责范畴内,所描述和表达的地理实体,是其他地理实体和相关信息的定位框架与承载基础[1]。
国际上一些发达国家很早就开展了基础地理信息数据的实体化整合处理,形成便于与专题信息挂接的公共地理框架数据,可以算是基础地理实体的雏形[2]。美国政府1994年颁布了12906号行政令,要求建立国家空间数据基础设施(NSDI),发布的“地理信息框架数据内容系列标准”,对地籍、行政管理单元、水系、交通、数字正射影像、高程、大地控制等7类框架数据作了规定,其中前4类均采用面向实体的数据模型[3]。欧洲议会2007年通过了建设欧盟空间信息基础设施(INSPIRE)的决议。目前INSPIRE已经推出了一系列数据规范。与FGDC的框架数据规范类似,这些数据也尽可能地采用面向实体的数据模型[4]。英国军械测量局于2000年开始实施“数字国家框架”计划,构建新一代的数据产品MasterMap。其中对所有面状图元赋予唯一且永不变更的标志码TOID,通过TOID组合相关图元,实现对地理实体的标识[5]。
近年来,面向数字中国建设、国土空间治理现代化等新的发展形势和战略需求,国内也开展了诸多地理实体相关基础理论研究和应用探索,例如:文献[6]从地理视角描述地理实体,把地理实体分为现状地理实体、规划地理实体、建设地理实体和管理地理实体,提出了从部门应用的角度对地理实体进行粒度分割。浙江省提出了利用地理实体编码实现多尺度表达空间数据的联动更新[7]。江苏省对所有地理实体和兴趣点信息进行了统一的分类编码,探索以地理实体概念来描述和表达基础地理信息[8]。武汉市作为先期试点城市把地理实体产品和地理场景产品设计为新型基础测绘产品,对城市基础地理信息数据库进行升级改造[9]。上海市结合超大型城市治理和自然资源管理对地理信息的新需求,基于地理实体建设新型基础地理信息时空数据库[10]。
国内外现有的地理实体研究和探索主要局限于部分类型的地类或局部大比例尺区域,而国家级基础地理实体数据的内容、模型结构,以及侧重宏观层面的应用需求等,与现有相关研究存在较大差异,迫切需要开展国家级基础地理实体数据构建的技术设计[11]。本文主要基于我国已有的1:50 000基础地理要素数据,结合数字正射影像(DOM)、数字高程模型(DEM)和相关专题资料,依托自动化转换重构、语义信息补充完善、实体语义关系构建等技术,构建国家级基础地理实体数据产品,为全国范围内统一规范的数据联动更新和综合信息挖掘提供基础[12]。
1 总体技术思路
按照“利用存量、引入增量”的总体思路[13],充分利用已有基础测绘成果,按需补充完善相关数据内容,开展国家级基础地理实体数据的构建。总体技术思路如图1所示。
1)应转尽转。对于1:50 000基础地理信息要素数据中具有实体意义的地理信息要素构建实体数据,不具有实体意义的仍以要素的形式作为制图辅助信息保存,确保1:50 000基础地理信息要素数据中的内容完整保留,同时可用于实现基于基础地理实体数据的制图表达。
2)无缝衔接。考虑到1:50 000基础地理信息要素数据与基础地理实体数据在一段时间内将并行存在,且1:50 000基础地理信息要素数据在持续更新,通过要素唯一编码(FEAID值)建立1:50 000基础地理信息要素数据与基础地理实体数据之间的一一对应关系,保证后续能够利用更新后的1:50 000基础地理信息要素数据快速联动更新基础地理实体数据。
3)多粒度表达。利用1:50 000基础地理信息要素数据转换生成的具有实体意义的最小粒度单元,作为国家层面基础粒度的实体数据,例如路段、河段等。同时,根据宏观层面应用需要,组合部分基础实体数据,形成更大粒度的组合实体数据。
4)构建实体语义关系。基于知识图谱,构建基础地理实体数据的实体语义关系,实现基础地理实体数据人机兼容理解、分析应用更快捷的目的,对于专业应用,可在此基础上扩展基础地理实体与专业实体之间的语义关系,满足行业部门应用[14]。
2 主要技术流程
采用1:50 000基础地理信息要素数据,对具有地理实体意义的要素进行实体化转换重构,包括资料收集与分析、数据转换、地理实体编码、实体关系构建等,最终形成基础地理实体数据成果,总体流程如图2所示。
1)资料收集与分析。收集、整理1:50 000基础地理信息要素数据、DOM、DEM、其他自然资源调查监测数据以及相关专题数据等,并分析各类数据的质量、现势性、可用性等。其中,1:50 000基础地理信息要素数据是构建国家级基础地理实体数据的主要数据源,数据覆盖全国陆地国土及主要岛屿,涉及9大类,470余个子类要素,包括34个数据层。
2)数据转换。主要包括3个步骤:建立基础地理实体数据层及属性字段;制作地理信息要素与基础地理实体映射表;按照映射关系统一将要素数据转换为基础地理实体数据。
3)语义信息补充与完善。利用DOM、DEM和专题资料等数据通过标识信息关联、空间位置匹配和语义融合等方式,对地理实体的语义信息进行补充和完善。
4)地理实体编码。包括基础地理实体的分类代码、空间位置编码和实体唯一标识码。其中分类编码用来标识地理实体的类别信息,空间位置编码用来描述地理实体的空间位置,实体唯一标识码用来对实体进行区分和识别,并通过地理实体唯一标识码实现地理实体与相关社会经济、自然资源信息的挂接[15]。
5)实体语义关系构建。基于地理实体数据,结合影像和其他参考资料,构建实体语义关系,主要包括组合实体组成关系以及组合实体、实体关联关系。
3 关键技术
3.1实体数据转换与重构技术
1)国家级基础地理实体数据模型构建
创建国家级基础地理实体数据模板,用于存储转换后的实体数据、组合实体数据和制图辅助要素。图层和属性信息应满足基础地理实体数据的要求以保证转换后数据存储的规范性。实体数据集的属性字段由基本属性字段和专有属性字段构成,制图辅助要素数据集的属性字段与1:50 000基础地理信息要素数据字段属性结构和空间表达内容保持一致。
2)地理信息要素与基础地理实体映射
将1:50 000基础地理信息要素数据中具有地理实体意义的要素对应地转换为自然地理实体、人工地理实体和管理地理实体,其他要素作为制图辅助要素保留,不做实体化转换。根据国家级基础地理实体转换内容,制作地理信息要素与基础地理实体映射表和地理信息要素与制图辅助要素映射表,规范数据转换过程中地理信息要素的图形、属性信息与基础地理实体的对应关系。
3)实体数据自动化转换重构
依据基础地理实体数据层和属性要求、地理信息要素与基础地理实体映射表开展自动化转换重构工作。基于已创建的地理信息要素与基础地理实体映射表和地理要素与制图辅助要素映射表,将1:50 000基础地理信息要素数据中需要进行实体化的要素转换至实体数据集中,同时将制图辅助要素转换至制图辅助要素数据集中。
3.2语义信息补充完善技术
1)基于标识信息关联获取语义信息
通过实体名称、行业代码等唯一标识信息,将地理实体数据与专题资料进行匹配,建立基础地理实体与专题资料数据(如路网、水网等数据)之间的映射关系。依据数据间的映射关系,将专题资料数据中蕴含的属性,对地理实体的语义信息进行补充完善。
2)基于空间位置关联获取语义信息
将地理实体数据与参考资料的空间坐标系进行统一。根据匹配的空间位置信息,建立地理实体与参考资料数据之间的映射关系。依据数据间的映射关系,将参考资料数据中蕴含的属性,对地理实体的语义信息进行补充和完善[16]。
将地理实体数据与参考数据中的同类数据进行语义融合。如水系实体“河流”与参考资料分类“河流水面”指代同一类地理对象,若两类数据中某个河流对象具有相同的空间位置信息,则此两类数据表达的地理对象为同一条河流,可进行语义融合。将经过语义融合的参考资料数据中蕴含的属性,对地理实体的语义信息进行补充和完善。
3.3基于知识图谱的实体语义关系构建技术
实体语义关系类型主要包括实体组成关系和实体关联关系。实体组成关系是存储组合实体与该实体组成部分之间的关系。实体关联关系是存储实体之间的归属、附属、相邻、连接、途经、流经、汇入等各类关系。实体关系按照不同类别(分类编码顺序)有序梳理,所有存在关系的两个实体之间,相同的关系只记录一次。实体关系使用关系表的形式进行记录,以“三元组”形式进行规范化表达。国家级基础地理实体重点对水系、海洋、交通、政区等开展实体语义关系构建,语义关系见图3~图6。
4 工程实践
2022年,开展了国家级基础地理实体数据试生产。数据覆盖黄河流域的青海和甘肃部分区域,共计约20.2万平方千米。
国家级基础地理实体数据成果主要包括水系、居民地及设施、交通、管线、境界与政区、自然地貌和人工地貌、部分植被与土质等地理实体类型。其成果规格及指标如表5所示。
表5 国家级基础地理实体成果规格及指标
5 结束语
国家级基础地理实体数据构建是以我国1:50 000基础地理信息要素为主要数据源,利用自动化转换重构、语义信息补充完善、实体语义关系构建等技术,生产全国范围内统一标准规范的基础地理实体产品,是对已有国家级基础地理信息数据的创新利用,也是实现测绘产品从传统的要素数据向实体数据转换升级的重要实践。国家级基础地理实体数据构建是实景三维中国建设的一项重要任务,也是未来开展国省市多尺度地理实体衔接整合工作的重要基础。 (原文有删减)
作者简介:郑义(1986—),男,湖北仙桃人,高级工程师,博士,主要研究方向为地理时空信息处理。
E-mail:619318155@qq.com
引用格式:郑义,田海波,张元杰,等. 国家级基础地理实体构建技术的设计与实践 [J]. 测绘科学,2023,48(3):25-29。
转自:“测绘学术资讯”微信公众号
如有侵权,请联系本站删除!