基础地理实体关系设计与试验
刘晰,耿丽丽,刘建川,廖一铧
(自然资源部 四川基础地理信息中心, 成都 610093)
摘要:
针对目前基础地理实体关系难以构建和使用复杂等问题,通过分析已有实体关系类型,归并、化简、重新分类已有实体关系类型;设计实体关系一体化存储模型,并梳理出所有基础地理实体分类中存在的基础关系;通过编制实体关系构建表和实体关系构建批处理程序,实现了基础地理实体关系的快速批量构建,验证了实体关系的使用效果。试验结果表明,该文提出的实体关系技术方法,便于实体数据关系的构建,在数据应用中也较为方便,在新型基础测绘和实景三维建设中,具有一定的参考和推广使用价值。
0 引言
实景三维是对一定范围内人类生产、生活和生态空间进行真实、立体、时序化反映和表达的数字空间,是新型基础测绘的标准化产品,是国家重要的新型基础设施,为经济社会发展和各部门信息化提供统一的空间基底。按照表达内容和层级通常分为地形级、城市级和部件级。实景三维中国由地理场景数据、地理实体数据、在线系统与支撑环境3个部分构成[1-2]。
地理实体(geo-entity),是现实世界中占据一定且连续空间位置和范围、单独具有同一属性或完整功能的地理对象。基础地理实体(fundamental geo-entity),是通过基础测绘采集和表达的地理实体,是其他地理实体和相关信息的定位框架与承载基础。语义化(semantic processing),是用标准化范式对地理实体自身属性及实体间关系进行一致性描述,以实现计算机可识别、可理解、可操作的过程[3-4]。
目前,根据自然资源部批复的新型基础测绘试点,武汉、西安、北京等地开展了部分区域实景三维建设工作,其中基础地理实体主要来源于已有大比例尺DLG转换。由于传统DLG数据侧重制图表达,缺乏实体间的关系信息,导致DLG数据在跨行业应用中存在业务挂接困难,数据按需抽取定制繁琐等问题。试点针对以上问题,梳理出了大比例尺数据中存在的复杂关系。由于各个地方对地理实体关系的概念理解、使用场景和数据质量存在较大差异,因此实体关系提取的准确率和效率较低、产生的成果形式各异,且需借助各种复杂的数据结构和专用软件,还缺少对省级以上大范围数据的指导。2022年2月,自然资源部印发了《关于全面推进实景三维中国建设的通知》。随后4月,编制了《基础地理实体语义化规定》,探索枚举出了可能广泛存在的各种实体关系。6月,启动了2022年实景三维中国建设前期工作,梳理出了部分国家级基础地理实体关系。因此,通过前期试点、2022年密集印发的技术文件和开展的技术试验,各方都在积极探索基础地理实体的构建方式,特别是体现地理实体语义化特征的实体关系。由于缺少成熟的经验,成果及规范存在矛盾和冲突,如何构建和使用地理实体关系,成为地理实体建设中的一个难点。
针对以上问题,本研究开展了基础地理实体关系的设计,进行了试验验证,通过提取基础地理实体中的共性关系,简化关系的存储结构,提出了一种可行的基础地理实体关系构建和使用方法,可为基础地理实体数据建设提供参考。
1 关系设计
基于国家级地理实体数据中定义的归属、附属、连接、汇入、相邻、途径、流经七种基本关系[5],以及水系(水利)、海洋、交通、行政区划单元实体定义的关系类型及关系信息,进一步梳理、分析并设计其他地理实体需要在构建中记录的关系类型和信息,同时与《基础地理实体语义化基本规定》[6]中规定的地理实体关系进行对比,找出异同,分析设计实体关系的完整性、合理性、冗余性,然后对设计的实体关系进行优化,并定义全部实体关系,建立全部地理实体类的关系结构表和关系构建规则,利用国家级地理实体数据开展试验,验证关系定义和关系结构设计的科学性、合理性、正确性和可操作性(图1)。
1.1 国家级地理实体数据中实体关系分析
国家基础地理实体数据目前主要来源于1:5万DLG转换获取,存在丰富的道路、河流、行政区划要素,而房屋、院落等要素综合尺度较大,自然地形要素缺失较多。因此,国家级基础地理实体数据中,主要围绕河流、道路、行政区划梳理实体关系,分为以下几类:记录道路、河流之间的连通关系,主要使用连接、汇入;记录道路、河流附属物和层级关系,主要使用附属、归属;记录道路、河流、行政区划之间的关系,主要使用途径、流经、相邻。
1)附属。附属是指一个地理实体作为设施服务于另一个地理实体,如三峡大坝附属三峡水库。主要记录水利附属设施与水系之间的关系、交通附属设施与交通之间的关系、建筑物附属设施与建筑物之间的关系等。
2)归属。归属是指一个地理实体完全位于另一地理实体的内部或是另一地理实体的组成部分,如永定河归属海河流域。主要记录山体、水系、冰雪、海洋、水利、行政区划单元类别内各实体间的关系等。
3)连接。连接是指空间形态呈线状的地理实体与另一个空间形态呈线状地理实体在空间上相连,如七星渠连接黄河。主要记录水系、交通类别中地理实体之间的关系。
4)汇入。汇入是指河流等地理实体中水流动到面状的水系地理实体(如湖泊、海洋等)中,如长江汇入东海。主要记录重要的水系之间的关系。
5)途经。途经是指铁路线路、公路等地理实体经过行政区划单元地理实体,如京广铁路途经北京市、河北省、河南省、湖北省、湖南省、广东省。主要记录交通线路与行政区划单元之间的关系。
6)流经。流经是指河流、沟渠地理实体流经过行政区划单元地理实体,如长江流经青海省、四川省、西藏自治区、云南省、重庆市、湖北省、湖南省、江西省、安徽省、江苏省和上海市。主要记录水系与行政区划单元之间的关系。
7)相邻。相邻是指一个地理实体与另一个地理实体在空间上邻接,如湖北省与湖南省相邻。主要记录行政区划单元之间的关系。
建立关联关系表(见表1),存储实体之间的关系。
表1 实体关联关系表示例
1.2 《基础地理实体语义化基本规定》中实体关系分析
《基础地理实体语义化基本规定》的实体关系主要参考大比例尺数据,存在的关系类型极多,在规定附录中列出了基础地理实体中可能存在的各种关系。实体关系梳理,主要来源于试点经验和理论研究,目前还处于探索阶段,后续还需进一步修订。
《基础地理实体语义化基本规定》的实体关系“三元组”描述规则为:“<实体,实体关系,实体>”。其中定性描述的“实体关系”如表2所示,描述集内容可依据实际需求进行扩充。定量描述的“实体关系”按照实际数值录入。
表2 基础地理实体关系描述表
1.3 实体关系对比归并
以上两类方案中的地理实体关系,针对数据内容尺度不同,实体关系的分类标准也不尽相同,而实景三维建设的目标要求,基础地理实体数据成果应该是国省市县上下贯通、联动使用的,这就需要归纳总结出一套具有共性的实体关系,在横向上能满足不同部门对最大公约数实体关系的需求,在纵向上能保持不同层级实体数据的一致,在关系构建、使用上尽量简便可行。本文认为实体关系应侧重补充表达原DLG数据中缺少的基础性、强关联的关系,而不是对GIS空间关系的重复,GIS空间关系应是获取实体关系的手段。同时,实体关系需要考虑辨析度,既不同类关系减少模糊区间交集,方便关系的清晰、准确构建。基于以上原则,采用实例分析归纳法,通过从地理实体关系的典型例子,将概念化的关系具体化,理解关系的实际意义,对比分析实体关系类型,归并共性关系。
国家级地理实体数据存在7类关系,《基础地理实体语义化基本规定》实际存在23类关系[7]。如表3实体关系示例所示,《基础地理实体语义化基本规定》中使用空间关系来表达国家基础地理实体数据中的归属关系,使用属于、空间属于、依赖等来表达实体间的附属关系,归属、附属在基本地理实体关系上区分度不大,本文综合为属于关系。连接、联通都属于连接关系,流入、流出是表达汇入、汇出关系,只用于水系间关系,水系实体中都带有流向,因此用连接关系就可以明确表达以上关系。流经、途径、穿越关系,通过记录实体的所属PAC(行政区划代码)即可满足。最后,相邻、空间距离、上下方位等关系,可通过实时计算获取,或根据具体行业需求再构建。
分析比较已有实体关系,基本实体存在属于、连接关系,分别用于描述块状实体聚合关系、狭长实体连通关系。山体、冰雪、海洋、建(构)筑物及场地设施、院落是典型的块状实体聚合,主要表达层级关系,因此使用属于关系较为合适,便于不动产、生态、城市管理等。水系、水利、交通、管线实体为典型的狭长实体,主要记录实体间的连接关系,同时存在较多的功能性附属物,附属物使用属于关系,便于交通、水利等部门使用。剩下实体都保留PAC,例如农林用地与土质、管理地理实体等,便于地理单元确权、行政管理使用。归纳本文实体关系如表3所示:
表3 基础地理实体关系对照表
1.4 实体关系存储方式设计
在原有实体数据成果结构基础上,修改图层属性结构[8],按如下规则记录实体间关系:
1)实体图层新增字段“PAC”,字符串类型,长度10。所有图元、实体记录政区PAC码,基本实体以县级政区划分并组织关系。
2)实体图层新增字段“REL”,字符串类型,长度8192。REL字段内容,由“关系类型,相关图层,相关实体ID”组成,存在多个关系使用“|”隔开。
3)子实体被父实体包含、或附属实体附属于主实体,使用属于关系,在子实体、附属实体属性中记录父实体、主实体ID。已通过PAC表达的不再重复构建属于关系。
4)低等级实体与高等级实体相接,使用连接关系,在低等级实体属性中记录高等级实体ID。
1.5 实体关系构建规则设计
构建形成基础地理实体关系,按实体分类[9]如表4自然地理实体基础关系、表5人工地理实体基础关系所示,管理地理实体通过PAC表达实体关系,不再列出。
表4 自然地理实体基础关系
表5 人工地理实体基础关系
2 关系实验
按照设计的基础地理实体关系结构和实体关系构建规则,以国家级基础地理实体数据为试验数据,进行实体关系构建试验,验证实体关系的合理性、科学性和可操作性,并修改完善。
2.1 试验区域
选择四川省广元市利州区4个乡镇为试验区,面积约420 km2。为充分开展试验,考虑城市建成区、耕地密集区、植被密集区等地理实体的分布特点,选择利州区东坝街道、雪峰街道、大石镇、荣山镇作为重点试验区域。具体范围分布如图2所示。
试验区基础地理实体数据成果内容、格式、基础地理实体分类与代码、数据分层及属性项定义与国家级基础地理实体数据标准一致。
2.2 试验流程
通过定制开发关系批量构建程序、编辑关系构建表(图3)实现关系的批量构建。
程序批量构建完成的关系,需要进行人工错漏排查,再通过修改关系构建表完善规则,程序无法处理的,需要人工逐一编辑,使关系构建合理、准确。以下为构建的关系示例。
附属设施与道路构建属于关系(图4)。其中,蓝色高亮线为试验区所有国道,蓝色高亮点为试验区所有公路桥,黄色高亮点为试验区所有构建出的附属于国道的公路桥,将实体关系记录入关联的公路桥实体。
道路与道路的连接关系构建(图5)。蓝色高亮为试验区所有国道,黄色高亮为通过实体关系构建,记录出的与国道连接的省道。
构建出的实体关系,可以通过以下方式查询使用:
子实体、父实体通过关系字段联动查找。本例中,通过公路桥实体关系信息,可以查询其出关联的国道(图6)。
蓝色高亮部分为选出的一条国道,通过简单SQL查询,即可获取所有属于此条道路的黄色高亮公路桥(图7)。
2.3 试验分析
1)实体基础关系归并化简。通过分析既有方案、标准中的实体关系定义,归纳、简化出实体的基础关系,通过属于、连接等关系描述简洁表达实体中存在的基础关系,通过PAC、GIS空间关系等方式辅助完善实体关系描述,将必要的、合理的、最大公约数的基础关系按照便于生产组织、便于分发利用的模式重新分类,舍去部分向导性不强的实体基础关系。
2)实体基础关系一体化存储。充分利用既有的GIS图形、属性一体化存储模式,在图层级扩展关系属性,在尽量不改变原有数据组织模型、使用习惯的基础上,对结构进行微调整,使其支持归并化简后的基础关系,便于编辑人员和应用人员查询基础关系,充分利用原有方式、习惯满足实体数据关系构建的需求。
3)实体基础关系简单查询。按照在低级、子项、附属物单向挂接实体关系信息,从而形成了天然的实体关系查询树,利用简单的SQL语句即可进行实体间的关系查询、过滤、显示,人工交互难度进一步降低。同时,也可以支撑机器定制查询,从而能同时满足人工、机器的对等操作,保持数据使用的独立性。
3 结束语
本文提出的基础地理实体关系便于构建,使用也较为方便,具有一定的参考价值:
1)从构建的角度。简化后的实体关系便于构建人员批量提取语义明确的实体基础关系,一体化的存储模式保持了数据的一致性,也便于作业。相比于通过独立的关系表记录实体关系,或者通过外置语义描述文件记录实体关系,这种将实体关系完整记录入实体数据分类图层中的方法,可以极大的提高构建效率。也便于人工交互图形、属性编辑和检查,且不需要依赖特定的实体关系构建软件,便于作业组织开展。
2)从使用的角度。将实体基础关系放入空间图层中,可以通过SQL语句简便的查询关联的实体,进一步可通过图形、属性进行复杂组合查询,普通应用人员就能很快掌握实体数据中已梳理出的关系,可以极大的提高地理实体关系的使用,降低使用门槛。同时,因为这种通过重构数据模型的方式不依赖具体商业软件的实现,也利于实体数据的分发与再利用。将一些强空间关系留给GIS擅长的空间分析来实现,将实体关系内容补充进原DLG数据因侧重表达造成的语义缺失,将应用中的扩展关系留给行业部门按需自行构建。
为进一步完善本文设计的实体关系构建方法,建议从以下方面进一步完善:
1)现有国家级基础地理实体数据成果基本沿用原1:5万的图层结构分类,不便于实体按分类梳理关系。可按实体一级类分别建立点、线、面基本图层,总计15类×3几何类型=45层,控制图层数量[10]。同时,现行实体部分分类需要根据合理性、便利性及分类粒度进行调整[11]。
2)现有组合实体层通过物理融合最小粒度实体层实现实体组合,存储冗余,关系构建复杂。可通过逻辑组合方式实现实体组合[12-13]:辅图元附加到主图元上、或主图元之间组成基本实体,使用组成关系,在辅图元属性中记录主图元实体ID(如道路面挂接到道路中线),或同实体的主图元实体ID一样(如多个河段组成河流)。主图元有1-N个,辅图元存在0-N个,辅图元实体ID为空。
3)本文只梳理了实体的基本关系。根据具体应用需要再建立实体类间的交叉关系,交叉关系、扩展属性不放入实体基本图层结构。同时,应根据国家最新顶层设计要求[14-15],进一步完善实体关系自动化构建方法,提高实体关系构建效率与准确性。
【作者简介刘晰(1983—),男,陕西西安人,高级工程师,博士,主要研究方向为地理实体数据库。
450589505@qq.com
【基金项目】实景三维中国建设专项-2022年实景三维中国建设前期工作(自然资办函〔2022〕539号)
【引用格式】刘晰,耿丽丽,刘建川,等. 基础地理实体关系设计与试验 [J]. 测绘科学,2023,48(3)。
转自:“测绘学术资讯”微信公众号
如有侵权,请联系本站删除!