地形、地籍数字化成果向GIS数据转换软件开发

肖明虹 谢志伟 陈钊
(广西测绘局第二测绘院地理信息工作站 广西柳州 545006)

【摘 要】 对传统的的地形、地籍数字化后的Dwg成果进行入库前的处理,使之完全达到GIS建库要求。
【关键词】 AutoCAD map2000i 系统自动识别 人机交互识别 数据属性 拓扑构建 检查控制

一、概 述
  在过去的十年中,全国各地市、县生产地形、地籍数据一般分为两种途径:1、以原有的基础图件进行数字化;2、利用全站仪等设备进行全野外测量直接生产数字化图。两种方式所得的成果均为利于管理的制图数据(大部份成果为AutoCAD的dwg格式),此类数据成果适用于制图,简单的分层管理及初级的GIS数据。随着当今GIS数据广泛应用于各行各业,对GIS数据的分层要求、代码要求更加细化,数据的严谨性进一步提高,行业的GIS数据也已得到了长足发展。地形、地籍测量数据成果向GIS数据转换已为GIS数据建库及应用的前提,全国各地市、县已逐步开展此项工作。
  我部门成立了3人的软件开发小组,选择了某市的1:1000图幅,共计40幅(面积为10平方公里)作为系统开发的测试数据。该测试区域地形、地貌要素具有一定的代表性,基本满足测试要求。
二、前期准备
  
1、软件开发目标:开发一套完整的系统,把原始的dwg数据归划至GIS系统要求的相应图层,并赋予相应约定的属性,最终通过数据接口,生成ArcInfo的coverage(或ArcView的shape)。
  2、测区资料情况:测试测区为某市1:1000数字化地形图,共计10平方公里40幅满幅,原始图层信息见附录1(部份)。
  3、作业依据:依自定《某测区地形数据向GIS数据转换设计方案》(以下称《方案》)见附录2(部份)。
  4、开发软件平台及版本:
  (1)Visual LISP,AutoCAD map2000i     (2)AML,Arc/Info 8.0.3
三、技术路线
  依据原始的dwg图进行图层、线型、插入的图块名及颜色进行统一,再利用开发的系统对dwg图形数据进行统一计算机识别,无法识别的数据再进行人机交互识别,识别完成后在CADmapi中进行面状要素的拓扑构建,完成后利用开发的系统子功能输出为文本E00格式,再在ARC/INFO中读入E00格式,再进行点线面要素的拓扑构建,最终成果整理为ARC/INFO的coverage格式,或ARCVIEW的shape格式。
四、技术实施步骤及开发思想

  1、工艺流程图

  2、实施步骤及开发思想
  2.1 AutoCAD的环境设置
  对于原始的Dwg数据,每一测区都有自定义的原始图层信息和其他CAD要素信息(包括线型定义信息、块名定义信息、颜色定义信息等)(见附录1中某测区部份原始信息),通过数据转换要求生成《方案》中的图层及代码,并具有相应的属性字段,因此要求在环境设置中对图幅完成以下设置:
  2.1.1. 《方案》中所有地物类的图层建立;
  2.1.2. 对象属性数据结构设置;
  2.1.3. 原始Dwg数据的一些特定项检查;
  2.1.4. 自动识别定义
  2.1.5. 交互识别定义
  2.2 Dwg数据接边检查、修改
  通常GIS数据在空间拓扑关系和数据属性的完整性两方面尤为重要。在制图的前期若不把接边问题处理好,在今后的入库工作中,单幅图的数据入库不会出现问题,但在整个测区(或部份区域)入库时就会出现地物的不完整,拓扑关系的错误或属性不接的错误。因此,对于每幅图的接边数据均要求完全接边,包括图形接边及属性接边,且图形的接边点应落在内图廓线上。
  2.3 系统对要素的自动识别
  在AutoCAD平台所采集的原始图,一个测区范围内通常都采用同一制图软件平台,但有时一个测区多个作业队,所采用的软件平台、采集方法、作业水平都不尽相同。原理上,一个地物要素在采集时是加入了制图软件中该地物的环境,如:该地物要素的类型、图层、代码、线型、块名、颜色、宽度等。关于我系统对这些具有一定标准的地物要素可以完全识别,列举如下几个地物要素的识别(表1):

地物要素名称
类 型
图层名
线型或块名
其 它
加固陡坎
*LINE
DXDM
LC10422
不使用
不依比例尺单线围墙
*LINE
HOUSE1
LC443B
宽度0.3
一般高程点
INSERT,SHAPE
GCD
GCD
狭长灌木林
*LINE
PLANT
LC1132

(表1)

  在系统识别后原地物的颜色随之改变,以便确认。
  2.4 人机交互识别
  原理上,若Dwg数据全部按AutoCAD制图软件平台环境采集,在本系统的自动识别过程后绝大部份数据可以识别。但实际上,完全标准正确的Dwg数据是没有,通常系统都有相当部份地物要素无法自动识别,主要原因如下:
  * 图层定义错误;
  * 线型或块名定义错误;
  * 线符号或点符号被炸碎,已失去原有线型或块和属性;
  * 采集不标准,以多段线为标准,但在采集过程中为求图面效果而采用了圆、圆弧、二维多段线等不标准的线;
  * 不可识别的要素,垃圾要素。
  由于以上原因,本系统不能完全自动识别所有地物要素,因此只能进行人机交互识别。具体的人工交互识别开发思想如下:
  把所有地物要素以《1:500地形图图式》为标准,分为控制点类、居民地类、工矿建筑类、交通类、管线类、水系类、境界类、地质地貌类、植被类、地图整饰类等十大类,含盖了《图式》中所有要素,每个大类再细分为点要素,线要素,注记要素,其他辅助功能等,见如下“系统主菜单”(图1)。针对某一需要人工识别的要素,经人工识别后,在系统菜单中选择相应的地物类,得到该地物类中满足属性(点、线、注记)要求的所有要素的菜单,见如下“地物要素选择菜单”(图2),最后通过选择相应代码,使该地物要素达到识别要求,由系统赋上相应的属性。
  系统主菜单:


(图1)

  地物要素选择菜单(注下为居民地类、实线属性所有地物):


(图2)

  通常需要人工交互式识别的内容主要包括如下几方面:
  * 系统未能自动识别的地物要素;
  * 面状要素的识别;
  * 等高线的识别及高程赋值;
  * 道路及桥梁的中心线生成;
  * 不可识别地物及图形垃圾数据的处理。
  通过以上识别处理,再加以检查,Dwg原始数据均可按《方案》要求进行属性转换。
  2.5 面要素拓扑构建
  面要素一般包括了,居民房屋、面状水域(如:双线河流、水塘、水库等)、城镇绿地、境界面(如:市界面、镇界面、村界面),针对各行业对GIS数据的要求,可以自由定义一些专业的面要素的内容。对于面要素的构建,主要应处理好两个方面的内容:面要素的边界和质心。
  1) 面要素的边界,
  2) 面要素的质心,
  本系统开发平台为AutoCAD map 2000i,并提供了构建拓扑的功能,通过菜单可以对上面要素完成构面。具体实施步骤:
  1) 利用原采集的原始数据生成面要素边界,如有缺数据(如其他地物隔断)可加入面要素边界辅助线;
  2) 根据原图注记内容,由系统自动加入面要素质心(标识点),如无注记则人工加入,同时录入相关属性值,如:河流名称、湖泊名称等;
  3) 面要素图面清理,包括删除毛刺、重复对象,延伸未及点,溶解伪节点,捕捉聚合节点等;
  4) 由系统完成构面前的检查, 包括面要素是否完全闭合,是否有质心或是否有多余质心,面要素边界属性与该内部质心属性是否一致;
  5) 修改以上检查错误,最终构建面拓扑。
  2.6 数据的全面检查
  数据在输出前,必须对其进行一次全面的检查,检查主要包括以下内容:
  * 原始数据转换的完全情况,检查是否有未处理的数据;
  * 转换后数据的完整性检查,包括数据的图层、代码、属性表及某些特殊要素的特殊属性等;
  * 面要素的拓扑检查;

  2.7 元数据的制作
  通过图廓信息,人机交互式选择录入生成mdb文件。
  2.8 转换后数据输出文本E00格式
  通过认真解读E00文本格式,用Visual LISP编写系统输出模块,对转换后的CAD数据直接输出至文本E00格式。
  2.9 在ARC/INFO中重新构建点线面拓扑关系
  在AutoCAD map 2000i中,为了完整表示拓扑关系,在没有LABEL点的封闭范围内加入空的LABEL点,在输出时再把空的LABEL点剔除,所以在所输出的E00文件中,图形的拓扑关系是不严谨的,系统通过把E00转换为coverage,在ARC/INFO中重新构建点线面拓扑关系。
  2.10 数据成果整理,提交入库
  可根据《方案》要求,对数据成果进行分区、归类整理,最终提交入库。
五、主要技术问题及处理方案
  1. 构面的处理问题
  对于GIS数据,拓扑关系是一关键问题。尤其是面状要素,在数据转换过程中,如果出现拓扑错误,将直接导致数据将无法入库。为此我们选择的是AutoCAD Map 2000i软件平台进行面状要素的拓扑构建,通过在以上2.5项中所述步骤,可完成面状要素的拓扑构建。在此特别强调的是,面状要素的拓扑构建最关键的是面状要素边界生成和质心生成。
  1)面状边界的生成是系统通过该要素的图层和代码识别,选择该要素的线特征边界,如果该面状要素有人工加入的辅助线,同时也选择该辅助线,然后系统把它们合并,再复制(辅助线不用再复制)出一个完整的面状要素,同时赋值相应的图层、代码及属性。
  2)质心的生成,主要是通过原图注记内容自动生成,如无注记则人工判读再在面内加入质心,同时录入相关属性值,如:河流名称、湖泊名称等。
  3)对于面状要素中存在“岛”的现象,在“岛”中加入“空”字做为“岛”的质心。
  2. 非标准图形要素的处理问题
  1)错误图层、错误环境设置的图形要素。
  作为原始采集图,尤其是纯制图数据的采集图,图层或图形环境的错误是不可避免的。对于这些图形要素,系统是无法自动识别的,解决的方法主要有两个:1)把错误的图层人工改正,再由系统自动识别;2)利用系统功能的属性刷功能,实现属性复制。用系统已识别的正确的图形要素属性复制另一同类地物(未识别)。该属性刷是本系统独立开发,为完全的属性复制,包括图层、代码、颜色及属性字段和字段值。所以在有不同属性字段值的同类地物使用该属性刷时,应注意同时更改该字段值,如:高程点之间的属性复制,应修改相应的高程字段值中的高程值。
  2)非标准的线型、符号块的图形要素。
  所谓标准线型、符号块就是原图在采集时完全利用采集软件平台所定义的线型、块名。但部份原始采集图的图形要素或被炸碎,或是用多段线直接描绘符号,或是其他符号组合另一线型或另一符号等,总之非标准的线型、符号块五花八门、千奇百怪,如用直线组成的陡坎、斜坡,小圆圈组成的地类界,被炸碎的植被符号等。
  对于这些问题的处理,本系统都开发了一些小功能,从而把这些图形要素标准化。这些小功能如下:1)标准符号图块的插入;2)小短线和小圆圈组成的“线”连为标准线型;3)CAD圆或多维线转换为多段线;4)特定图形要素的快速查询。
  这些小功能基本上可以解决了非标准的线型、符号块向标准化的转换,但都是需要人工干预,通过菜单式的人机交互完成转换。
  3. 桥梁、道路中心线的制作
  对于一个测区道路应该是成网的,在本系统中,道路中心线的制作就是通过把测区整个道路网拼为一整块(测区太大可分为若干块),然后在此基础上制作道路中心线,具体作法如下:
  在原始采集图中提取道路要素,拼为一整块路网图;
  1)在该路网图中,人工选择需要制作中心线的双线道路(一般等级在双线大车路以上的都要制作道路中心线);
  2)利用菜单提供的功能,从双线道路和一边复制一条线至中心位置,赋上相应的属性及属性值,包括道路名称、等级、宽度等属性值;
  3)生成路网图内所有道路的中心线后,再把以分幅图单位的道路中心线,利用生成图块和插入图块的CAD功能,实现中心线转移至作业分幅图中,该测区作业分幅图的道路中心线均可在已完成的路网图中提取,至此作业分幅的道路中心线制作完成。
  4. 等高线处理模块开发
  等高线是地形图的主要内容之一,几乎涉及所有图幅,所以等高线的处理也是本系统开发的一项重点工作。对于大部分原始采集图,等高线的采集都是不带高程属性值的,所以如何方便的录入高程值是这一模块的重点,具体思路是:利用等高线的特性,首先对整幅图的等高线进行图面清理(包括删除重复的等高线、连接小于指定距离的等高线等),再由人工赋值几条相邻的等高线,输入等高距(也可自由推算得到),选择某种赋值方式,包括递增方式(+1)、递减方式(-2)、等值方式(=3)、自由推算方式(.4),(如图3所示),对所有的等高线赋值后,最后对示坡线及未处理等高线进行查询处理,在对等高线赋值处理时,也把计曲线、首曲线区分,并赋予相应的图层、代码等属性。
  等高线赋值菜单:


(图3)

  对等高线的处理,同时也要有相应检查方法,本系统中对等高线录入的控制方法主要以下几种:
  1) 图层控制,此是防止其他图层要素的错误录入;
  2) 线宽控制,此是主要控制计曲线与首曲线的错误录入,同时也作为控制高程值赋值时的检查手段;
  3) 等高距控制,在遇计曲线时用等高距的固定倍数进行控制。
  4) 遗漏的未处理等高线查询、录入。
  5. 图形要素转换录入检查控制
  在人机交互式转换过程中人为因素较多,可能会出现选择错误。对此本系统通过对图形要素的一些控制而避免人为的选择错误,控制内容为:图层控制、线型控制、宽度控制。通过这些控制,如当前设定转换录入的是“地形地貌”图层,但人工却选择了其他图层的内容,系统将自动过滤所选要素,从而控制人工选择错误。同时也可以通过设置取消这些控制,也就是说,当出现原图错误、非标准线型时,也可以通过改变设置后强制转换(如下图4所示)。
  选择图形要素控制:


(图4)

六、系统通用性的一些思考
  在系统开发时,所用的数据要求进行一些针对性的调整,使得系统不够通用。为使系统的通用性能进一步提高,相应地采用以下技术:
  1) 系统识别定义模块化。取消识别定义手工录入方式,解决方案是开发识别表达式生成工具,以直观易懂的方式进行识别定义。
  2) 扩充针对性调整功能,并开发针对性调整模块。原来的方案要求对复杂线型进行打散,本系统就开发了相应的模块,但相当的打散识别和打散要求还是集成在程序内部。解决方案:把识别要求加入到识别定义中,再定义相关的打散方法。
  3) 系统菜单,目录采用依照地物进行分类。应在定义识别模块时对菜单进行调整。
七、结束语
  AutoCAD作为当今最普及,最成熟的软件,在制图方面是绝无问题的。但要希望通过简单的数据转换就能完全满足GIS的建库要求,是很困难的。这是由CAD在应用上的广泛性所决定的,各种形体、各种标准对制图可能毫无影响,但对数据内在的属性是有很大的区别。
  这次系统的开发,我们主要也是运用了CAD的开发功能,充分利用了Visual LISP强大的开发功能。但在开发的界面上、各种CAD问题的处理小功能上我们仍需要进一步完善,对不同测区的系统通用性上也应进一步加强。

附录1:

某测区1:1000地形图DWG分层信息(部份)

序 号
层次内容
层 名
颜 色
包含地物(内容)
1
图廓线及修饰
TK
GREEN
内图廓及内图廓外的内容
2
测量控制点
KZD
11
三角点、土堆上的三角点等,包括点名、电号和高程
3
房屋建筑
HOUSE
40
一般房屋、简单房屋、棚房等中须封闭建面拓扑
4
房屋建筑注记
HTEXT
40
房屋建筑和房屋建筑附属物的注记、层次和性质
5
城市道路桥梁
ROAD
RED
城市建成区范围内道路边线、侧石线等
6
公共绿地
GREEN
GREEN
市级、区级、居住区级的公共绿地、生产防护绿地及文字注记
7
植被及地类界
PLANT
GREEN
稻田、旱地、水生经济作物地、菜地等以及相应注记
8
境界
BOUND
242
地市界、区县界、乡镇界、村界、其它界线
9
高压线及附属设施
GYX
20
输电线、电杆、电线架、电力检修井等以及相应注记


附录2:

《方案》摘录部份

  1、引用标准
  《GB/T 14804-93 1:500 1:1000 1:2000 地形图要素分类与代码》(1994-08-01)
  《GB/T 7929-1995 1:500 1:1000 1:2000 地形图图式》(1996-05-01)
  《GB 1:500 1:1000 1:2000 地形图数字化规范》(1998-08-01)
  《GB/T 14804-93 1:500 1:1000 1:2000 地形图要素分类与代码》(1994-08-01)
  《GT地籍数据库标准》
  《GB/T 13923-92 国土基础信息数据分类与代码》(1993-07-01)
  
  2、数据分层(部份)
  居民地类:

图层名称
主要内容
实体类型
层名
面状居民地
各类房屋、楼房
R
RESRGN
线状房屋附属设施
围墙建筑物的看台、出入口、圆柱等
L
RESAPL
点状房屋附属设施
不依比例的门墩、圆柱、支架等
P
RESAPP
单位名称标记点
单位名称标记点
P
RESLBL
居民地注记
房屋结构、层数注记等
P
RESANN
  3、属性设计
  居民地
  层名 RESRGN
属性项名称
英文名称
数据类型
宽 度
备 注
要素代码
CODE
C
6
  
结构
STRUCT
C
80
  
层数
FLOOR
I
8
  
权属
LOTID
C
80
  
国土代码
GTCODE
C
6
  
地类描述
DDESCR
C
40
  

   4、编码设计(房屋类部分编码)

     

地址:广西南宁市建政路5号  邮编:530023  Tel:0771-5606397  Email:webmaster@digitalgx.com
广西基础地理信息中心版权所有 2005-2010 广西基础地理信息中心制作