馆藏测绘档案资料数字化与建库探讨

韦家宏
(广西测绘档案资料馆 广西南宁 530023)

【摘 要】 建立数字测绘档案馆是未来的发展趋势,本文简要阐述数字化是测绘档案资料管理的发展需求,以广西测绘档案资料馆为例,探讨了测绘档案资料数字化与建库的一些基本方法。
【关键字】 数字测绘档案馆 馆藏测绘档案资料 数字化与建库

  数字档案馆的一个主要特点是馆藏的各种介质承载的档案资料被数字化,进行信息化、自动化管理,而那些原始档案成为“标本”被更好地加以保存。测绘档案资料馆作为测绘专业档案馆,是测绘知识、测绘信息资源、测绘成果、测绘历史记录的信息中心。为有效地保护测绘档案原件,最大限度地利用测绘档案信息资源,建立数字测绘档案馆是未来的发展趋势,而传统测绘档案资料的数字化将是其“馆藏”的重要组成部分。
  1 数字化是测绘档案资料管理的发展需求
  1.1 测绘档案资料管理面临的主要任务
  测绘档案资料是广大测绘工作者几十年辛勤劳动的成果,是政府管理、国土规划、文化教育、科学研究、经济建设、外交和国防建设不可缺少的地理信息资源,是国家的宝贵财富。加强测绘档案资料管理,充分挖掘和发挥测绘档案资料在社会主义现代化建设中的作用是测绘工作的一项重要任务。
  建设数字测绘档案馆是国家“十一五”及往后一段时间的一项重要基础测绘项目,自治区测绘局已经把“测绘档案资料的数字化与建库”工作列入“十一五”事业发展规划。该项目包含档案原件数字化和档案管理信息化两部分。具体内容包括完成测绘档案资料整理组卷工作,对破损图件进行修复;对档案资料进行扫描数字化处理并建库;开发数据库查询检索系统,并对用户实现网络化服务。要达到以下目标:建设现代化的测绘档案资料管理基础设施,建立测绘档案管理与服务系统,改变测绘档案的存储模式,实现数据存储与原件存储并举,改变传统手工管理,实现自动化管理,利用先进的网络技术进行异地长距离信息传输,不受时空的限制,充分发挥测绘档案资料的功能,为政府和各级决策机关及社会各界提供快速、准确、全方位的地理信息服务。
  1.2 测绘档案资料数字化的必要性
  1.2.1 测绘档案资料长期保存的需求
  测绘档案数字化能有效地保护档案原件。模拟档案提供离不开档案原件,长期的档案翻阅会对档案的原件造成永久性伤害。测绘档案成数字化成果后,日常的档案提供利用完全可以用数字栅格图来代替,这大大地减少档案原件的使用频率,减少了人为因素对档案的破坏,有效地保护档案原件,提高原始测绘档案的寿命;对于模拟档案来说,数字化可将档案所承载的信息转存到磁带或光盘介质上,即使载体消亡后,至少其信息内容还可以继续保留,而且,数字化后有多个副本,可以进行异地保存,保证这些测绘档案资料在出现天灾人祸的情况下不至于遭到毁灭性的破坏,达到抢救与长期保存的目的。
  1.2.2 测绘服务与发展的需求
  随着社会各界对测绘成果档案尤其是数字测绘成果档案的需求快速增长,如何更好地服务用户,使测绘成果档案更高效地体现其应有的价值,是我们所面对的一个重要课题。以广西测绘档案资料馆为例,现在的成果档案资料提供,仍采用传统手工方式为主进行;档案资料编目和成果编目,仍采用传统的模拟方式编制印刷。为了实现服务手段的现代化,应提供一种简单、快速的获取馆藏测绘成果档案资料情况的方法,即建立测绘成果档案资料数据库系统,满足用户的需求。
  档案资料数字化、信息化是当前的发展方向。当前,人类已进入信息社会,走以信息技术发展和信息资源建设为核心的信息化道路已经成为我国经济社会发展的战略选择,测绘工作也不例外。以“测绘生产自动化、测绘成果数字化和测绘管理(服务)网络化”为主要特征的信息化测绘服务体系建设将成为测绘可持续发展的必然选择。为了尽快使测绘档案资料管理工作适应社会发展的要求,用现代化的技术手段和设备,管理好、维护好馆藏测绘档案资料,更好地服务于社会,测绘档案的数字化与建库是必需的。此项工作越早启动,档案工作就越早摆脱落后的局面,社会就越早受益。
  2 馆藏测绘档案资料分析
  2.1 测绘档案和模拟成果资料馆藏情况
  按照1993年发布的《中国档案分类法测绘业档案分类表》,测绘档案基本目录共14个,二级类目64个,广西测绘档案资料馆目前开展的测绘档案基本类目涉及11个,包括TD1综合类,TD2大地测量,TD3摄影测量、遥感测绘和其它方法地形测量,TD41地图制图和地图印刷,TD43地籍测绘,TD44海洋测绘,TD45境界测绘,TD46专业测绘,TD5科学研究,TD8标准、计量和TD9其它等,数量约1.5万卷300万张(件),加上模拟成果供应资料(基本比例尺地形图、挂图等,数量约200万张),馆藏总数量约500万张(件),非常丰富。而且随着广西测绘事业的不断强大和空间基础地理信息化建设的大力发展,以及未来测绘成果汇交工作的加强,移交归档的测绘档案资料数量预计将有大幅度的提高。
  馆藏测绘档案资料的载体介质种类多、形态多,按载体形态分类有纸质文档、印刷纸图、手绘纸图、薄膜图、照片、底片、胶片等。地图按比例尺分类有国家系列比例尺地形图1:100万—1:5000比例尺地形图以及各个年代的历史地图等;按图种分有地形图、公开图、专题图、海图、境界图、地图集、古地图等;按工序分有编绘原图、清绘原图、二底图或黑图、印刷图、复印图、数字喷绘图等。
  总的来看,数量大,介质不同,大小不一,厚薄不一,保存年代不一,质量不一是我馆馆藏测绘档案资料的特点。由于大量的档案资料都是以纸质等模拟介质存储,保存起来占用很大的空间,给档案的保管和利用带来诸多不便。
  2.2 测绘档案资料管理状况
  由于种种原因,广西测绘档案资料馆在测绘档案资料的管理上仍处在落后的传统手工管理阶段,测绘档案管理距离档案专业要求差距还比较大。有些档案资料未按档案管理专业的要求进行整理组卷、著录标引;个别类目进行了整理排序,但只是从资料管理的角度考虑,与档案专业要求还有较大差距。而且收集接收、进库都靠人工传送,速度慢、费时费力、原件易破损;档案整理手工标注,目录账本人工抄录;批量进库的成果资料无能力清点建帐,常年数量不清;档案的查询检索如果账本目录查不清的,只有进库房查询实物,这样不仅效率底、原件易损,同时频繁进出库房,破坏了整个库房存储环境,降低了所有原件的存储寿命,而且只有专管人员才能查检清楚,换了别人如同大海里捞针;用户来查询更是费时费力;每次提供统计数字非常困难,也无法保证准确,一次一个数字。上述测绘档案资料管理的状况,无法实现为各级领导和决策部门及社会提供快速、准确、全方位的测绘档案信息服务。因此,建立一套测绘档案资料信息管理与服务系统已成燃眉之急。
  3 数字化与建库的条件
  测绘档案资料种类繁多,数量庞大,其数字化与建库工作是一项复杂的系统工程,需要大量的资金、技术力量和设备设施。因而在确定数字化目标时,必须对档案资料的现状进行调查研究,摸清实际情况,了解各方面的需求,并从技术、资金等方面对数字档案的建库目标进行确定。
  3.1 技术条件
  根据现有的技术条件,对馆藏测绘档案资料进行数字化与建库已经比较成熟。国内很多综合的、专业的档案馆已成功地建立了数字档案馆;国家基础地理信息中心也正在进行馆藏测绘档案资料的数字化与建库工作,在数字化技术水平、数据库的整合技术、数字档案信息的建立、档案信息的安全等方面都取得很多经验;近年来,我区测绘事业不断发展壮大,自治区测绘局在测绘新技术的使用上,不断取得进步,也锻炼出一批精通3S(GIS、GPS、RS)技术、计算机与网络技术、测绘技术的综合型人才;作为测绘档案资料管理部门,广西测绘档案资料馆经过近几年的发展,在档案资料的现代化、信息化管理上也有一定的基础,领导和业务骨干对数字化建设的了解程度也在不断地提高,这些将在技术上为测绘档案资料数字化与建库奠定基础和保证。
  3.2 经济条件
  庞大数量的测绘档案的数字化与建库,建成后的系统维护等,需要投入大量的人力、物力、财力。近几年,国家对基础测绘的经费投入不断增加,测绘工作有了新的进展。2006年,经过多方努力,自治区测绘局抓住了“国家测绘成果档案存储与服务设施建设”项目的机遇,进入了全国仅15个省的省级测绘成果档案存储与服务设施建设项目行列,将争取到约700万元的国家资金,对测绘成果档案存储与服务设施进行全面改造和建设,这将极大地推动档案资料数字化与建库的实施。
  当然,测绘档案的数字化与建库是一个长期而复杂的过程,不是一蹴而就的。而且,由于测绘档案工作的复杂性及对安全的特殊要求,数字化的面不宜马上铺得太大,应从有利于保存珍贵档案、有利于档案利用等角度出发,不断总结,积累经验,并结合实际,有计划分步骤地实施,分期投入,这也有利于缓解经济条件的压力。
  4 数字化与建库实施
  档案数字化与建库是指利用计算机技术、扫描技术、OCR技术、数字摄影(录音、录像)技术、数据库技术、多媒体技术、存储技术等把各种载体的档案资源转化为数字化的档案信息,以数字化的形式存储、网络化的形式互联,利用计算机系统进行管理,形成一个有序结构的档案信息库,及时提供利用,实现资源共享。数字化与建库是档案信息化建设的重要组成内容。
  4.1 馆藏测绘档案资料的清理和整理组卷
  4.1.1 摸清家底
  由于多种原因,广西测绘档案资料馆馆藏存在着家底不清、帐物不符的现象,有些还比较严重。由此,造成了无法提供准确的统计数字,可以销毁的资料无法销毁,冗余积压,既是不安全隐患,又长期占用库房面积。
  在数字化与建库之前都应该把馆藏清理清楚,分门别类,做到心中有数,包括馆藏数量、档案的类型、载体形态与状态、档案信息利用等基本情况。然后根据馆藏情况制订档案数字化的科学规划,对需要进行数字化的测绘档案进行选择,不加选择地全部数字化是不必要的、也是不科学的。我们应该根据“精炼、存史、抢救保护和利用优先原则”确定哪些馆藏档案原件应该数字化、哪些不需要数字化以及哪些优先数字化,力争做到数字化的档案信息应该是高价值、高利用率、有序、标准、有特色的信息资源。
  4.1.2 整理组卷
  按照档案工作的规范要求,把馆藏测绘档案资料进行整理组卷,这是档案工作规范的需要,也是档案资料数字化与建库的基础, 是档案资料计算机管理的前提。要根据国家测绘档案管理的技术标准和有关规定,将已清理的各类档案分类整理组卷,并装入档案装具;组卷时将著录要求的著录项填入相应附表内,同时根据需要填写卷内目录、备考表、标注卷号;每一类档案组卷完后,随即进行标引档号;统计各类地图档案的案卷数、件数,需要翻译考证、复背、修复的图件数量;确定图件翻译、复背、修复方案并实施;组织计算机录入档案著录项等。
  而且,以前已整理组卷的档案资料,因历史原因和当时条件,很多已不符合现在规范化的计算机信息管理系统和数据库的要求,需对其进行必要的补充和修改。
  4.2 设备购置
  对数量庞大的测绘档案资料的数字化与建库,需要一整套齐全的软硬件系统来支撑,对此,准备实施的“国家测绘成果档案存储与服务设施建设”项目都能基本实现。其中,软件系统主要包括各种大型数据库软件平台,通用商业应用软件和通用操作系统软件,文档、图形扫描软件,图形处理软件,网络管理软件,各种通用工具软件,档案综合管理软件,通用GIS软件,其他相关软件等。硬件方面,需要大型输入、输出设备,图像、图形处理设备,大型存储、备份设备,有安全、稳定的网络运行系统(环境)。具体包括PC台式计算机,高速光盘刻录机(CD、DVD),磁带机,快速以太网网络系统,大型数据存储设备(磁盘阵列、磁带库),各种类型服务器,条码打印、识别设备,档案技术处理及保护设备,专业地图轻印刷系统(数字打印机),大型喷墨打印机,普通激光打印机,高速文档零边距扫描仪、大幅面(黑白、彩色)图形扫描仪,缩微胶片扫描仪,UPS不间断电源等。
  4.3 数字化
  该阶段主要任务是将传统测绘档案资料纸张文档、图纸、底片胶片等通过重新录入、纸张扫描、图像优化、压缩归档等数字化技术加工成电子化的信息数据。
  数字化方式有很多,档案中的纯文字信息可以人工录入或扫描后经OCR识别校对,其他如图纸、照片、图片档案信息可以单纯通过扫描方式。但目前的OCR扫描输入技术,其平均识别率只为95%,而且文档档案如采用人工录入或OCR识别,成本高,速度慢,难以形成规模,达不到实用化的要求,也不利于档案的原文原貌保存,而且,造成建库工作环节多,建议全部采用扫描方式进行数字化。
  4.3.1 大地控制成果的数字化
  一直以来,大地控制成果都采用传统的手工管理,成果以纸张的形式保存,用户需要使用时要么手抄,要么复印,手段比较落后。近几年,由于测绘技术的不断进步,上交入库的大地成果也开始以数字化的形式,如点之记采用DWG、TIF等格式,点成果采用TXT、DBF、EXCEL、WPS等格式,而用户的需求也日趋多样化,基于以上原因,自治区测绘局已于2003年建立《广西空间定位(大地控制)成果管理信息系统》,数据成果的重新整理录入、点之记原件扫描、建库已完成并投入使用。所以,大地控制测量成果的数字化主要是该系统数据的补充完善、更新维护等工作。
  4.3.2 纸质普通档案资料的数字化
  包括测绘管理档案、生产技术档案、科学研究、仪器设备以及标准、计量档案等。对于大量文档的数字化,从效率和效益的角度出发,不宜采用普通的扫描方式,而必须具有非常高的扫描速度,而且满足免拆装扫描的需要,同时要求扫描形成的电子影像足够清晰、真实,扫描时不能漏扫、不能损伤纸质档案的原稿,这就要求高质量、高速度的扫描设备。目前国内外高清晰度、高速度、零边距的扫描技术已比较成熟,选择范围比较大。此外,该过程还应该包括图像纠偏等图形图像处理环节。
  4.3.3 纸质、薄膜地图的数字化
  对纸质地图、薄膜清绘原图档案的扫描,主要包括折断、撕裂的地图档案要复背或修复后再进行扫描数据化;经过对栅格影像数据的粗纠正、精纠正形成栅格数据文件;经过栅格数据抽稀,形成栅格影像索引数据等。由于对精度要求较高,所以,其数字化也需要高要求,建议采用CONTEX公司的大幅面黑白、彩色扫描仪,它具有多个高像素传感器,可调分辨率范围宽,精度也较高,能满足地图产品质量的要求。对高精度的地图产品,经数字化后还需利用专业的GIS软件,对其精度进行纠正以及色彩规划等工作,形成在内容、几何精度和色彩等方面与模拟地图基本相一致的栅格数据文件,根据不同技术要求,可生成DRG(数字栅格地图)、DRM(数字栅格图)等。自治区测绘局从2002年就开始进行全区1:1万地形图的DRG生产工作,现已全部完成,而国家基础地理信息中心也已完成我区1:5万DRG的生产工作。下一步,可进行其他比例尺地形图、薄膜清绘原图档案、各代各比例尺地形图档案以及其它历史地图档案的数字化工作。
  4.3.4 底片、胶片档案资料的数字化
  对普通底片和胶片,需使用专业的底片扫描仪进行透扫,将航空摄影的地面影像负片数字化,并利用数字化的航片制作数字索引图,同时制作元数据文件,供查询使用。与传统的照片扫描相比,底片扫描不仅大大降低了使用成本,还可以减少误差,提高精确度,同时节省了大量的时间。主要技术要求为底片扫描图像保持清晰,不失真,不增添污浊、无干扰信息,黑白对比度适中。这几年,自治区测绘局在开展的“广西航空摄影历史资料抢救性保护”项目中,已经启动航摄底片的扫描数字化工作,采用高精度影像扫描仪VEXCEL4000、VEXCEL5000,对馆藏的37个摄区的1517筒、27万多片航摄底片进行扫描,该项目完成预计需要几年时间。对于缩微胶片的数字化,必须借助缩微胶片扫描器,其扫描方法与纸质文档类似,目前很多专业的扫描设备生产厂家都有比较成熟的技术,如日本的美能达、柯达等。广西测绘档案资料馆馆藏的缩微胶片是20世纪60年代部分航片的复制品,数量约11万片,如果该部分航片已经扫描或计划扫描,该缩微片则可不必扫描。
  4.4 数据建库与集成
  与传统载体的档案相比,数字化档案的最大特点是能够通过网络迅速流动。数字化档案的管理、研究和建设将彻底改变档案的利用方式,冲破档案利用的限制,促使档案管理从档案的保管、利用职能向信息采集、管理和信息服务职能转变。
  大量的档案数字化后,怎样方便地对档案信息进行检索和查询,数字化的资源怎样组织整理,建立高质量的档案信息数据库系统是下一个工作重心。只有开发相应的建库软件,建立索引,编码,分级,识别等自动化系统才能提高建库的效率,否则,扫描录入的电子文件只是一堆无序的电子垃圾。建库涉及到系统模式、建库方式、格式标准的选择、参数的制订、档案数据的被利用性、命名规范、数据备份策略、数据安全等问题。应根据测绘档案分类原则,建成以档案自动化管理为目的的,由目录数据库、栅格影像数据库、栅格影像快视数据库、元数据库等分项库组成的、相互关联的、能与档案资料实物归档存放一一对应的,分布式文件管理子库。对于整个馆藏数字测绘档案信息的建库,大致可分为分类建库和综合建库两种方式。
  4.4.1 分类建库
  根据不同类型档案,分别建立独立的数据库系统,单独使用,各系统互不相干,如可建立“大地控制成果管理信息系统”、“航空摄影数据库管理系统”、“系列比例尺地形图数据库系统”等等。以“航空摄影数据库管理系统”为例,该数据库是一个由航片扫描影像库、航片快视库、航片定位数据库和航摄文档参数库组成,航片扫描影像、航片快视影像、航片定位数据和航摄文档等资料采用文件形式按照合理的目录结构组织存储在磁盘和磁带机上,采用大型关系数据库对影像索引信息、元数据、影像文件存放路径等信息进行存储,然后集成于航空摄影数据库管理系统,进行便捷的、高效的、网络化的管理。
  4.4.2 综合建库
  依照统一标准,在一个综合管理系统构架下,覆盖所有的馆藏档案管理,多系统集成,建立“馆藏测绘档案资料综合信息管理系统以及基于网络的馆藏测绘档案资料信息服务系统”。经过几年的努力,国家基础地理信息中心对该系统的开发已基本完成,目前正在试运行阶段。基于标准统一,有利于业务的上下沟通、互联互通的原则,可与他们进行合作,采用其建库方案。准备实施的“国家测绘成果档案存储与服务设施建设”项目初步设计方案也已考虑把该系统移植到省级馆。以下简单介绍该“综合系统”的主要功能:
  测绘档案资料信息综合管理系统包括:文件管理、档案移交、著录标引、原文管理、整理编目、查询检索(含图形和属性)、综合统计、案件扫描、模版生成与打印、系统维护、自动识别、数据备份、鉴定销毁、权限管理、案件加密、光盘发布等十几个子系统,数十个功能模块。
  基于内网或专网系统的测绘档案资料信息服务系统:数据库建库工作基本完成以后,在经费许可的情况下,增加用户节点,将档案核心网延伸至局内各单位,扩大网络覆盖面;增强系统功能,添加系统设备,实现开放档案全文管理和全文发布网络化、自动化。包括:档案信息业务主页、档案管理Web查询、行政主管终端查询、用户终端查询等等。
  5 人才队伍建设
  测绘档案的数字化与建库工程复杂、投入大,对档案工作人员的专业结构提出了新要求。由于历史原因,档案馆人员知识结构普遍单一和老化,对传统测绘知识比较熟悉,但缺乏档案业务知识,更缺乏与信息化建设相关的计算机应用知识。一方面,应加强档案业务人员培训工作,把档案管理基础知识、计算机应用基础知识、扫描技术、数字影像处理技术、存储技术等列入培训重点,提高档案业务人员掌握和运用档案知识和现代化技术的技能,同时,档案业务人员也应该加强自我学习,努力使自己在未来的信息化建设和服务中承担起如信息资源建设者、管理者等新角色。其次,单一的人员结构已不能满足档案工作现代化的需要,还需引进多方面的人才,包括信息处理人员,数据库生产与维护人员,计算机软件、硬件人才,网络环境创建与运行维护人员等,优化人员结构,建立复合型多层次的专业队伍,以满足测绘档案资料数字化与建库以及建立数字测绘档案馆的需要。

【参考文献】
[1] 杨公之.《档案信息化建设导论》
[2] 国家基础地理信息中心.《馆藏档案信息库管理及服务项目可行性报告》
[3] 陈姝.《论数字档案馆的信息资源建设》
[4] 吴佩剑.《档案数字化工作中的问题探讨》

作 者 简 介
韦家宏(1973-),男,壮族,研究生学历,地图学与地理信息系统专业,工程师,主要从事测绘档案资料的管理及开发应用等。

地址:广西南宁市建政路5号  邮编:530023  Tel:0771-5606397  Email:webmaster@digitalgx.com
广西基础地理信息中心版权所有 2005-2010 广西基础地理信息中心制作