民国档案数字化研究与思考(一)

随着信息技术、网络技术、数据库等技术的迅速发展及其在各领域的广泛应用,社会信息流通的基础结构发生了根本性的变化,档案数字化的建设势在必行①。民国档案年代久远,记载着民国社会历史的原貌,反映着民国社会发展的轨迹。将馆藏民国档案数字化,对于继承和保护人类宝贵的文化财富,无疑是最有意义的。为此,笔者就档案数字化建设作粗浅的探讨,与档案界同行交流,以推进档案数字化的健康发展。
  
  一、档案数字化
  
  档案数字化就是将存储于传统载体上的档案信息进行数字化。它利用扫描、照相及其他数字转换技术、将纸质及其他载体中记录的传统档案信息(模拟形式)转换成可以被计算机识别和处理的数字形式的过程。数字化档案的最大特点是能够通过网络迅速流动,彻底改变档案的利用方式,促使档案管理从档案的保管、利用职能向信息采集、信息管理和信息服务职能转变。
  
  二、档案数字化面临的问题
  
  近些年来,为充分利用现代信息技术为档案的管理与利用服务,档案界对档案数字化进行了理论研究,同时全国各地的一些档案馆也开展了积极的尝试,但是在档案数字化过程中也面临着一些问题。
  
  1.标准问题
  数字化标准是数字化建设规范和高效的保障,是稳步推进档案数字化建设的基础。但目前档案数字化标准化建设还处在简单、孤立、单个的状态,还没有形成完整的体系。全国档案数字化无相关数据标准,不同档案部门数据结构格式不统一,尽管可以通过大量的元数据来克服这样不一致的问题,但不利于网络条件下档案信息的高效率共享。档案数字化标准的缺位与滞后,已成为制约档案数字化建设的瓶颈;档案管理软件低水平与数据壁垒现象,已成为阻碍档案数字化发展的阻力②。
  
  2.优选问题
  长期以来,受历史档案“片纸只字不得销毁”思想影响,在民国档案接收进馆过程中,采取“有文必收,有档定管”的态度,永久保管。这样,不免将内容极具一般的事务性文件、零散性文件、重复性文件与体现民国时期机关主要职能的业务性文件交织在一起,这种“鱼龙混杂,玉石不分”的馆藏现象,造成了“馆藏的虚肿,内容的庞杂”,影响着馆藏档案的优化管理。在当前档案数字化工作中哪些内容优先数字化,哪些全宗优先数字化,哪些全宗暂缓数字化等,这些问题都很难明确。极端的做法是尽其所能通过键盘、采集卡及扫描设备等将其内容全部数字化③。目前,二史馆共收藏有940多个全宗,计180多万卷档案,排架长度达5万余米,绕南京城墙1.5周④,如果将这些档案全部数字化,需耗时20年。
  
  3.检索问题
  档案信息检索是馆藏档案数字化基础工作的重中之重。数字化的馆藏档案,不仅应该是经过系统化整理的,而且是建立了能与全文数字化信息钩链检索的案卷级或文件级机读目录。因此,必须处理好馆藏档案实体整理中的遗留问题,完善案卷级目录的主题揭示和加强文件级目录的编制以及目录数据库的建设。
  
  三、档案数字化对象的界定
  
  民国档案数量浩繁,而资金和人力资源相对有限,档案数字化不可能一步到位。因此,我们应该从实际出发,采取优先原则进行档案数字化⑤。
  一是馆藏珍贵档案应优先数字化。各档案馆都有其最为珍贵的“镇馆之宝”,从保护人类历史遗产和抢救的角度出发,这些特藏应该成为数字化的首选对象。
  二是濒危、经过鉴定确认具有重要保存和使用价值的档案应优先数字化。此举有利于加快抢救与妥善保存这些反映民国时期历史进程、社会变迁等重大历史事件的濒危档案信息。
  三是具有馆藏特色的档案应优先数字化。选择本馆独有、特有的资源进行档案数字化,可以突出自己的特色,实现优势互补和共享。
  四是利用率高、需求大、开放的档案应优先数字化。这样不仅可以发挥馆藏档案的社会效益和经济效益,而且有利于对档案原件的保护。
  二史馆在长期的馆藏建设中形成了自己的核心馆藏,它们形成时间早、影响范围广、使用价值大、利用频率高。早在上世纪六十年代,老一代档案工作者为适应当时形势的需要,从实体馆藏150万卷,700多个全宗的基础上,精心选出74000多卷重要档案。虽然这些档案不能代表馆藏中极具重要价值档案的全部,却是二史馆馆藏最为核心档案的一部分,成为馆藏档案中利用最频繁和最有亮点的档案。我们应该在尊重前人劳动成果基础上,将这些档案优先进行数字化运作。