档案之窗

扫一扫关注

当前位置: 首页 » 技术 » 档案信息化 » 档案数字化 » 正文

当前档案信息数据库建设的关键问题

放大字体  缩小字体 发布日期:2018-12-24 17:36:55    浏览次数:61    评论:0
导读

明确建设档案信息数据库是单纯为了检索的需要,是建立档案信息管理系统的需要,还是建立文档一体化管理系统的需要;是为了若干个机构联合建立目录中心的需要,还是当前要加入某个联机检索数据库的需要。

当前档案信息数据库建设的关键问题

(一)明确数据库建设目的

对于档案信息数据库建设,首先必须从技术上明确建设的目的。明确建设档案信息数据库是单纯为了检索的需要,是建立档案信息管理系统的需要,还是建立文档一体化管理系统的需要;是为了若干个机构联合建立目录中心的需要,还是当前要加入某个联机检索数据库的需要。目的不同,相应的数据库管理系统的选择、结构的设计、字段项的设计都会有很大差异。

以“军档工程”为例。从宏观上看, “军档工程”主要由两个大的分支网络系统构成。一个是档案事业管理信息网络系统。它主要用于管理除档案实体信息之外的其他诸类综合信息,如档案数量统计信息,档案部门人员情况信息,档案科技成果管理信息等等。另一个是档案信息网络系统。它主要用于管理全军档案目录、全文、多媒体等实体信息,实现数据共享。这两大系统结构功能不同,使得系统内部的信息流也分为两类。一类是档案事业综合信息流,另一类是档案数据信息流。数据信息流又可按不同的方法分为公文档案信息、科技档案信息、专门档案信息等。每一类信息都有各自的特色与结构,数据库设计的内容各不相同。

再如中国人民解放军档案馆要建设全军统一的联合目录中心,就必须统一数据库的字段设置,实现不同数据库之间数据的转换。再比如在美国,越来越多的档案馆馆藏信息加入到国际联机检索系统中。近百个档案馆将许许多多的全宗和收藏加入研究图书馆信息网络系统(RLIN) 及联机自动化图书编目系统(OCLC)。这些系统数据库是依据图书馆关于著录种类的假设,所以不能适合所有的档案目的。

(二)实现馆藏档案目录数据库建设

各档案机构一般都把馆藏档案目录数据库的建立作为数据库建设的第一个目标。对正处在信息化建设发展初级阶段的大多数档案馆来说,信息化建设的切入点和工作重心,首先是抓好目录数据库的建设。馆藏目录数据库可以比较全面地反映馆藏档案信息,有助于实现全方位的、动态的、完整的档案信息服务。如湖南省档案馆要求建立档案目录数据库。重点是案卷级、文件级和专题目录的输入。他们制定的目标是:人均每天至少完成200条;11台计算机半年完成25万条以上;完成明清、民国、革命历史档案三个目录数据库的建设和上报工作;完成建国后档案案卷级目录的输入、打印及装订;开展文件级或专题目录的输入。再如安徽省档案馆继1999年在省直机关启动新一轮到期档案进馆工作以来,2000年度再次接收省计委、省人行、省委统战部、省委讲师团、省机械局、省电子局、省建材局等7家单位的100018卷档案及配套的检索工具进馆,同时上述单位按统一软件录入的机读文件目录193240条亦同步进馆,并入省档案馆文件目录数据库。馆藏档案目录从传统的纸质载体到数字化信息的转变,是一种对传统模式继承发展的过程,更是一种拓展应用空间和范围的质的升华和扬弃。由此馆藏档案目录数据库的建立成为传统档案工作向现代化档案工作转型的标志。

在馆藏档案目录数据库建立的基础上,可以考虑建立档案目录中心。国家档案局已建立全国明清档案目录中心、全国民国档案目录中心、革命历史档案资料目录中心。中国人民解放军档案馆要建设成为全军统一的联合目录中心。各地方档案机构可以加快建立本地区的档案目录中心,实现一定范围内档案馆馆藏内容互补和档案信息资源整合,更大限度地发挥档案效益。

(三)建立特色档案信息数据库

在网络环境下,重复的信息没有任何意义。在档案信息数据库建设过程中,要避免信息的重复建设。各类档案馆及其各级管理机构,有着各自的任务与特色。各个层次、各种类型的档案机构只有形成各有特色、互不雷同的档案信息数据库,网络才能真正成为档案信息资源的宝库。

1998年国家据 档案局统计,省级以上档案馆馆藏中包括许多具有地方特色、民族特色的档案。如:甘肃的敦煌遗书档案、秦汉简牍档案,云南的多种民族档案,贵州的红军转战贵州档案,重庆的“陪都档案”,四川的巴县清代档案,青海的唐前期“谨封”铜印,明代诰命和金书铁券档案,西藏的元、明、清档案,宁夏的西夏档案等。其中四川省档案馆就在网络中发布了巴县清代档案。这些独具特色的档案是中华民族宝贵的历史文化遗产,具有无穷的魅力。

档案部门还可以通过网络,针对某一专题提供广度和深度上的服务,建立专题档案信息数据库,扩大利用者对档案信息的占有程度,提高服务质量。例如就当前中国西部大开发、文化遗产保护、城市环保、大气污染、北方的沙尘暴等一些热点问题,建立专题档案信息数据库,将档案信息经过合成、整序、转换成专题档案信息资源,为利用者提供定向专题档案信息服务。这样既提高档案信息的价值含量,又能为社会提供档案信息的增值服务,深化数据库建设深度。笔者曾在网络中访问到一个名为“拉萨档案”的数据库①,它是由西藏文化发展公益基金会(THF)提供的。这是一个民间的、非赢利性的国际组织,主要从事西藏文化遗产,尤其是西藏传统建筑的保护工作。其档案数据库包含有多种照片、测量图及建筑平面图。为推广和进一步研究西藏建筑艺术及保护拉萨城的宝贵遗产奠定了资源基础。其未来发展计划还将提供更多可供在线查询的照片和建筑平面图。这样一个档案数据库,为相关的专业人士和对西藏文化感兴趣的非专业人士提供了丰富而生动的信息。各个档案馆几乎都拥有自己的特色馆藏,如果能将这些馆藏信息建成一个或多个颇具特色和规模的数据库,为利用者提供高效的信息服务,将是我国网络档案信息资源建设的特色所在。

(四)丰富档案信息数据库内容种类

国际上通常根据数据库内容将数据库划分为三大类:参考数据库、源数据库、混合数据库。参考数据库是指各种档案目录数据库、内容摘要数据库等以二次档案信息为内容的数据库。其作用在于指引利用者找到相应的档案信息源,也就是原始形态的档案文件,包括传统载体的档案原件及电子文件,从而满足其检索要求。源数据库包括数值数据库、图像数据库、术语数据库、文本数据库、全文数据库等形式。这些形式的共同特点是库中的数据都是一次档案信息,直接提供利用者要求获取的数值、文本或事实。利用者可直接从中利用自己所需要的档案信息,如查看档案全文,检索档案原文中的任何字句。混合数据库是指数据库中的内容采用多种表现形式。档案信息有文本型、数值型、图片型、声音型、影像型等各种形式,混合数据库就是将文本、数值、图形、音像等形式结合在一起的多媒体数据库。这种数据库的内容不仅是静态的文本、数字或表格,还可闻其声、见其形。这类数据库是多媒体技术发展的产物。

由于还处于信息化建设发展初级阶段,我国的档案信息数据库绝大部分是参考数据库,即目录数据库等。源数据库如全文数据库、图形图像数据库数量较少,混合数据库更少。诚然,参考数据库也能为利用者提供必要的服务,但仅仅依靠二次档案信息是无法满足利用需求的,因此要加强源数据库建设,大力开发档案文献全文数据库。目前在档案全文信息的开发利用受诸多因素限制的情况下,可以对档案深加工后的各种信息建立编研成果数据库。另外还要注重开发多媒体数据库等混合数据库。

(五)遵循数据库建设的标准与规范

标准化是高质量数据库建设的重要组成部分。遵循标准化建设的数据库系统成为开放系统(OpenSystem),不仅在软件和硬件上可以兼容,更使数据的共享成为可能,极大地方便用户使用。标准化已成为高水平数据库的标志之一,并与其效益直接联系起来。在档案信息数据库建设中的标准化,主要是指档案信息前处理过程中进行数据标引、加工的标准化,如制定《文书档案目录数据库结构与著录格式》等。

在标准的实施上要注意与国际接轨。现在各国新开发的数据库,都比较注意采用国际通用标准。而我国数据库建设尚未实行统一的标准,更没有注意与国际标准的接轨,这在一定程度上限制了国内和国际间的数据共享,影响了效率和效益。

(六)注重数据库的内容质量

我国与国外一些技术较为先进的国家相比,网络档案信息数据库无论在深度还是广度上都存在一定的差距。

广度方面主要是指数据库在档案工作中的应用范围和数据收录范围。我国数据库在档案工作中的应用起步较晚,应用范围还不是很广泛。真正网络意义上的建库大概始于1998年左右。由此造成了数据收录范围还不广泛。数据收录范围是评价数据库质量的首要指标,关系到数据库是否能全面满足利用者的检索要求,是取信于利用者的基本前提。在数据库广度方面的建设质量取决于长时间的积累,而我国基本数据的积累目前可以说还在从零开始。基本数据的准备是数据库建设也是信息化建设最基础的工作,而做基础工作是没有捷径可走的。网络档案信息服务要想走得远、走得好,必须打好数据库的基础。

深度方面主要是指著录标引的深度、数据的准确性、数据库更新的及时性等。著录标引的深度是指对档案信息特征揭示的充分程度。著录标引越充分,就越有助于利用者判断档案的价值及其切题程度,从而帮助他们迅速准确地找到自己所需要的档案。数据的准确性主要是指数据库中收录的数据是否准确可靠,这是保证档案检索系统检索效率的重要因素。数据不准确,可能会导致利用者对数据库的彻底否定。另外数据库更新要及时,数据库更新的时差越短,其价值就越大,这对于现实效用较强的科技档案尤为重要。

我国与国外档案信息数据库存在差距的主要原因是以往我国社会总体意义上的数据库建设起步较晚、经验不足、缺课太多,直到今天还缺乏相对成熟具有竞争力的数据库。我国网络中档案信息数据库很少,数据库中的信息量很少,而每一条记录所含的著录信息更少(除了档号、题名、年代之外,其他著录项很少著录)。因此,必须注意加强数据库的内容质量。在当前大力开展数据库建设的时期,必须扎扎实实,从头做起,避免追求速度的“短平快”建设,保证数据库建设质量。这其中一定要把握住的信念就是质量胜于数量,深度胜于广度。在网络环境中,每件事情都成了“信息”,而信息数量的增长并不一定等于信息质量的提高。在网络中扩展信息的数量和广度较为容易,加强信息的深度就必须加强专业建设。信息的广度可以叠加,深度则必须通过专业研究来实现。因此,对于网络数据库建设做广容易做深难。建设网络档案信息资源,必须在专业上下功夫,对信息的深度进行开发。

(七)重视检索技术

随着数据库应用的变化,对数据库的使用要求也在发生变化。以前,信息系统的主要问题是如何把数据更好地存入数据库,而现在,寻求一种更好的方法,将数据从数据库中提取出来成了主要问题。检索技术成为数据库技术中一项至关重要的技术。档案信息数据库要上网发布扩大使用范围,必须重视检索技术,配备相应的高效的检索系统。


 
(文/小编)
免责声明
• 
本文为小编原创作品,作者: 小编。欢迎转载,转载请注明原文出处:http://www.dawindow.com/tech/201812/4911.html 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们kf@dawindow.com。
 

Copyright © 2018 档案之窗(dawindow.com)     深圳司捷科技有限公司    版权所有       粤ICP备18047471号-1