档案之窗

扫一扫关注

当前位置: 首页 » 技术 » 档案信息化 » 档案数字化 » 正文

数字化时代下的民国档案目录数据库

放大字体  缩小字体 发布日期:2019-01-11 17:29:27    浏览次数:52    评论:0
导读

中国第二历史档案馆(以下简称“二史馆” ) 正如火如荼地开展的民国档案数字化项目,始于2009 年,历时10 年,目前基本实现既定目标。这一浩大而又系统的档案数字化工程,包括数字化前整理、扫描、缩微、质检、验收等十余个环节。

数字化时代下的民国档案目录数据库

中国第二历史档案馆(以下简称二史馆 ) 正如火如荼地开展的民国档案数字化项目始于2009 历时10 目前基本实现既定目标这一浩大而又系统的档案数字化工程包括数字化前整理扫描缩微质检验收等十余个环节数字化前整理工作是民国档案数字化工程的基础环节通过这一环节对馆藏200 余万卷合计约2 2 亿页画幅馆藏档案依据档案整理的基本原则程序和方法进行了案卷级整理基本实现了档案实体数字化其数据加之原有目录信息为建立全国乃至世界最大的民国档案目录数据库奠定了良好的基础但是数据库如何依托借助大数据技术进一步发展使功能更加齐全数据范围更加广泛内容更加深入从而快速而准确地提供民国档案信息实现档案信息资源共享是我们需要思考的问题

二史馆原有目录数据库概况

二史馆经过多年目录建设初步形成了馆藏档案目录体系建有套目录数据库

分类目录数据库1993 年开始建立的为了适应机器检索要求而编制其总量目前为130 余万条这是按照«民国档案分类表» 进行的以分类标引为主主题标引(即人名地名机构名) 为辅的机检目录

这套目录打破了全宗概念提供了多途径的检索入口其目录的栏目有:全宗号案卷号案卷题名案卷起止年月分类号主题词(人名地名机构名)

案卷目录数据库1994 年始建其总量约150 万条它是替代书本式的机检案卷目录按全宗顺序排列但存在缺乏分类和主题检索新近整理的全宗目录尚未收入不少案卷标题过于简单等问题其目录的栏目有: 全宗号全宗名案卷号案卷题名案卷的起止年月等

馆藏档案库位数据库是二史馆馆藏档案存放的库位表它是档案调出归位的依据其目录的主要栏目有: 全宗号全宗名称案卷号存放位置(位号)保管责任人排架长度起止案卷号案卷的存在状态(移交改重原缺等)案卷的自然状况(是否破损)

套目录从不同的角度满足了一定时期二史馆档案利用和管理工作的需要但由于分属于本馆个部门且档案处于不断的变化之中如档案重新整理等使各种目录处于动态管理之中因而在经过了一段时间之后目录数据与档案实体、3 套目录数据之间不尽一致使馆藏档案和目录的统计各不相同按照档案目录数据库对数据的要求如目录的变化使用状况等诸多内容则需要加大补充加之机读目录和手工目录存在着很大不同尤其目录数据库是按照一定要求编制有很强的技术性数据库建成后宣传不够使用受到限制对照目录数据库的各项要求在实际工作中套目录各自都存在不尽如人意的地方加之当前数字化网络化以及应用档案数字化的成果亟需进行发展改进和完善以适应大数据时代下之要求

完善目录数据库建设的必要性

大数据时代下各种数据必须符合规范全面创新发展等要求对于档案馆来说目录数据库是档案馆自动化数字化的实质内容和处理对象而目录数据准备多样化才能适应大数据各类数据之要求因此馆藏目录数据库从当今社会需要档案现状以及技术要求等方面看更应完善和扩大其功能

() 从社会需要上看

在今天的知识经济数字时代下社会对档案的需求日益增长民国档案备受各界欢迎和重视被查找的范围越来越广利用亦愈加深入二史馆作为保管民国档案的重要基地必须有所作为而开展馆际间档案信息的交流实现全国乃至世界范围内的民国档案资源共享也早已提上日程如随着民国档案目录中心全国民国档案全宗级目录数据库的建成和全国民国档案案卷级目录数据库的在建馆藏文件一级的目录数据也将为建设全国民国档案文件级目录数据库创造必要的条件实际上英国2012 年就已建立了基于互联网以国家档案馆为骨干国内其他2500 余家档案馆参与的全国性馆藏开放档案目录在线咨询的探索服务平台目录信息就达1000 余万条

() 从档案现状上看

民国档案数量浩大经过几代档案人的辛勤劳动大规模的整理工作基本结束已实现档案有规可循有目可查几年前利用馆藏案卷目录建成案卷级目录数据库并提供利用完全必要但目前目录数据已经满足不了现状一是案卷级数据概括性强难以准确反映其档案内容二是档案中很多重要信息还藏于案卷中未被开发只有深入文件一级才能揭示三是案卷级中有不宜开放的档案只有揭示到文件级才能区分随着档案数字化的进程日益加快(目前馆藏近/的档案已经数字化)并深层次地开发文件一级的档案信息达到文件级甚至档案全文信息检索都需要完善馆藏目录数据库并扩大其功能

() 从技术要求上看

建立和完善目录数据库是开发利用民国档案信息资源实现计算机网络技术在档案信息管理中的应用最终实现档案管理现代化计算机存贮和检索档案信息是档案现代化管理的重要标志计算机网络技术在档案信息管理中的应用已成为档案管理现代化的重要基础设施如今信息技术计算机网络技术日新月异突飞猛进档案馆自动化数字化已成现实完善馆藏目录数据库已不会再像当时建立案卷级目录数据库那样受到技术设备等条件限制如数据库库内容量字段字节等等目前馆藏目录数据库数据再多容量再大等已不再成为技术问题完全可以满足不同利用者从各个检索角度提出的查询要求同时可以应用计算机先进技术扩大其功能快速准确查找所需任何内容

改进和完善目录数据库之要求

要实行计算机检索档案实现档案信息的网络化就必须解决数据库及数据的标准化规范化达到目录数据库的资源共享并注意档案数据的安全性最终基于互联网实现数据库网络化

() 目录数据库必须标准化

«中华人民共和国标准化管理条例» 指出: 标准化是组织现代化生产的重要手段是科学管理的重要组成部分在社会主义建设中推行标准化是国家的一项重要技术经济政策 这充分阐明了标准化的地位和作用因此今天的目录数据库标准化的规范体系显得尤为重要同时也是档案馆数字化建设高质量的坚实基础注重其标准化规范化包括两方面的含义: 一是指为适应目录数据库发展需要而制定的有关原则与方法的确切表述和具体规定它包括专业名词术语标准代号代码标准著录标准标引语言标准等二是在档案馆网络建设时要充分考虑硬件的选型软件的配置数据库的标准格式和信息传播的方式等不然将造成不必要的人物的浪费进而影响档案馆自动化数字化的进程二史馆制定了档案数字化前整理编目的相关业务文件民国档案数字化前整理规则” “民国案卷标题问题及处理方法” “案卷审查要求” “民国档案案卷标题修正案例解析以确保数字化前整理编目工作对其数据的标准化和规范化也必将为下一步制定文件级目录数据打下良好基础

() 目录数据库的资源共享

目录数据库的建设最终目标: 一是目录的管理二是实现资源的共享实现资源共享这是在数据标准化和网络化的整体基础上实现的共享性要求网络中各保管民国档案的档案馆都要建设具有自身特点和地域特点的目录信息数据库作为网上信息资源的补充二史馆目录数据库尤为重要

所谓共享性原则是指进行数字化的目录数据应是可以公开提供利用的可以凭借网络技术实现档案信息资源的零距离利用和社会共享为此必须经过档案的开放鉴定及最大限度地扩大馆藏档案信息资源的共享范围数字化的数据范围不仅包括开放卷而且应延伸到控制卷中可以开放的文件只有这样目录数据库数据才能成为公共信息资源的重要组成部分凭借社会化的信息技术适应国家改革开放和经济全球化的需要实现民国档案依法开放和信息资源共享的最终目标英国国家档案馆的搜索平台自开放年来就为社会发布了3000 余万条目录信息提供了1 44 亿件历史档案为民国档案目录数据库的信息资源共享提供了有益的借鉴

() 注意目录数据的安全性

一个高质量的目录数据库的数据信息更要注意其安全性安全是目录数据库建设中一个不可忽视的重要方面数据信息对安全保密有严格的要求有相当一部分数据信息是需要控制使用的所以必须采取一系列措施保证数据信息的保密和安全通常采取的措施分为制度管理(经过对档案的开放鉴定凡涉及国家机密和个人隐私及影响社会稳定民族团结国际关系的档案不予提供) 和技术保证(相应的技术措施进行自动控制对馆内馆外不同利用者根据权限提供数据信息) 两类最终确保目录信息的保密和安全

() 实现目录数据库网络化

二史馆数据库网络化的应用格局是: 目录数据库实现在馆局域网中流通和利用并依托馆局域网加强档案利用服务窗口建设完善本馆档案目录建设借助互联网推进档案信息网站建设做到标准统一功能完善安全可靠利用方便力争建立以本馆档案为骨干国内乃至有关国家地区保存民国档案的档案馆参与的馆藏民国档案开放目录数据库以实现全球民国档案信息资源共享为最终目标

总之二史馆目录数据库特点应是: () 馆藏各类目录数据的高度整合集全宗案卷文件等信息于一体实现一站式档案信息检索同时也是档案调出归位等实体管理的依据() 按照«民国档案分类表» 进行的以分类标引为主主题(关键词) 标引为辅的数据信息导航功能() 设有包括档案全文信息检索在内的众多检索入口利用者可以通过某个检索入口进行初级检索也可以运用灵活的方式进行提问式检索等高级检索() 具有利用连接功能除了掌握目录利用情况还可知道利用者对目录利用后的反馈信息() 除满足利用者从不同的角度查找所需的任何内容还可根据需要打印完整的全宗目录案卷目录文件目录各种专题目录及至原始档案版面不失真的显示与打印() 保证数据库内的每个数据都有清晰的利用者使用权限() 多样化的目录形式随时公布目录的更新与开发信息满足不同类型不同行业不同规模利用者个性化的信息需求() 遍布全国和海外的民国档案目录数据交换服务中心配上常年的利用者培训与高效的技术支持

完善目录数据库之具体做法

一个高质量的数据库除了系统先进利用方便外其中的目录数据至关重要至少应达到以下质量标准: 第一数据的准确性第二数据项目和内容的完整性第三数据的规范性第四数据的稳定性

目录信息必须按照职能划分由职能部门负责目录数据也应由职能部门人员进行增删修改职能部门负责目录管理的主要工作内容应是: 保持全馆各种目录的完整性正确性负责馆内部计算机局域网中机读目录数据库数据的变更在目录数据发生变更的时候及时更正审查校核保管并提供馆内的各类目录如案卷(文件) 目录专题目录等提前介入对馆藏档案信息的进一步开发并对其实行全过程跟踪服务及时修改更新档案目录制作保管并及时更新档案目录信息的备份数据随时公布目录的更新与开发信息完善馆藏档案全宗变动历史情况的全宗目录等等

为完善馆藏目录数据库方便在馆内局域网甚至互联网上提供服务并为下一步文件级和案卷级目录数据于一体的目录数据库打下基础还需做如下工作:

() 尽快开展文件级著录工作

民国档案数字化前整理工作完成或即将完成之时应尽快开展文件级著录工作第一充分利用已有数字化成果直接在计算机上对画幅进行操作切忌再利用档案原件第二更新开发制作适合文件级著录的软件如灵活编辑画幅抽取所需关键词等软件第三结合以往文件级著录的经验集思广益制定文件级著录规范应在«档案著录规则» «民国档案著录细则» 的基础上制定适合本馆甚至全国保管民国档案的档案馆实际的«民国档案文件级著录细则» 等一系列规范规则指导文件级著录工作

文件级著录工作依然采取如档案数字化前整理业务外包形式首先可以加快文件级著录工作进度其次可以提高文件级目录制作质量当然业务外包具有诸多优点但应从档案法律法规的高度制定规章确保外包公司认真履约严格监督外包公司的档案安全和信息保密工作

() 应用软件的不断升级更新

随着计算机技术的不断升级从技术上随时要求扩大数据库功能增加数据库内容及时更新各种管理利用信息连接等项功能的设置编制帮助利用者使用数据库数据的利用介绍查询指南根据利用者查询频度和意见反馈不间断推出热门档案等栏目以及配合国家和社会重大活动开展的定题服务抗战七十周年”、“红军长征八十周年等纪念活动实时推出对利用者有所帮助的实用小工具软件都将使馆内外利用者使用数据库更加便捷

() 对档案实行划控

按照«民国档案案卷级目录整理与划控工作规范» 及中央档案馆国家档案局相关标准对数据库数据进行全宗级划控对整个数据库中不同全宗涉及控制范围的案卷和文件也进行划控并按照利用者权限决定开放与否

() 改善目录状况

目录数据库逐步建全完毕后形成一套馆藏档案按全宗自然顺序排列的案卷文件目录即馆藏账本式目录一套馆藏档案开放目录以适应不同利用者需要

该项工作只有领导重视群策群力始终将此作为档案馆实现自动化数字化的一项重要工作来抓从而实现民国档案信息资源共享的最终目标


 
(文/小编)
免责声明
• 
本文为小编原创作品,作者: 小编。欢迎转载,转载请注明原文出处:http://www.dawindow.com/tech/201901/5135.html 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们kf@dawindow.com。
 

Copyright © 2018 档案之窗(dawindow.com)     深圳司捷科技有限公司    版权所有       粤ICP备18047471号-1