档案之窗

扫一扫关注

当前位置: 首页 » 技术 » 档案信息化 » 档案数字化 » 正文

电子档案文件级目录数据库的设计与实践

放大字体  缩小字体 发布日期:2019-01-11 17:31:34    浏览次数:180    评论:0
导读

一般的观点认为电子档案产生来源有两类,一种是由一般的电子信息系统产生的,另一种是由电子公文系统产生的。前一种电子档案通常是通过纸质档案数字化加工软件生成或缩微胶片转换形成的,后一种是由电子公文系统在线直接归档产生的原生电子档案。

电子档案文件级目录数据库的设计与实践

电子档案的分类

随着信息技术的迅猛发展大量的电子文件产生电子档案的概念也出现在档案工作者的面前从字面理解电子档案就是档案馆接收和保存的有归档价值的电子文件«DA/ T 58—2014 电子档案管理基本术语» 中定义电子档案即具有凭证查考和保存价值并归档保存的电子文件

一般的观点认为电子档案产生来源有两类一种是由一般的电子信息系统产生的另一种是由电子公文系统产生的前一种电子档案通常是通过纸质档案数字化加工软件生成或缩微胶片转换形成的后一种是由电子公文系统在线直接归档产生的原生电子档案后者的管理更多要依靠电子公文系统的设计在文件形成的前端进行控制采集电子文件的元数据最终生成电子档案 这类的电子档案目录数据库的设计更多依靠电子公文系统档案部门通常位于文件生成的后端现阶段不具备对文件进行全程控制的条件

本文主要研究的是第一类电子档案即纸质档案数字化或缩微胶片转换后形成的电子档案为方便表述以下探讨凡涉及电子档案这一概念的均指这类电子档案

电子档案的著录

无论纸质档案还是电子档案这些保存了重要信息的载体能够通过工具检索提取文件中的重要信息资源才能体现档案的价值杂乱无章的文件如何形成井然有序的档案首要工作就是档案的整理归档文件的整理工作主要分为系统化和编目两部分将文件归类和排序是系统化的主要工作编目是指为归档文件编制目录的过程

() 编目和著录

归档文件的编目和电子档案的著录通常被认为是一个类似的概念都是一个动作形成可供检索的目录的过程从狭义上讲二者是同义词广义上编目还包括将著录形成的各条款目按照一定的原则与方法组织成各类目录的过程

对于档案著录的概念1992 年的行业标准«DA/ T 1—1992 档案工作基本术语» 中是这样定义的: 在编制档案目录时对档案内容和形式特征进行分析选择和记录的过程 2000 年颁布的行业标准«DA/ T 1—2000 档案工作基本术语» 中是这样定义的: 对档案内容和形式特征进行分析选择和记录的过程 到了2014 行业标准«DA/ T 58—2014 电子档案管理基本术语» 中的定义: 按标准形式对电子档案的内容结构背景及管理活动进行描述的过程

从对著录概念的变化可以看出不同于纸质档案的著录电子档案的著录还增加了包括结构和背景管理活动等相关内容的描述

() 电子档案的著录

根据我国的«DA/ T 18—1999 档案著录规则» 的要求还是主要应对的是传统意义的档案到目前为止还没有一个国家标准来统一规范电子档案的数据结构在没有行业标准的前提下电子档案的著录通常是依靠档案整理过程中的编目后形成的档案目录通过人工录入的方式将编目完成的纸质目录输入数据库中最终完成目录数据库的建设

如果完全依照«DA/ T 18—1999 档案著录规则» 的要求那么电子档案著录中就会发现以下问题:

与电子档案相关的结构信息背景信息等没有相应项目填写例如电子档案为了便于和档案图像文件挂接需要原文路径项目在著录规则中并没有涉及

符合著录规则的目录项目并不一定完全适合电子档案例如文件的形成时间由位阿拉伯数字组成原时间缺少或字迹不清晰的以“□” 补之电子档案通常会采用位字符不能查考的时间补零而很少使用“□”既不便于检索也会绐计算机系统的开发增加难度

著录规则中的著录项目只是定义了项目的内容和文字要求而电子档案的目录数据库还要求了数据库字段项的格式和长度

通过和传统档案著录的比较我们发现电子档案的著录或者说目录数据库的建库过程除了要满足档案业务的基本规律以外还要符合计算机的语言习惯和数据结构要求

目录数据库的设计与实践

为了适应档案管理现代化的需要完全不同于传统立卷方法的文件级整理方法出台«DA/ T 22—2000 归档文件整理规则» 2000 12 日由国家档案局正式颁布并于2001 日起实施2015 10 25 日又重新修订了该标准颁布了«DA/ T 22—2015 归档文件整理规则»最新标准扩大了标准的适用范围由纸质文件材料扩展为纸质和电子文件材料

电子档案的文件级目录数据库的设计既要与传统纸质档案的编目有差别也要和传统的案卷级档案建库区分开本章将结合中央档案馆在电子档案文件级目录数据库建设过程中的经验详细介绍数据库设计应遵循的原则遇到的问题和解决思路

() 设计原则

档案目录数据库的设计是为了更快捷地查找到要查找的档案资源并且和相应纸质档案建立关联这就要求在数据库设计的过程中要做到和纸质档案的一一对应能够通过数据库快速查找到相应的电子档案图像和纸质档案

符合归档文件整理规则并且做到与纸质档案的一一对应是电子档案文件级目录数据库的重要设计原则

() 详细设计

电子档案的文件级目录数据库的设计主要分为两个部分一是数据库系统的选择二是数据结构的设计

数据库系统的选择

根据档案行业的特殊性在数据库系统产品的选择方面主要有以下几个标准可供参考

() 数据库建设的易用性: 主要指数据库管理语句符合国际标准有面向用户的易用的开发工具

() 数据库管理系统的性能分析: 主要指数据库系统具有性能评估性能监控性能管理等功能

() 海量存储能力: 主要指数据库系统可以支持海量的数据不会影响系统使用的效率

() 并行处理能力: 主要指支持多用户并发

() 可移植性和扩展性: 主要指数据库系统迁移的能力

() 并发控制: 数据库系统支持多CPU 模式

() 安全性: 主要指数据库系统具有账户管理用户权限网络安全控制等功能

() 对汉字的支持: 主要指数据库描述语言的汉字处理能力和数据库开发工具对汉字的支持能力

能够较好地满足上述标准的数据库系统都可以成为电子档案数据库设计的载体目前市场上主流的数据库产品也都具备这些能力 随着我国数据库技术的发展越来越多的国产数据库产品已经在档案行业得到了很好的应用虽然在稳定性通用性等方面与国外主流数据库还有差距但已经具备了在档案等领域的应用基础甚至在安全性和本土化方面可以更好地满足档案业务的需要

数据库结构

选择了适合自己业务需要的数据库后就要开始目录数据库的建库过程文件级目录数据库的数据结构主要由几类目录数据构成结合档案著录规则将文件级目录数据结构分为以下每项分为若干小项

() 编号项: 主要包括序号全宗号机构(问题) 代码机构(问题)件号档号

() 题名与责任说明项: 主要包括题名文号责任者

() 密级与保管期限项: 主要包括密级保管期限

() 时间项: 日期年度

() 备注项: 备注

() 其他字段: 页数盒号原文路径保管单位

以中央档案馆在用的文件级目录数据库格式为例共有18 个字段项这些只是最基本的字段项在实际应用中数据库字段项不仅限于此目录数据库结构和字段项要求如表所示

以下详细介绍几个重要的数据库字段项

() 档号

整个目录数据库的核心字段项即档号档号由全宗号年度机构(问题) 代码和件号拼接而成通过该字段可以准确了解一件档案在一个全宗内的相应逻辑位置由档号和页数组成的原文路径字段标示了文件在磁盘中存放的物理位置档号可以关联起纸质档案和电子档案是档案中不能重复的重要标示电子档案中为了排序的需要档号是一个定长的字段项件号会在相应的位置补零这一点和纸质档案目录还是有区别的

() 时间项

时间项主要有两个字段日期和年度日期即文件的行成时间字符型由位阿拉伯数字组成在时间不可考的情况下补零年度是文件形成所在年度字符型由位阿拉伯数字组成时间项中采用字符型而没有使用数字型或者日期型是由于档案的特殊性很多历史档案的年代不详一般情况下会著录成“0000”如果使用数字型或者日期型的字段项就没有办法记录这样的数据

() 其他字段

在档案著录规则中没有涉及这一部分的内容主要有盒号原文路径等字段盒号是立卷改革后形成的文件级档案装盒后为了便于档案保管员快速找到相应纸质档案的物理位置设定的原文路径如前文所述是电子档案存放在存储介质内的相对路径

通过这些数据库字段项可以看到电子档案文件级目录数据库结构既满足了归档文件整理规则中编目的要求也体现了电子档案在实际应用中的特殊性为了满足通用性的要求和大多数档案馆档案室的使用便利数据库结构中并没有设计载体类型电子文件格式等字段另外这个目录数据库的设计是为了符合中央档案馆的业务需要仅仅是针对文书档案的管理没有照片档案音视频档案的相关字段项很多辅助的检索项也没有列出如主题词等

对于不同的业务需要数据库设计中应该有相应的调整增删字段项没有一个目录数据库的设计可以涵盖所有的档案类型片面追求大而全的数据库结构只会加重档案业务系统的负担在数据库设计中应当根据业务需要有的放矢做到专而精就好

结论

本文在电子档案文件级目录数据库的设计过程中介绍了电子档案的定义和分类阐明了电子档案的著录和归档文件编目的关系通过实际的应用详细研究了电子档案文件级目录数据库的设计

面对当下这个信息资源如此重要的时代大数据云计算等最新技术如何应用到档案行业关键取决于电子档案的采集管理和应用仅仅依靠纸质档案数字化转换生成的电子档案无法为数据挖掘提供有效的数据基础随着电子公文系统的广泛应用将会产生更多的原生电子档案这类电子档案从合法性真实性有效性完整性等方面还有大量的问题有待档案工作者解决只有加快电子文件和电子档案的标准制定和立法使更多的原生电子档案得到收集管理和应用存量档案数字化增量档案电子化才能让档案信息资源搭上移动互联的快车更便捷为社会所服务


 
(文/小编)
免责声明
• 
本文为小编原创作品,作者: 小编。欢迎转载,转载请注明原文出处:http://www.dawindow.com/tech/201901/5137.html 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们kf@dawindow.com。
 

Copyright © 2018 档案之窗(dawindow.com)     深圳司捷科技有限公司    版权所有       粤ICP备18047471号-1