纸质档案在数字化过程中存在的问题及对策
随着网络和计算机技术的发展,纸质档案数字化已经成为档案信息化建设的重要内容。目前,我馆保存着建校以来大量重要的专门档案,对这部分档案数字化处理显得十分必要和迫切。由于馆藏档案的现状及其受现有资金、技术、设备等因素的影响,我们对纸质档案数字化处理采用了外包的形式,从而达到高效、快捷、共享档案信息的目的。
1 馆藏档案数字化的必要性
1.1 是由纸质档案保管的现状所决定的
陈旧档案老化现象严重,现状堪忧,由于年代久远或保管条件不善等主客观因素的影响,有些档案正受到破坏,处于濒危状态,纸张发黄、老化、变脆,字迹淡化散失、模糊消失等现象严重。因此,要加快对档案实时保护和抢救,尽快实现绝大部分档案的数字化处理。
1.2 是档案管理现代化的必然趋势,具有十分重要的现实意义
实现纸质档案数字化,拓展了档案的利用方式,提高了利用效率,使查档变得更加方便快捷。
有利于档案信息资源共享,快速满足社会各方面对档案利用的需求。节省了档案库房存储空间,能更好的对档案实行保护和利用。
2 馆藏档案数字化外包原因
2.1 是由馆藏档案的数量和档案馆人力所决定的
我馆保存着建校初(1957年)到现在的不同时期数量庞大的各类档案。现今,教学类、科研类、党群类、行政类、照片类、基建类、外事类案卷就有20000多卷,8000多件。对数量如此庞大的纸质档案数字化,仅仅依靠档案馆(我馆仅有5人编制,其中三人是在职培训教育的)的几个人是难以实现的。
2.2 是由档案馆现有的技术设备、资金等条件所决定的
档案数字化缺乏坚实的物质基础和先进的扫描技术设备,基础设施薄弱,仅靠现有的资金、技术、设备远远不能够满足数字化建设的要求。
2.3 专业公司拥有实践经验和及先进的软硬件设备
档案数字化对现代信息数字化处理技术人员需求既迫切又巨大。仅靠档案馆自身难以完成这个需求,专业公司拥有实力雄厚的专业化人才和先进的软硬件设备,专业人员凭借丰富的数字化经验和技术,能够大大提高数字化的质量,加快档案数字化的进程。
3 我馆档案数字化工作业务外包情况
随着时间的推移,纸质档案受到损坏的程度日益加深,对我馆纸质档案进行数字化处理已迫在眉睫。由于档案业务多、数字化任务重,专业人员缺乏,档案数字化工作要依靠自己的力量来完成,效率会十分低下。因此,最好的办法是实行外包,同社会上有实力的数字化公司合作,共同完成纸质档案数字化的处理工作。2004年我馆响应高校档案数字化的要求,为了加快档案资源信息化建设的步伐,购买了世纪科怡档案管理软件,开发并建立了自己的电子档案管理数据库,由我馆工作人员对历年馆藏纸质档案(教学类、文书类等十一个种类)进行了案卷级和文件级的著录,截止到档案数字化工作进行之前,已经完成了近10万条案卷和卷内目录的著录工作,为档案数字化工作初步奠定了基础。2013年我馆与数字化公司签订了外包合同,对重要的、利用率高的馆藏档案(文书类、照片类、外事类、科研类、教学类)进行了数字化扫描、挂库工作,共完成档案数字化近100万页。业务外包总体情况良好,但同时也产生了若干问题。
4 档案数字化建设中出现的问题
4.1 案卷拆装不规范,损害了档案原件
扫描人员在装订案卷的过程中,造成了案卷的混乱。如装订内容前后顺序颠倒,卷内目录丢失,原件纸张受到不同程度的破损原件字迹受到破损。由于穿针引线眼过粗,装订线订掉了半个字,有的直接就把字订没了,对原本需要抢救的档案原件造成了二次伤害。
4.2 扫描内容标准不一,变动较大,档案馆内部意见不一
在纸质档案数字化过程中,制定标准的数字化制度显得尤为重要,因为它是数字化的质量基础。目前,按照国家纸质档案数字化标准«纸质档案数字化技术规范»进行的数字化加工。由于缺乏各类档案具体详细的数字化标准,各馆在数字化过程中经常出现具体扫什么,到底扫不扫的无章可循的情况,针对内容标准问题,馆内各抒己见,难以统一。于是在扫描实践中摸索经验,就会出现扫描内容经常变动、前后不一的现象。如有人认为科研档案的论文不用扫描,理由是这个在中国知网的查新站都能搜索到,个人手中也有备份,馆藏保留有纸质版的,即使不扫利用时也不会出现无处可寻的情况。话虽如此,但也有人认为应该扫描,根据数字化标准的价值性原则:“属于归档范围且应永久或长期保持的、社会利用价值高的档案可列入数字化加工的范围。”如果属于同一案卷内容,只扫描其它的,而不扫论文,数字化后的案卷就失去了完整性,也就失去了数字档案的保管价值。
4.3 扫描的档案图像不完整、不清晰。
4.3.1漏扫、重复扫问题 主要表现在:漏扫档案原件信息,有的只扫了半个档案页面;有的遮字压字,内容没有全面扫描出来,只好重新扫描。
4.3.2扫描的档案页面图像不清晰,如有的页面四周黑边、黑点,有的页面偏斜
4.4 目录数据库与全文扫描数据库挂接速度慢,挂接内容不完整,不规范
4.4.1全文数据漏挂、错挂的问题 主要表现在:挂接不完整,漏挂了档案文件信息。由于数据库案卷和卷内目录较多,挂起来比较繁琐,同一案卷里只挂了前边的卷内目录,而漏掉了后边和和中间的,挂上了常用的,漏掉了重要的。
4.4.2有张冠李戴、挂接不对称的错挂问题 扫描人员为了追求挂库速度而忽视了目录内容,如将不属于该目录的原文挂了上去,而将属于它的原文挂在了别的目录上。
4.4.3全文挂接速度慢 表现在:扫描的图像文件与目录数据库中该文件的档号必须一致,建立起一一对应的关系才能实现全文挂接,但由于我馆的档案管理软件版本滞后,不能快速地批量挂接,特别是文件级的档号,为了保证质量,挂接只能一条条地进行,所以全文挂接工作进行的缓慢。
4.5 档案信息著录不准确、不完整、重复录入现象严重
在档案管理软件系统中,经常有著录信息不准确、不完整的情况,表现在
4.5.1文字录入错误,别字较多 如将“王宏”录成“王红”;只录大标题,不录小标题,如会议性档案材料只录了“会议记录”四个字,而忽略了副标题关于主要内容的录入;著录内容和原始档案信息不对称或不衔接。
4.5.2同一档案信息录入两次 如有的档案信息内容是相同的,录入者在后边加个字符就再次将同样的档案信息录进去了,在检索时就会出现档号不同,内容相同的档案信息。
4.5.3档号录入错误、不完全、不一致 由于录入者粗心大意或片面追求著录速度,著录中漏掉了档案的实体分类号、归档年代、保管期限和录入时间。
4.6 数字化档案的安全性问题
数字化信息的安全保密问题是档案工作的重要内容,纸质档案数字化的各个环节(扫描、著录、图像处理、数据挂接等)及数字档案的管理与利用过程中,都存在档案安全及档案泄密的问题。如数字化工程中的漏扫、错扫,漏挂、错挂,图像处理不当造成的档案失真;数字化加工参与人员访问权限设定的不严造成的泄密;对接互联网由于病毒侵染、黑客攻击造成的数据被破坏、被篡改、被转移;备份不及时造成的数据丢失等。
4.7 数字化档案利用不畅通问题
由于我们购买的科怡档案管理软件版本较低,数据兼容能力和长期存取能力较差,已经远远不能满足数字化建设的需求,随着著录条目和全文数据的不断增加,数据库利用时经常出现缓慢运作的情况。
我馆所用的服务器设备陈旧,运转能力下降,利用中经常突然断网、网络不通畅,这使得数字档案利用效率明显降低。
4.8 数字化档案利用中的法律效用问题
目前,虽然数字化档案具有节省空间,存储量大、利用快捷、方便的优越性,但由于它不具有档案的直接来源特征和法律凭证效应,不能完全行使纸质档案的功用与价值,因而国家对其法律地位尚未确定之前,数字化档案在一定程度上也不能称为真正意义上的档案,不是档案,就没有法律效用,所以在作为法律凭证作用时必须是纸质档案原件。
5 解决数字化过程中存在问题的策略
5.1 制定适合本单位档案数字化的标准
5.1.1内容标准 数字化扫描标准先行,档案数字化标准是数字化建设的规范和有效保障,是稳步推进数字化扫描的依据。而我国纸质档案数字化标准远远不能满足当前档案数字化建设的实际需求。所以在遵循国家纸质档案数字化标准的前提下,结合本馆实际制定了适合本单位数字化的内容标准,以确保馆藏档案数字的质量和效率,主要体现在标准原则上:1. 价值性原则,对具有永久或长期保存价值的、利用率高的教学类、文书类(党群类、行政类)、科研类进行了数字化扫描工作;2. 重点扫描的原则,对学校建设和发展有重大参考和备用价值的珍贵档案进行了重点扫描,如“九五” “十五”期间内蒙古大学“211工程”前三期的国家重点学科建设项目材料、审计报告、评估报告、验收报告等的数字化工作。3. 抢救性原则,受保管条件、保存时间等多重因素的影响,我校建校初到80年代末的陈旧档案出现了纸质变脆、发黄;字迹散失等不同程度的破损情况,给档案保管和利用带来了诸多不便,因而我们尽快对这部分濒危档案进行了数字化处理工作,确保了档案的完整性和长期有效的利用。
5.1.2扫描的质量标准 规范化管理,严格检查,针对扫描中出现的图像模糊、失真、偏斜、不完整、多扫、漏扫等不符合质量要求的情况,档案管理人员要责成数字化工作人员重新进行图像扫描、纠露、纠偏、纠错、拼接、去污处理,以保证扫描的图像文件真实行、完整性、及原件的一致性。
5.1.3挂接全文标准 全文挂接时要坚持准确、齐全完整、可利用性的原则。挂接全文工作是数字化工作的关键环节,是实现数据利用的前提和基础。因而在挂接时必须保证图形文件的质量,确保挂接的图像原文与目标数据库档号目录的一致性,建立一一对应的关系。档案员要监管到位,一对一认真、全面、系统的验收挂接全文的质量,及时排查漏挂、多挂、错挂、不完整挂的隐患,并协调挂接人员进行重挂、补挂工作,以保证挂接档案数据的准确、完整。
5.1.4案卷装订标准 案卷装订要遵循不破坏档案原貌为原则。装订是档案数字化的重要环节,案卷装订的质量直接影响到纸质档案的有效保管、检索和利用。所以扫描工作完成后,拆除装订物的档案恢复装订时,要做到安全、准确、无遗漏、无破损,不能反复拆装、多次拆装,能不拆的最好不要拆,否则档案原貌必定受到损伤。
5.1.5加强档案著录工作的规范化管理 著录工作是数字化扫描工作全文挂接的前提和基础,只有建立科学的著录标准,规范化管理,才能有效推动档案的数字化建设。因而我馆根据实际情况,对著录人员制定了档案数据著录工作标准。在归档年代、档案号、题名、保管期限、录入时间等方面都做了严格、细致的著录规定,使著录工作有章可循。同时,加强了著录者的业务培训,使他们熟悉软件并熟练掌握相关的操作技能,提高了录入工作的业务能力,保证了数据录入的准确性、完整性。
5.2 要加强和重视数字化档案的安全性
由于受互联网和业务外包工作的影响,档案数字化面临着安全保密、原貌失真的风险,因而我们应该树立风险意识,采取相关措施做好安全防控工作。1.建立风险管理机制,将风险思想贯穿档案数字化建设的各个环节,确保档案原件和数字化信息的安全。2.加强数字化人员的安全保密教育工作,与数字化公司签订保密协议,明确安全责任。3.所有安装档案管理软件的计算机要断开互联网,内部组建局域网,切断病毒、黑客的侵袭来源。4.做好扫描数据的备份工作,选用技术成熟和质量可靠的存储介质和设备,做好数据迁移和备份工作。目前的备份方式有离线备份方式,如可以采用移动硬盘异地存储、双套制保管模式(在线电子存储方式、纸质库存方式)。总之要强化数字化各个环节的安全意识,保证各种档案数据的安全性。
5.3 实现档案管理软件和服务器的更新换代
我馆的档案管理软件和服务器版本比较陈旧,在性能和实用方面存在很多问题,因而经常出现档案数据检索、利用不畅的问题,这严重影响了数字化档案的利用效果。目前,要解决此问题,必须实现档案管理软件和服务器的更新换代,以提高档案查找的工作效率。
档案数字化建设工作是一个系统工程,也是一个长期复杂的任务,在数字化的实际操作中会出现诸多问题,我们应该不断从实践中吸取经验教训,加强全方位的管理,促进档案信息化建设的安全化、规范化。现今,我馆纸质档案数字化工作取得了阶段性的成果,这使我校档案数字化管理和快速利用检索变成了现实。