濮阳市档案局 刘东斌
[摘 要]:数字档案馆是数字信息时代档案传递和利用的新途径。数字档案馆与传统档案馆相比有着极大的优越性,然而它也存在着不少缺陷。在数字档案馆的建设中面临着诸多不容乐观难以解决的问题,对此我们要有清醒的认识。本文提出了数字档案馆建设所面临的10个方面的问题。
[关键词]:数字档案馆 问题
随着现代信息技术的迅速发展和大量电子文件的产生,数字档案馆的研究和建设成为我国档案界关注的热点。数字档案馆与传统档案馆相比,有着丰富的数字化资源、海量的存储、便捷的检索、快速的传输、高度的开放、信息的共享等优点,使传统的档案馆望尘莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我们应该清醒地认识到数字档案馆存在的缺陷,数字档案馆的建设还存在着诸多的难点和问题亟待深入研究解决。如果对存在的问题视而不见,或掉以轻心,必将给未来的档案事业留下巨大而无法弥补的遗憾。
1、数字档案的凭证价值问题
档案的基本价值有两方面,凭证价值和参考价值,而尤以凭证价值最为重要。虽然,“目前人们对数字化档案具有参考价值这一点已无疑义,然而,由于一系列技术和立法问题还未解决,数字化档案目前还不具备法律凭证效力”⑴这无疑使数字档案的作用大打折扣。因此,确认数字档案的凭证价值就成为数字档案馆建设中无法回避的难题。目前,主要存在以下几方面的问题:
1.1 认识上的问题。数字档案不具备“白纸黑字”的直观性,必须依赖特定的计算机设备加以解读。数字档案完全脱离了以往人们对档案“原件”的认识,从而引起人们对其原始性、可靠性的怀疑。而且,有些数字档案即使载体保存完好,内容亦可能在无形中丢失,它不像纸质档案那样载体与内容“一损俱损,一荣俱荣”。数字档案与以往其他载体的档案都不一样,从甲骨档案到简牍档案再到纸质档案,只是载体的耐久性有差别,并没有改变其直观性,而数字档案的非人工识读性与其他载体的档案有着质的区别。要确认数字档案的凭证价值,恐怕不仅仅是改变观念的问题,要真正认识数字档案,确认其凭证价值,可能还需要走很长的路。
1.2 技术上的问题。数字档案是高新技术的产物,它给人们带来极大便利的同时,也给人们留下了困惑与难题。其一,数字档案具有易复制、修改、删除的特点,使得档案“原件”的概念变得难以确认。其二,计算机硬、软件技术不断更新换代,迫使数字档案必须不断适应新的“生存环境”,不断地变换载体、格式,因而无法通过载体、格式的鉴定来判定其原始性。其三,数字档案不再具有特定的字迹,人们可以根据需要以不同的字体、字号将其输出,传统的字迹鉴定技术无法分辨数字档案的原始性。其四,数字档案对背景信息和元数据具有很强的依赖性。“电子文件的背景信息常常与文件内容信息相分离保存,一旦失去背景信息,文件的内容即便仍有意义,但也不再具有凭证价值。元数据是电子文件、电子档案所特有的,“元数据由于其隐含性而易被忽视,而元数据一旦丢失或破坏,电子文件的原始性就会改变。”⑵
1.3 管理制度上的问题。“传统档案之所以具有凭证价值,在一定程度上取决于严格的管理制度”,而目前“从电子文件的生成到归档都缺乏十分规范的程序化管理,缺乏严格而科学的标准体系和业务管理制度,一些标准、制度虽已制定,但全面推行尚需时日”⑶而且也有一定的难度。
2、数字档案信息的长期存取问题
数字档案信息的长期存取问题是数字档案馆建设的一个具体而又棘手的难题。“据报道,美国航空航天局在20年前发射的‘海盗’号火星探测器上的计算机中,已经有20%的数据完全丢失,还有大约4000卷的统计数据因存储的格式模糊无法读出,程序员也无法保证将其恢复”。⑷数字档案信息长期存取所面临的主要问题有:
2.1 存储的介质材料。“现代介质的存储设备还不可能解决计算机数据存储问题”。⑸一般说来,磁盘的寿命是3?5年,光盘也不过30年左右,与能保存千年以上的纸质载体相比,其寿命相差甚远,而且它还要受到温度、磁场、记录存储格式、硬件配置等多方面的影响,10年前还经常使用的5.25英寸的软盘,现在已经没有一台普通电脑可以读出来。
2.2 机读语言格式。“计算机语言平均每三个月就会问世一种,而语言之间的互换大部分存在问题。很难想象,若干年以后,我们用现行的机器语言描述的数据,还能百分之百的还原”。⑹
2.3 对设备的依赖。数字档案必须依赖于计算机设备才能读出,这个特征对其长期存取带来很多问题:“如设备发生故障、系统瘫痪,电子文件就读不出来;电子文件对其它设备环境的不兼容性,使其只能在某种设备上处理,而不能在其它设备上处理;不同软件环境形成的电子文件存贮在载体上,有时难以互换;电子文件加密后,不解密就无法识别;技术设备更新时,不及时解决格式转换问题,也无法读取等等”。⑺
3、数字档案的失真问题
“档案数字化工作的生命线在于其能够保持档案原貌”。⑻然而,“就目前的研究水平而言,还难以保质保量地完成馆藏档案数字化的任务。如已研制出的OCR扫描输入技术,其平均识别率是95%。这对于追求最大程度真实性的档案来说无疑是致命弱点”。⑼数字化的主要方式是扫描加工,在这一过程中造成数字档案失真的原因还有以下几个方面:其一,技术参数选择不当。针对不同色调、纸质和字迹,有时需调整不同的技术参数,如分辨率、明暗度、对比度等,选择不当会直接影响扫描的质量,造成信息丢失、图像模糊或产生额外信息,客观上造成档案原貌的改变。其二,工作失误。档案扫描是大量的重复劳动,难免有时失误。如扫错档案或打错顺序,或存错,或在建索引时链接错误等,如不及时发现,将直接导致数字化档案失真。其三,转换过程中的失真。在进行数字档案的迁移或在提供利用时,往往需要将扫描后形成的图像文件转换成另一种格式的文件,如果格式选择不当,同样会导致数据发生变化。
4、数字档案信息的安全问题
安全问题是计算机网络世界最为头痛的难题,也是数字档案馆中的重大难题之一。数字档案馆虽然被称之为“馆”,但它的存在更仿佛是一个巨大的没有警察的自由市场,给不法分子带来可乘之机,主要表现为:其一,计算机病毒。网络信息安全的最主要的敌人就是计算机病毒。“国外有人估计,现在计算机病毒的传染每两个月增加1倍。网络病毒的泛滥已对计算机网络系统构成严重的威胁”。⑽其二,计算机黑客。由于网络的加密性和匿名性,使入侵者难以被发现。黑客对信息资源的攻击,不仅仅是好奇和自我挑战,程序设计高手可以篡改系统控制参数。其三,有窃取行为的间谍活动,窥视其机密信息进行复制或扩散。其四,有意破坏,摧毁系统的信息处理功能或破坏电子通讯装置。其五,人为或偶然事故造成的威胁。如工作人员操作失误而产生的不可预知的事件、网络系统软件硬件的故障、电子系统故障引发的系统问题等,所有这些,都使数字档案信息的安全变得十分“脆弱”。
5、数字档案馆建设的诸多技术问题
数字档案馆完全是高新技术、电子设备和计算机网络技术支撑起来的产物,离开了高新技术的支撑,就没有了数字档案馆。但是高新技术也给数字档案馆带来了致命的弱点,真是“成也萧何,败也萧何”。诸多的技术问题成为制约数字档案馆建设的难点。
5.1 数字化设备技术条件。网络系统中的硬件技术之一是必须有足够的带宽,以保证快捷地传输文本、语音、图像、影像档案,以便实现多网互连、高速互访,实现跨平台、跨系统、跨语种的互相转换和链接。毫无疑问,足够的带宽条件和用户对网络信息传输的需求将一直是一对矛盾体。
5.2 技术难题。数字档案馆是以信息源、网络、数据库为基础的,其相关技术是较复杂较先进并且不断发展的,它几乎囊括了计算机网络技术所需要解决的所有问题,技术密集。如数字化图像的存储与压缩、数据组织技术、信息检索技术、多语言平台互换互访技术、海量信息存储与调配技术等,既是计算机网络技术的难关,也是制约数字档案馆建设发展的难题。此外,“数字档案馆的建设和运行需要解决一些特殊问题,为此必须开发应用一系列新技术,如:身份认定、智能检索、信息隐蔽、数字水印、电子签章、操作跟踪、信息加密等,其中有很多技术有创新性”。⑾这些技术也都是不容易解决的问题。
5.3 技术过时问题。在飞速发展的IT业中,电脑硬件、操作系统、应用软件及存储载体等不断地被新产品所替代,IT产品是真正的“短命鬼”。虽然绝大多数新产品承诺向下兼容,但其兼容的“代”数在跨越若干年后,旧的数字信息就很难被新的硬件设备和软件系统读出。“技术过时”的阴影一直会笼罩着数字信息。专家们提出的解决方案是数据迁移,但迁移却存在着一个致命弱点,就是每次迁移总会丢失一定的相关信息,这些丢失的信息积累起来会造成数字档案信息无法准确恢复原貌。
6、数字档案馆建设的标准化问题
数字档案馆建设的目的是要使地区档案馆、全国档案馆乃至全世界的档案馆连成一个整体,以实现档案信息资源共享。这个整体性的数字档案馆事实上是一种基于网络环境下的数字化档案信息资源共享的社会档案馆系统,是一个面向对象的分布式的网状结构模式,是由一个个相对独立的数字档案馆实体组成的。要对这分散在各地的数字档案信息资源进行组织控制,就必须要有彼此兼容的硬件环境,要有一致的文件格式、统一的著录标引标准、数据描述标准、元数据标准、全文数据库标准等等,这些标准也仅仅是几个主要的标准。“而实际上,在数字档案馆建设中,标准化是一个体系,是一个系统,因此对于我们来说,如何结合我国实际,迅速建立起一个适合我国数字档案馆建设的标准化体系是摆在我们面前的一个迫切需要解决的新问题”。⑿然而,要解决这个问题并不容易,我们面临着很多问题:其一,一个严峻的事实是我国档案信息系统没有相应的具体标准可遵循;其二,有些标准规范要超出档案工作的范围,如综合数据处理格式就需满足跨行业、跨部门的要求。如何统一是一个很麻烦的问题;其三,与整个档案工作的标准相衔接的问题;其四,与国际通用标准的接轨问题;其五,由于计算机技术更新速度非常快,每次技术设备的更新,都会对原标准产生相应的影响,因而必须不断适时修订标准。
7、数字档案馆建设的投入与产出问题
数字档案馆建设存在着投入与产出不协调的问题。如果我们把数字档案馆与数字图书馆作比较,会对这个问题看得更清楚。数字档案馆建设投入的费用是巨大的,而且它的建设费用要远远高于数字图书馆的建设费用。由于图书有复本,许多图书馆保存的图书都一样。因而国家图书馆和省市图书馆的部分图书数字化后,其他图书馆特别是中小型图书馆完全可以坐享其成,不必再花费资金重复建设。而档案馆则不行,全国各个档案馆保存的档案几乎都是孤本,因而档案馆在用于档案数字化的费用上要比图书馆多,如,仅档案馆进行数字化档案目录的“工作量约是图书馆的35倍”。⒀但是档案馆的利用人次与图书馆读者的人数相比却少得多,“以北京市档案馆和国家图书馆(原北京图书馆)为例,前者年利用人次约四五千人,后者一年的读者数不少于二百万人”。⒁两者相差400倍。“即使一、二史馆和中央档案馆三个国家档案馆的年平均利用人次也不过5960人次”,⒂三个馆加起来与国家图书馆相比仍相差100多倍。档案馆的利用长期处于低谷已是不争的事实,就是建成数字档案馆后,这种情况也不会改变多少,因为档案信息有保密和时效的限制,有利用者的限制,并不会增加太多的利用者,更不可能赶上数字图书馆的读者入数。事实上,传统档案馆本来就存在着投入与产出不协调的问题,只不过未引起人们的关注,但是,数字档案馆的建设却拉大了这种不协调的距离,使这个问题凸现出来。它也成为摆在数字档案馆建设面前很难解决的问题。
8、数字档案中的经济问题
与其说数字档案馆是高新技术支撑起来的,不如更实际地说是由巨额资金支撑起来的,因为所有的高新技术和设备都将由资金来兑现。数字档案馆的建设与利用,不论对于档案部门还是利用者,都有很重的经济负担,经济问题可能是困扰数字档案馆建设的根本性难题之一。
8.1 档案部门方面的问题。
8.1.1 数字档案馆建设的费用问题。数字档案馆的建设费用是巨大的,开发一个稍具规模的数字档案馆系统,不论是购买软件和硬件,还是开发专用软件,还是馆藏档案的数字化工作,都需要花费可观的人力、财力和时间,这些都需要有强大的经济实力做后盾。而数字档案馆的建设说到底,仍是以政府投入为主。但国家的综合国力不可能在短期内发展到较高的水平。因此,资金短缺是建设数字档案馆的最不好解决的难题。档案馆是公益性和社会性的部门,也不能走“以文养文”、“以馆建馆”之路,即便是想走此路也走不通,正如上文所述的数字档案馆存在着投入与产出的巨大反差,即使对利用者收费,数字档案馆也根本不可能收回投资成本。数字档案馆建设的巨额费用对于本来就经费紧张的档案部门来说是有相当难度的。而对中西部欠发达地区的大部分市、县档案馆来说,连维持日常工作的经费都成问题,建设数字档案馆恐怕在相当长的时间内都是可望而不可及的。
8.1.2 数字档案馆的使用和维护费用问题。虽然数字档案馆的建设费用巨大,但它并不是一劳永逸的。它的维护和使用的费用并不少于初建的费用。数字档案馆就像一个“无底洞”,需要不断地投入大量资金来维持其正常运转。
8.1.2.1 平时正常的使用和维护费用。数字档案馆是靠技术支撑起来的,平时正常的使用和维护也需要很大一笔资金才能维持,如通信费、数据使用费和设备维护费等都需要不断地支出,且费用不低。
8.1.2.2 设备更新费用。现代信息处理技术发展迅猛,其软硬件更新非常快,而在市场经济利益的强大动因驱使下,更加快了这种更新速度,“录制、存贮信息的设备、方法及软件随着新产品、新方法的问世,正以5?9年的周期更新,新产品、新方法的不断问世,必将导致原有设备及软件的淘汰”⒃。数字档案馆要维持正常使用,也必须不断地更新设备和软件,但要更新设备和软件,却又要花费大量的资金,而且是每隔几年就要又投入一次。
8.1.2.3 数字档案信息长期存取使用的费用。正如上文所述数字档案信息长期存取是数字档案馆的一个具体而棘手的难题。而数字档案馆又必须使用数字档案信息,专家们给出了一个不得已而为之的方案,就是不断地使数字档案信息迁移转录。但是迁移转录的费用是相当可观的和不可预知的。一般档案馆能否承受这不断迁移转录所需的费用,也是一个既不可预见又不容易解决的难题。
8.1.3 向利用者收取数字档案情息利用费的问题。档案法规规定档案馆向社会提供利用档案.可以收取费用。数字档案馆建设投资大,收取一定的费用也是应该的。但是,如何制定收取利用费的收费制度,如标准、数量、缴纳程序等,也是数字档案馆建设的难题之一。
8.2 利用者方面的问题。利用者的经济承受能力,也是影响和制约数字档案馆建设发展的问题之一。数字档案馆需上网阅览.从目前我国上网所需资费来看,每小时的费用是发达国家的10多倍,而用户的平均收入又低于发达国家的若干倍。我国80?90%的用户认为网络收费过高,通信费难以承受。再一点是下载档案信息的打印费用,尽管并不是要将所有下载的档案信息打印出来,就是部分打印也需要承受可观的打印费。如果再加上数字档案信息使用费,这些费用加在一起,将会相当高。必将影响利用者对数字档案馆的使用,也将使数字档案馆的建设失去应有的作用和意义。
9、数字档案馆法律法规方面的问题
数字档案馆建设中会涉及到许多法律问题,而这些法律问题恰恰又是亟待解决而又难以一时解决的问题。
9.1 档案法规方面的问题。面对数字档案馆产生的新情况、新特点,档案法规中的一些内容已不适应,而要解决起来仍有一定的难度。如对利用者的身份认证问题,在网上进行借阅限定和身份认证不仅增加技术难度,而且还要增加开支。而对外国利用者来说,由于限制得更严格,在网上操作更加困难。数字档案馆是开放的,是不受国界限制的,数字档案馆建设的初衷就是实现档案信息的社会共享。但如果取消身份认证.那么就等于中外利用者都一样没有限制。因此,真要修改完善档案法规,兼顾到方方面面,还是有相当的难度。
9.2 著作权、知识产权、隐私权的保护问题。在数字档案馆的环境下,由于档案信息通过网络进行传递,它极容易被获取、被复制、被传播,对利用者控制的难度加大。原来意义上的著作权、知识产权、隐私权的保护方式对权利人已无法提供有效的保护,著作权、知识产权和隐私权很容易被侵犯。因此,如何对档案著作权、知识产权和隐私权进行有效保护成为数字档案馆建设面临的一大挑战。从技术上说,真正切实可行的保护技术,目前尚属于极其薄弱的环节。从完善相应法律法规方面说,目前进展缓慢,尚有许多难题不易解决。
9.3 数字档案的法律效用问题。对于数字档案的法律效用问题,它是数字档案馆建设中一个不能回避的特殊难题。要想让它得到法律的认可,恐怕还需要相当长的时间。而“如果电子档案的法律凭证问题得不到解决,数字档案馆的数字化馆藏也就失去了利用的价值、存在的意义”。⒄
10、数字档案馆的基础理论问题
数字档案馆的建设必然要受到数字档案馆理论研究的影响和指导。目前,对数字档案馆的研究还处于起步阶段,许多认识不相同,统一尚需时日。而且有关数字档案馆的一些基础理论问题,都是一些不易解决的难题。
10.1 数字档案馆的概念问题。自从数字档案馆概念出现以来,“关于数字档案馆的认识并不统一,其定义就有数十种之多,势必会造成时数字档案馆建设方向把握上的不一致”。⒅“观点不一样,建设的数字档案馆就不一样,建设的难易程度、工作流程、服务功能、配套措施、系统边界和社会影响等等也都会截然不同”。⒆而统一认识或基本统一认识都非一日之功。但这个问题不解决,将对数字档案馆的实践产生不利影响。
10.2 数字档案馆的系统边界问题。“数字档案馆支持以网络连接的相关档案部门的数字化馆藏,能够提供分布于不同地区的档案信息。然而信息网络的一个重要特征就是链接,这种在技术上可以无限链接的情况下,就涉及到了系统的边界问题”。⒇数字档案馆系统边界的界定决定着数字档案馆所拥有的功能特性。同时也决定着数字档案信息在信息中的地位。然而,“在图书馆情报学界,人们讨论数字化图书馆时有种倾向,认为因特网就是一个数字图书馆,任何人都可以到这个无所不包的图书馆中查阅文献、学习知识、合作交流甚至著书立说。这就把数字图书馆的地址空间和信息资源空间定位很广,其系统边界也无所不包。它不仅包括了书目文献管理、信息网络信息资源的组织与作用,甚至包括档案馆和博物馆的信息内容,因此建设规模异常庞大”。〔21〕数字图书馆的这种“扩张”,使本来就处于“弱势“地位的档案信息的地位更加岌岌可危,如果不对数字档案馆的系统边界给以恰当的界定,并采取相应的技术措施,那么,在不久的将来,数字档案馆将会消失在数字图书馆的海洋里,成为数字图书馆的一部分。
10.3 数字档案的概念问题。数字档案是数字档案馆生存的基础。但是目前对数字档案概念的认识却并不统一和清晰。其一,对数字档案概念的研究并未引起档案界太多的关注;其二,一些对数字档案概念的认识,大部分都是以传统的档案概念为基础的,仍旧把数字档案当作电子文件的转化物来认识,无非是传统档案概念在数字时代的翻版。这里暂不说传统的以文件为属概念的档案概念本身就有许多可商榷的地方。单说在数字信息时代文件的概念、档案概念和其他信息的概念都会受到影响而发生变化,它们之间有互相融合的趋势。如何区分它们将变得越来越困难。在数字时代的信息网络环境下,数字文件、数字档案、数字图书、数字情报、数字资料、数字文献等有什么不同?如何区分它们?如果不能把数字档案从这些其他数字信息中区分出来,那么数字档案的概念的存在就将走向消亡,而在数字档案概念基础上建立起来的数字馆大厦也将随之倾覆。因此,必须把数字档案概念从其他数字信息中区别出来,数字档案馆才能生存。但这是一道摆在我们面前的并不容易找到答案的难题。
参考文献
l.阎会勤:《新世纪档案工作展望》,《档案学通讯》2001(6)
2、3.景红:《电子档案凭证价值探析》,《档案与建设》2000(10)
4、5、6.李玉安:《数字图书馆建设的十大难题》,《图书馆学刊》2002(3)
7.徐义全:《电子文件的特性与长期保存》,《档案学研究》2000(1)
8.吴志宏:《数字化档案的隐忧:数据失真》,《北京档案》2002(12)
9.谭?培:《数字档案馆论纲》,《档案学研究》2001(5)
10、16.范开宏:《数字图书馆之忧思》,《图书与情报》2002(1)
11.邱晓威:《数字档案馆及其建设模式》,《中国档案》2001(10)
12.段荣好:《我国数字档案馆的研究与建设》,《中国档案》2002(6)
13.刘东斌:《数字档案馆与数字图书馆的比较研究》,《档案管理》2003(2)
14.求实:《档案馆与图书馆利用对比分析及对策》,《北京档案》1999(9)
15.国家档案局综合科教司:《从统计数字看1991年度全国档案事业的发展状况》,《档案学研究》1993(1)
17.潭?培:《数字档案馆建设面临的问题及其对策》,《浙江档案》2002(3)
18.朱蒙生:《传统档案馆向数字档案馆跨越所面临的问题》,《中国档案》2003(3)
19、21.刘永:《数字档案馆若干问题》,《档案管理》2001(2)
20.石珂:《数字档案馆建设过程中面临的问题》,《档案管理》2002(2)
(牛角摘自《档案学》2004年第1期)