电子文件的特性(上)
电子文件管理研究课题组
电子文件某些特性与纸质文件有很大区别。要管理好电子文件,就必须了解其特性。综合国内外对此问题的研究,电子文件的主要特性可概括为:
1、电子文件是数字化信息技术的产物。电子文件是在计算机中产生和处理,其信息形态是数字化的。人们在计算机屏幕上看到由文字、图形等构成的电子文件形态只不过是电子文件的某种输出形式而已。而在计算机内部,无论是传输还是存储等处理,电子文件均是以数字编码的形式存在。
计算机录入汉字的方法有多种,如键盘录入法、扫描录入法、语音录入法、手写录入法等。用键盘录入汉字、首先是在输入时对汉字进行计算机的外码转换。可以用汉语拼音、五笔字型等外码录入汉字。计算机接收了其个汉字外码之后,接着就把外码代表的汉字用计算机内码记录下来。计算机内码是以16位二进制的数字表示的,也就是两个字节长。计算机内进行文件信息的存储、传输等处理就是对这些内码的处理。只有当需要将文件输出时,才将其汉字内码所对应的字形点阵。也就是字模,以及众多字模按格式组成文章在屏幕或打印机上输出。
在计算机多媒体技术的支持下,电子文件还可以包括声音、影像等多种形式。不过这些信息形态就计算机内部处理来说,也都是二进制的数字编码而已,只是在输入和输出时,才有其各自的特殊形式。
电子文件从一个载体复制到另一个载体,或者从一台计算机传递到另一台计算机,实质上是在计算机内进行数字信号的传输处理。只要技术方法得当,就可以完全恢复到与原信号一样。例如,在光盘被复制时,如采取较完善的技术措施,所出现的误码率能够做到不超过10的负14次方,也就是说相当于传递200000份《人民日报》的文字信息量,才可能有一个汉字出错。所以可以做到复制后得到的电子文件与原来的电子文件无任何区别。
2、电子文件对设备的依赖性。电子文件的形成和各种处理均是在计算机等设备的支持下完成的,离开计算机等设备,电子文件既看不见也摸不着。其对设备依赖性主要体现在:一是数字编码,二是硬件,三是软件,四是技术设备更新,五是加密。例如电子文件对其他设备环境的不兼容性,使其只能在某种设备上处理。不同软、硬件环境形成的电子文件载体,有时难以互换。
电子文件的运作、管理是建立在一套标准化体系之上的。其严格程度和对系统性的要求,均远远超过纸质文件的标准化体系。例如,其制作生成要有代码标准,其存储要有机读载体的格式标准、信息压缩存储的算法标准,其传输要有网络通讯协议标准,其查找要有检索语言标准等。标准化是极为重要的基础工作,建立和熟悉电子文件的标准化体系,是保证电子文件妥善归档的重要前提。
在网络环境下,人们对信息的处理标准化问题解决得好一些,但对记录载体的交换问题仍然很多。尤其是在格式、字符集、压缩方式等方面产生不兼容的问题。出于安全保密上的考虑还常常通过特殊的软、硬件设备人为地进行复杂而独特的编码加密或信息拆分处理,使需要保密的电子文件只能在特定的环境下被读取。计算机更新换代很快,常常只能隔代兼容,对于需要长期归档保存的电子文件来说,设备依赖性造成的问题会更加严重。一般的计算机设备8年左右就会被更新,而耐久性光盘载体可以保存更长时间。若干年之后,很可能出现保管完好的电子文件载体找不到读取设备的问题。设备老化和频繁更新,给电子文件长久保存带来的问题,远比文件载体本身的寿命长短更为严重。
——1999年4月22日《中国档案报》