电子文件的特性(下)
电子文件管理研究课题组
3、电子文件载体的非直读性。
电子文件的非直读性体现在很多方面。一是数字编码记录于载体上肉眼无法分辨,何况磁载体上的“磁畴”极性是物质内部的物理性质,根本不可能看到。此外载体上的信息记录密度极大,例如一张容量可达600MB一4000MB的光盘,刻写激光斑点的直径小于百万分之一毫米,可存35万张打印纸上的文字信息,或10万页图形信息。即使在高倍显微镜下可以看见光盘上的记录痕迹,也不可能读懂那些小点表示什么。另外,载体上的数字信息往往进行了压缩编码、加密等处理,即使有设备,如果不解压解密也不能读取其内容。以上种种因素均决定了电子文件载体的非直读性。
4、电子文件物理结构与逻辑结构的复杂性及对元数据和背景信息的依赖性。
文件的物理结构是指其信息存诸于载体上的位置及分布情况,例如文件的正文、图形、批示、附件等部分各自在载体上的存诸位置。文件的逻辑结构是指信息自身的结构,例如文件中的文字排列、章节构成、各页的先后顺序、插图、标号等。
纸质文件的信息物理结构与逻辑结构是一致的,而且是直观的。例如,排错了文件页码,就不仅破坏文件信息物理结构也同时破坏其逻辑结构。电子文件的信息物理结构和逻辑结构往往是不一致的。同一份电子文件中的正文、图形、批示、附件等可以不在载体上连续存放,甚至可以存放在不同的载体上,而不影响其正常地显示输出。在电子文件信息的处理过程中,其物理结构经常发生变化,而其逻辑结构却可以保持不变。电子文件的逻辑结构通常也需要专门的信息予以描述,当然这些信息可能是隐含的,无特殊需要而不显示出来。正是由于这种原因,电子文件的物理结构和逻辑结构之间关系是很复杂的。在电子文件归档时,如何保持其物理结构和逻辑结构的复杂关系,是保证电子文件不被破坏而必须注意的关键问题之一。
元数据是关于数据的数据。例如文件上、下文的关系和结构就是元数据。对于纸质文件来说,元数据往往直接体现在其形态上,如一份印好的文件,纸上的文字、图形排列及格式等。电子文件的这种元数据必须特意附在文件信息中,否则将无法恢复电子文件的原貌。此外,纸质文阵由于在传递和处理过程中离不开行政部门的实际往来和人工办理各种手续,则其生成和运作的背景信息也就自然地记录在文件上了。电子文件的运作往往是在网络上进于的,操作者互不见面,体现行政背景关系的信息可能存放在其他地方。如不特意提供或补充这些元数据或背景信息,就可能给电子文件的运作和归档带来问题。
5、电子文件信息与载体的相分离性。
电子文件的存放位置不是固定的,而是可以变化的,甚至可以从一个载体转换到另一个载体,其内容信息却不发生任何变化。同样,还可以通过网络传给远方的一个或多个接收者。在一些对保密有特殊要求的网络中,还采取把电子文件分解后分别通过不同的途径传递,存放在不同地点的不同设备上,只是在需要时才临时把文件装配起来。这些情况,不仅造成电子文件与载体的分离性,也使长期处于共享计算机网络资源环境的使用者淡漠了对电子文件存储于哪台计算机、哪个载体以及什么位置的关心。这个特征给电子文冲的保管带来许多新的问题,处理不好,会直接影响其真实性、完整性和可靠性。
文字、图形、声音、影像等多媒体信息均可以单独或相互搭配构成电子文件的内容,这就造成了电子文件的多媒体集成性,使得电子文件的信息形态及其组成要比纸质文件等复杂得多。例如不同的载体往往适合存储不同种类媒体的信息,就会造成同一份电子文件中的文、图、声、像在存储时的载体分离现象。如果脱机保管,就可能造成混乱,甚至破坏电子文件的完整性。
——1999年4月22日《中国档案报》