档案信息检索体系
近些年来, 我国档案信息检索工作发展迅速, 但总的来说,目前还停留在手工检索阶段。现有的检索工具还存在不少问题,基本仍是传统的馆藏性检索工具占主导地位, 如案卷目录、卷内文件目录等, 这种检索工具是档案整理工作的副产品, 受档案整理体系的束缚, 检索功能不强。大多数档案机构设置检索工具时存在盲目性, 未形成科学合理的检索工具体系。在计算机档案信息检索系统的开发上也存在低水平重复现象, 用计算机检索完全代替手工检索还需要相当一段过程。解决上述问题的有效途径是有计划有步骤地建立和健全手工检索和计算机检索并存的档案信息检索体系。
一、档案信息检索体系的构成要素
(一) 明确的目标
明确档案信息检索体系的服务对象、专业范围、所包含的档案种类及其时间跨度、用途等。
(二) 档案信息
这是档案信息检索体系不可缺少的信息资源, 目前以档案目录信息为主。档案目录是对档案内容和形式特征的表达, 可藉以记录和识别一份档案, 档案目录信息的有序集合构成了不同的档案检索工具。随着档案全文信息检索系统的发展, 档案全文信息的比重将逐渐加大。
(三) 检索语言
档案信息检索是通过检索标识实现的, 一个检索标识表达一项档案特征信息, 提供一条检索途径, 而提供档案内容检索途径的检索标识如分类号、主题词、代码等是依据档案检索语言对档案主题内容进行标引得来的。档案检索语言是专门用于表达档案主题概念及其相互关系的概念标识系统, 是档案标引和检索的工具, 它的作用是将档案文献内容和检索课题的主题概念转换成检索系统可以识别和处理的标识, 使档案信息检索得以顺利进行。
(四) 检索设备
包括存储和记录档案信息的载体、用于检索的机具和信息传递设备等, 可分为卡片式、书本式、缩微式、计算机检索设备等。检索设备的革新往往标志着档案信息检索工作的不同发展阶段, 如手工检索向计算机检索的过渡就是以计算机的应用为推动力的。
(五) 检索方式
检索方式是指档案信息检索系统操作和运行的方式, 可分为文献单元方式和标识单元方式。文献单元方式又称顺检方式、顺排档, 它是以一份档案文献为单元进行存储和检索, 一份档案著录一个条目, 并按检索标识的顺序排列, 查到检索标识即可找到条目中所记载的有关档案信息; 标识单元方式是以一个检索标识为单元, 指明含有该标识的全部文献。检索时先在标识卡中查找与检索课题相关的标识, 查到文献号后再到文献题录卡中查找具体的档案条目。手工检索系统大多采用文献单元方式, 计算机检索系统采用的往往是标识单元方式, 检索方式的不同决定了系统中档案信息的排列方式, 要求有相应的检索设备与之相配合。
二、档案信息检索体系的功能
1 . 以档案条目和机读数据形式对档案机构所收藏的档案从文件、案卷两个层次进行特征描述和信息存储;
2 . 通过规范化的检索标识对相同和相关主题的档案及属于同一机构、人物、地区、工程、产品的档案信息加以集中;
3 . 对大量档案信息加以系统化和组织化, 通__________过排序使每个检索标识都被固定在特定位置上, 可以大大缩小查寻范围, 提高检索速度;
4 . 可提供多种检索途径和检索手段, 使用户能迅速、准确地查到自己所需要的档案信息;
5 . 通过检索系统提供的反馈功能, 使用户和系统之间得以交互, 最大限度地满足用户的检索要求;
6 . 各种书本式、卡片式、机读式检索工具经印刷、复制、远距离检索, 可对档案信息进行报道、传递和交换, 有利于档案资源共享。
三、档案信息检索体系的组织原则
1 . 档案信息检索体系反映档案的范围应能覆盖全部馆藏,利用检索体系中的档案检索工具或计算机档案信息检索系统应能找到任何一份馆藏案卷或文件;
2 . 考虑档案馆现有条件, 应优先建立和健全手工档案检索工具体系, 条件具备时再建立计算机档案信息检索系统。手工检索系统与计算机检索系统并存, 满足不同层次的需要;
3 . 在建立档案信息检索体系的过程中, 要实行标准化。标准化是使得检索工具体系有较高质量以及建立计算机信息检索网络的必要条件, 并可为建立全国统一的档案信息检索体系打下基础;
4 . 档案信息检索体系的构成应与馆藏重点和特色相对应,优先开发档案信息资源中最有价值的、最常用的部分, 力求达到最大的成本效益;
5 . 档案信息检索体系应具有整体性, 各种检索工具相互配套, 手工检索系统与计算机检索系统各司其职, 相互配合, 尽量减少信息冗余和多头现象;
6 . 档案信息检索体系应是一开放性的系统, 有随时扩展和不断完善的能力, 能及时采用新方法、新技术, 不断提高其检索效率。
总之, 档案信息检索体系的建立应在充分分析利用者各种检索要求以及档案馆馆藏状况及现实条件的基础上进行, 力求用最少的成本在短期内达到最大的效益。
四、档案信息检索体系的检索效率
检索效率是档案信息检索体系的重要评价指标。检索效率可从五个方面衡量: 全、准、快、便、省。其中, “快” 是指检索速度快, 即要最大限度地缩短查找档案信息的时间, 并及时迅速地向外报道馆藏; “ 便” 是指方便实用, 检索工具和检索系统的排检方法应科学合理, 便于利用, 易用性好; “省” 指成本较低,能用较少花费获得较大效益, 由于我国经济条件有限, 这一点往往起决定作用。
然而, 评价检索效率的主要指标还是“全” 和“ 准” 两项。“全” 指与检索课题有关的档案要尽可能全地检索出来, 不要遗漏, 用检全率表示; “准” 是指所检出的档案要与检索课题有关,不要将无关档案带出来, 用检准率表示。与检全率和检准率相对的还有漏检率和误检率两个概念, 这两对概念用图表示如下:
图中:
a : 检准的档案
b: 误检的档案
c : 漏检的档案
d: 无关的档案
□ : 系统中所有档案
a + c: 系统中与某课题有关的全部档案
a + b : 检出的全部档案
档案检索体系应保证较高的检全率和检准率, 但要注意二者之间的制约关系, 提高检全率往往会使检准率下降, 反之亦然,因此, 应保持检全率和检准率之间的最优比。