联机档案信息检索系统
联机检索技术从20 世纪70 年代开始得到迅速发展, 目前世界上已有不少具有国际规模的联机检索系统。联机检索相对于脱机检索而言, 有不少优点, 检索效率大大提高。
一、联机档案检索系统的特点
(一) 交互式检索
在此之前的脱机检索是委托性质的检索, 由用户委托专家进行检索。检索者须事先将一切可能的检索途径考虑周全并编制出周密的检索策略输入计算机, 检出相关文献。用户不能立即获得检索结果, 须等待成批的或定期的检索处理。而联机检索采用检索者与系统的会话方式进行。用户可以通过终端借助于通信线路与系统直接对话, 可随时修改检索策略直到获得满意的结果为止, 是一种交互式的检索方式。
(二) 实时检索
联机检索系统中, 计算机将处理时间分配给许多终端, 即所谓“ 分时”。由于计算机运算速度极快, 使用户产生错觉, 以为他是唯一用户, 检索是以实时方式进行的, 从呼叫系统, 到取得检索结果, 片刻即可。一个设计优良的系统对一询问或指令的响应速度快到1~2 秒, 几乎是即时的。消除了手工检索和脱机检索中时间上的延迟现象。
(三) 启发式检索
联机检索具有启发和帮助检索者的功能。系统可帮助检索者选择合适的数据库, 通报数据库的更新情况, 显示系统词表, 帮助检索者将课题的主题概念转换为检索标识, 解释检索者不熟悉的作业指令及其使用方法, 回答各种业务询问, 并让检索者浏览检索的初步结果。由于系统的帮助, 检索者可以边检索, 边询问, 在得到启发和帮助的条件下逐步明确自己的检索策略, 使检索得以顺利进行。
(四) 高检准率
联机检索是“ 对话” 式的, 允许检索者随时根据检索的实际情况修改检索策略, 扩大、缩小或改变检索范围, 避免检索失误, 查到自己真正需要的档案, 检准率较高。
(五) 对用户限制较严
在脱机检索系统中, 用户不能直接操作计算机, 由检索人员代查档案, 对用户没什么限制。而在联机检索系统中, 用户直接与计算机打交道, 由于系统数据库中档案信息并不是无区别地向所有人开放, 其中机密材料的检索并不是人人都有资格进行的,这样就有必要采取一定的保密措施。此外, 联机检索是要收费的, 为了防止盗用, 系统给其终端用户一个秘密代号, 即所谓口令字, 每次开始检索时, 系统要求检索者输入这个口令字。以检验该检索者是否为合法用户, 口令字对上后, 系统才开始检索服务。口令字除了识别合法用户外, 也用来控制机密材料的检索者的范围与级别。合法用户中, 有的可检索整个数据库, 有的只能检索其中的一部分。由于档案材料的特点, 保密问题尤其重要,对用户的限制十分严格。
二、联机档案检索系统的工作过程及其功能
(一) 联机检索系统的工作过程
检索者通过计算机终端, 向系统发出呼叫; 系统响应后对检索者作保密审查, 识别是否是合法用户; 审查合格即由用户向系统输入检索提问式; 系统根据检索要求进行检索; 最后输出检索结果。检索者获得结果后检查结果是否符合要求, 若不符合就修改检索策略, 重新输入系统, 直到获得满意的结果为止。
(二) 联机检索系统的功能
联机检索系统除提供一般的布尔检索、加权检索、截词检索功能外, 还具有一些脱机检索系统所没有的功能:
1 . 帮助用户选择合适的数据库
由于系统拥有的数据库越来越多, 检索者有时不了解自己该查哪一种数据库, 这时系统可根据检索课题将含有该课题档案的数据库名单, 按照所含档案数量的多少次序, 向检索者显示, 供其选择。
2 . 词表显示
选定数据库后, 如果检索者不熟悉检索语言, 可要求系统显示自己需要的那一部分词表或分类表, 从中选择合适的检索词。
3 . 帮助检索者回顾检索过程
如果检索过程较长, 检索者可能会忘记检索已经进行过一些什么阶段, 这时系统可应检索者要求, 把以往关键性的一些检索语句重新显示一遍, 帮助回顾检索过程, 有利于检索者继续向下检索。
4 . 保留检索语句或检索策略
当某些检索语句或检索策略以后还需重复使用时, 系统可为检索者短期保留这些检索语句或检索策略, 需要时根据标识号即可召回, 免去重新输入的麻烦。
5 . 提供联机定题服务
当订购这种服务的用户把自己的检索式输入系统后, 系统将其纳入专门的用户提问档, 予以长期保留。每当新材料进入系统的数据库时, 就为检索者进行查找, 将切合用户课题要求的新材料提供给用户。
6 . 支持个人文档服务
联机检索系统允许用户把自己的机读文档输入并保存在该系统里, 以备自己检索之用。系统为这种个人文档保密, 旁人无权存取。
三、联机档案检索系统的选择
近些年来, 联机检索系统的数量日益增加, 这些系统所提供的数据库各不相同, 收费标准各有区别, 可提供的检索功能和服务项目也不尽相同, 系统的资源水平、响应速度、可靠性、方便性等更有不小差异。因此, 如何合理地选择联机检索系统就成为一大问题。
一般说来, 选择联机检索系统可考虑以下因素:
(一) 数据库因素
1 . 数据库的追溯范围
并非范围越大越好, 这要与检索目标结合起来考虑。如果检索课题是普查性的, 则须选择追溯年代较长的数据库; 如果检索课题只要求了解最新发展动态, 则不应追求数据库的完整性, 因为追溯年代越长, 检索时扫描的范围越大, 命中的档案越多, 检索所需时间就越长, 检索费用也就越多。
2 . 数据库的文档划分
若在系统中装成一个单独的大库, 对普查式检索课题有利;若按年代断开划分为几个文档, 则对只想检索最新材料的用户有利。有的数据库既作为一单独的完整数据库存在, 又有按累积期划分的若干个小文档, 这种大小文档并列的方式既便于普查式检索, 又便于最新信息的检索, 是最为方便的。
3 . 数据库的现实性
即数据库收入的最新资料与其发表的时差有多大, 这与数据库更新周期的长短有关。更新周期越短, 就越能获得及时信息。
4 . 数据库记录内容的完整性
对同一种数据库, 各个检索系统对装入字段的选择会有所不同, 装入字段越多, 其内容就越完整。
5 . 系统对数据库的独占性
有的数据库是由某一检索系统独家提供的, 这无疑会增加该系统的吸引力。
6 . 数据库群的存在情况
对某一学科主题范围而言, 往往有一批相关数据库, 称之为数据库群, 这种数据库群是否存在及其完整程度, 是衡量检索系统数据库资源整体水平的依据之一。对检索者来说, 某一领域数据库群的存在, 扩大了选择数据库的余地, 也便于进行跨文档检索。
(二) 系统软件功能因素
1 . 系统的用户界面
用户界面包括检索模式、后处理的选择、说明提示等。有的联机检索系统针对无经验的检索新手和有经验的检索专家, 分别提供菜单驱动和命令驱动两种方式, 能够适应不同水平级别的用户, 比只有一种方式要好。
2 . 系统的软件功能
除了一般布尔逻辑检索外, 是否还具备加权检索、截词检索、限定检索等功能。系统软件功能与检索处理的深度和灵活性有密切关系。
(三) 系统所能提供的服务
是否能提供原文复印件? 能否提供咨询服务、电子邮政服务? 是否提供系统说明材料, 这些材料是否齐全, 更新是否及时? 是否提供培训服务? 等等。
(四) 费用因素
收费标准如何? 是否收初始费或预订费, 有无优惠? 等等。
(五) 检索者对系统的熟悉程度及其经验水平
检索者越是熟悉系统, 就越能取得良好的检索结果, 这本身就是一种经费的节省。检索者的素质和经验是保证检索质量的重要条件, 应根据自身情况选择对检索语言、数据库、软件功能、服务项目有较多了解的系统。