搜索引擎与网络档案计算机检索系统在网络档案信息检索中的关系与作用
搜索引擎与网络档案计算机检索系统在网络档案信息检索中的关系与作用可以归纳为如下一个表格。通过这一表格,可以进一步明确笔者关于网络档案信息检索与传统档案信息检索有所不同的论点。
关于这两种网络档案信息检索工具,可以做个比喻:网络档案信息利用者是一个寻宝人,档案信息(包括目录信息和全文信息)则是宝藏,宝藏藏在网络这个信息海洋之中的一座座小岛上,小岛即某个网站或网页。找这个宝藏要分两步走,首先按照航海图找到某个小岛,其次是按照藏宝图在岛上找到真正的宝藏。搜索引擎是航海图,网络档案计算机检索系统是藏宝图。其间有可能还需要一张小岛的地图,即站内搜索引擎。
通过上述表格和比喻,阐释了搜索引擎与网络档案计算机检索系统在网络档案信息检索中的关系与作用,从而明确了网络档案信息检索的内涵。这样,在网络档案信息检索工具的研究和开发方向方面,应注意以下问题:
首先,要重点研究和解决的是藏宝图的编制,即编制档案计算机检索系统。在网络档案信息发布过程中,应当确立网络档案计算机检索系统的核心地位。当前阶段,确立网络档案计算机检索系统核心地位的表现,在于档案网站要具备一个真正能揭示本档案机构馆藏信息的、完善实用的、专业化的网络档案计算机检索系统。这样的系统宛如网络中的一个档案专家, “他”极其了解本馆馆藏,并可与利用者对话,有问有答,一步一步地满足利用者的需求。如爱尔兰国家档案馆的在线数据库,提供了包括总理办公室档案数据库、农业部档案数据库、外交部档案数据库、财政部档案数据库等15个政府档案数据库,还有妇女历史数据库、1791-1868年爱尔兰一澳大利亚间移民数据库等3个特色档案数据库,有专门的检索系统对这些数据库进行检索。再如加拿大国家档案馆网站提供了在线档案信息检索系统online Research Tools:ARCHIVIANET。我国许多档案网站已经提供了此类网络档案信息检索系统,如上海档案信息网提供的“档案查询”等,但目前检索系统的数量与质量还不尽如人意,如四川档案馆馆藏目录,只提供了部分清朝档案的目录列表。
其次,在档案网站上,要有意识地提供两种检索工具:网络档案计算机检索系统与站内搜索引擎。目前国内有一些档案网站提供了网络档案计算机检索系统,但提供站内搜索引擎的还比较少。这一方面是由于网站信息还不十分丰富,另一方面是缺乏这方面的意识。站内搜索引擎主要用于检索本网站内以静态页面形式发布的档案信息。当一个档案网站内的信息十分丰富,就必须提供一个完善的站内搜索引擎。国外比较完善的档案网站都提供了这两种检索工具。以美国国家档案与文件署网站为例,首先它提供了网络档案信息检索系统ARC,另外网站内的在线展厅、数字教室等栏目内以主题形式发布了大量的一次档案信息,这些信息就只有依靠站内搜索引擎来进行检索了。例如,有利用者关心该网站内发布的有关泰坦尼克号的档案信息,利用站内搜索引擎输入“Titanic”立即会得到该站内所有相关的信息,包括许多一次信息,共26条。这些信息按相似度进行了排序,利用者可以迅速找到已发布的泰坦尼克号中央大厅的照片、撞冰山事故当日海军日志等档案材料,还可以在此基础上进一步缩小范围,直至找到所关心的内容。在美国马里兰州档案馆的网站,也提供了针对不同内容范围的多种检索,由于其信息包括馆藏档案信息全部采用静态页面形式发布,这些检索全部以搜索引擎方式实现,而无需提供网络计算机检索系统。美国国家档案与文件署网站的检索系统从NAIL向ARC转变,就有从数据库向在线目录过渡的趋势。这种方式值得国内档案界给予关注,尤其是想要了解和使用EAD标准的档案机构,就必须摒弃传统的数据库方法,而采用静态页面发布形式,然后利用公共搜索引擎或站内搜索引擎对信息进行检索。
再次,要正确对待搜索引擎的研究和使用。目前档案界研究检索的文章中,许多讨论的不是真正意义上的专业化的网络档案信息的检索,而是如何利用搜索引擎发现档案信息,即讨论航海图的编制。事实上,对于搜索引擎的建立与使用是一项专门的技术。网络环境的出现,使得信息检索研究的对象和范围不断扩大,研究队伍也有所扩展,尤为引人注意的是众多的信息公司加入到研究开发信息检索系统的行列。1994年因特网引入我国后,信息检索研究掀起新的高潮。网络信息资源的收集、检索、利用方法的研究、基于网络的信息挖掘技术、网络信息搜索引擎的建构及其检索效率的比较研究,越来越受到关注。特别是图书馆界,在网络环境出现以后,其职能有所拓展,从传统的单一的文献信息服务向以信息和知识收集、检索、传播为主的多功能综合性的信息服务转变。他们试图对网络信息资源加以组织,为各行各业提供更加有效的检索工具和更加有序的信息。也就是说图书馆界试图为网络用户编制更精确的航海图。一名图书馆工作者的两篇文章:《快速地查找和获取因特网上的国外重要档案信息资源的途径和方法》和《如何检索因特网上的国外档案信息资源》就提供了使用搜索引擎发现的网络档案信息。它相当于一份航海图,可以让利用者在信息海洋中找到无数与档案相关的岛屿。所以对于搜索引擎,档案界应该退出研究其实现技术,而是将各种信息公司和图书馆界的研究成果拿来为我所用,了解和应用这项技术。
最后,档案网站要有意识地加入到网络服务商提供的各类搜索引擎中去,例如著名的雅虎(Yahoo)等,以此扩大服务范围。对于网络档案信息来说,档案机构是信息的生成者,雅虎等仅是信息利用的助手。但是雅虎等虽不直接为网络用户提供信息内容,却是一个十分有效的中转站。网络用户需要信息,都到这里来找。只要键入自己感兴趣的关键词,就会得到有关网址,很方便地转到自己感兴趣的网站上。档案信息要为更多的利用者服务,实现良好的效益,就必须积极加入到这些搜索引擎中。目前在中文雅虎上就可以查到北京大学档案馆、南京大学档案馆、中国人民大学档案学院、山东档案信息网、四川省档案馆等网站,在一定程度上扩大了这些网站的影响。