网络档案信息检索与传统档案信息检索
档案信息检索是对档案及其蕴含的信息加以存储,并根据某种档案特征信息,在特定的档案信息集合中查找、识别、选择、获取相关的数据、事实或档案文献。网络档案信息检索同样是对档案及其蕴含的信息加以存储,编制检索工具,建立检索系统,并按一定的方法通过网络查找和利用相关的档案信息。从理论角度看,网络档案信息检索是采用一定的手段,依据特定标准,对档案文献进行著录标引,得到各种标识;同时,又依据同样的标准对利用者提问进行标引,获得提问标识,然后将文献标识和提问标识相比较,寻找相匹配的档案信息;而后将这些处于中心服务器中的、匹配的档案信息,通过网络系统发送到查询利用者的计算机系统中。从检索实质上讲,网络档案信息检索的发展是基于比较成熟的档案信息检索理论之上的,这是其迅速发展的基础。但是,由于网络环境不同于传统档案利用环境的特殊性,网络档案信息检索相对于传统档案信息检索有了一些不同。
传统档案工作中的档案信息检索的范围,是特定的某一个或某几个档案机构所存的档案及档案信息,这种检索是在特定的、有序的档案信息集合中进行的。而网络环境下,档案信息检索的范围可能是针对某一个或某几个有限的档案机构所存储的档案信息,也有可能是针对网络内全部档案机构存储的档案信息,检索范围随着网络的普及而扩大。这样,网络档案信息检索可以是范围确定的检索,也有可能是对不特定的范围进行检索。这种检索有可能是在有序的档案信息集合内进行的,也有可能是针对网络中全部或部分无序的信息集合进行的,还有可能先从无序的信息集合再到有序的档案信息集合。
传统的档案信息检索,是指直接利用档案机构提供的检索工具。在网络环境下,档案信息检索首先要在网络中确定所需信息所在的档案机构的网站,然后才能利用网站上提供的检索工具。这样,网络档案信息检索较之传统档案信息检索增加了一步,在网络中查寻档案信息基本上分两步:第一步首先要在部分或全部无序、混乱的网络信息中查找到利用者关心的档案信息所在的网址,这一步也称为对档案信息资源进行定位。这种检索通过各种搜索引擎(Search Engines)等网络信息检索工具(Networked Information Retrieval Tools)实现;第二步是针对特定档案信息集合查找相关档案信息,其实质是使用档案机构提供的专业化检索工具进行档案信息检索。档案机构针对不同的发布方式提供不同的检索工具。对以数据库形式发布的档案信息,相应提供网络计算机检索系统;对于以静态页面形式发布的档案信息,档案机构可以制作专门的站内搜索引擎,或同第一步一样利用公共搜索引擎进行检索。
由于这种变化,对“网络档案信息检索”一词的研究使用出现了混乱情况。一种情况是, “网络档案信息检索”一词用来指对网络中档案信息资源的搜索、定位,或称其为对网络中档案信息资源的发现。其针对的对象是不特定的、处于无序状态的网络信息,检索后返回的值是统一资源定位器,即相关网址。这些网址上或能提供网络档案计算机检索系统,或者包括了以静态页面形式发布的各种档案信息。另一种情况是, “网络档案信息检索”一词专指使用网络档案计算机检索系统进行检索,或称之为使用在线档案计算机检索系统、档案计算机检索系统的网络版进行检索。其针对对象是存储在数据库中的档案机构的馆藏信息、事实数据等经过加工处理的专业化的有序信息,检索后返回的值是档案目录信息、档案材料的全文信息或相关的事实、数据等。这样,网络档案信息检索的内涵较之传统档案信息检索有了扩展。在实际应用中,要实现有效的网络档案信息检索,针对检索步骤和发布方式不同,必须依赖二种检索工具:搜索引擎和网络档案计算机检索系统。