档案之窗

扫一扫关注

当前位置: 首页 » 技术 » 档案论文 » 论文欣赏 » 正文

档案信息检索智能化趋势

放大字体  缩小字体 发布日期:2018-11-15 11:50:26    来源:网络    浏览次数:500    评论:0
导读

摘 要 笔者认为在信息社会和网络时代,信息检索智能化是不可逆转的发展趋势,对于这方面的研究,档案学界目前落后于图书馆学界。本文从档案信息检索智能化是信息社会和网络时代的必然产物、档案信息检索智能化出现的利用环境分析与科技环境分析、档案信息检

摘  要   笔者认为在信息社会和网络时代,信息检索智能化是不可逆转的发展趋势,对于这方面的研究,档案学界目前落后于图书馆学界。本文从档案信息检索智能化是信息社会和网络时代的必然产物、档案信息检索智能化出现的利用环境分析与科技环境分析、档案信息检索系统智能化的发展趋势等方面略陈管见,意在引起档案界同仁的关注。
关键词   档案信息  检索  智能化  环境   趋势

 
随着网络时代的到来,信息检索智能化的趋势已初见端倪,对于这方面的研究,图书馆学界已取得了令人瞩目的成果,而档案学界似乎尚未热起来。笔者就此略陈管见,以期抛砖引玉。
一、档案信息检索智能化是信息社会和网络时代的必然产物
档案信息检索是人类社会发展到一定阶段的产物,并随着人类社会信息和科技的发展而不断发展。从人类社会利用档案信息的历史发展过程来看,档案信息检索大致经历了自然检索→手工检索→计算机自动检索→计算机智能检索四个发展阶段。在19世纪前,因为档案信息数量和人们需要的档案信息有限,人们很容易就能获得所需档案信息,没有产生并且也不可能产生“档案信息检索”的意识,所以勿需专门的检索技术,此时处于自然检索阶段。人类社会进入20世纪,特别是20世纪80年代以后,信息与科技均逐渐呈现出加速度发展趋势,档案信息数量剧增,其内容五花八门,存贮方式日益多样,人们所需档案信息的数量、范围发生了很大的变化,必须到大量的档案信息中去寻找,去发现,于是“档案信息检索”的概念就产生了。最早出现的是手工检索,产生了表格式、卡片式、书本式等检索工具。当计算机进入档案管理领域以后,出现了机器自动检索方式,随着计算机智能技术的发达和信息社会的到来,尤其是图情信息智能检索出现后,档案智能检索就成为档案学界不得不关注的一个新课题了。所谓“智能检索”,就是计算机检索档案信息时系统自动进行分析,挖掘利用者提出该检索要求的深层次意图。在网络环境下,传统档案信息检索已不能适应档案信息海量化趋势,不能方便快捷地满足利用者需求,于是,智能检索就成为新的历史条件下的必然产物了;同时,网络技术、现代检索技术等人工智能技术的不断成熟,也为档案信息智能检索的出现提供了可能性。
二、档案信息检索智能化出现的环境分析
(一)利用环境分析
1、档案信息检索过程由模糊性向显示性转变
传统的档案信息检索过程在很大程度上是模糊查找过程(即摸索过程)。在这一过程中,常会因为许多偶然因素影响检索的结果。为什么呢?只要分析一下利用者对档案信息需求的实际情况,即可明白。利用者的信息需求,可分为显性需求(现实需求)和隐形需求(潜在需求)。一般而言,显性需求者会利用自己掌握的方法去寻找所需档案信息,以达到预期目的;但是,对那些隐性需求者来说,情况就有不一样了,他们则需要通过某些相关信息的刺激,才能把潜在需求激发出来,使之显性化和明确化。为此,就必须在检索过程中采用适当的刺激信息不断引导利用者,将检索结果逐步引向与利用者的真实需求相一致。否则,其潜在需求要么就难以激发出来;要么即使激发出来了,或因海量信息导航偏差,同样难以达到预期目标。在传统档案信息检索过程中,由于档案人员自身知识结构的缺陷,虽然他们曾力图作好这种信息导航,但实际上却无法办到。因此,利用电脑及网络的海量存储技术和电脑相对完整的“知识结构”,既可以弥补档案人员知识的不足,减少检索误导,又能极大地减轻利用者的负担,从而实现机器智能检索。
2、利用者信息需求表达语言由专业化向自然化转变
传统档案信息检索过程是利用者信息需求的表达方式与信息系统标引方式耦合(相匹配)的过程,而这种耦合(匹配)是建立在规范化专业语言的基础上的。具体来说,利用者信息需求是用一定数量的规范性检索词来代替,同样,系统中的每一条信息也是由一定数量的规范性标引词来代替,如果这二者耦合(相匹配),那么系统中的标引词所代替的信息就被命中;否则,系统中的标引词所代替的信息就不予承认。在应用过程中,这两个“代替” 实际上大多成为利用者查找所需信息的障碍,第一个“代替”可能会导致不能准确地表达利用者的信息需求,即利用者信息需求一旦经检索语言规范后,其需求意愿有可能发生变化,或被缩小,或被扩大,甚至被改变,所得检索结果则不完全符合甚至完全不符合利用者的要求,这样就会产生较高的误检率和不满意率。第二个“代替”亦然,或者不能准确地表达系统信息本身,或者其本身包含的信息没有被完全标引出来,其检索结果常常不能完全符合利用者的要求,同样会造成较高的误检率、漏检率和不满意率。为此,人们一方面开始尝试采用单汉字标引、自然语言标引来弥补第二个“代替”的缺陷;另一方面则提出用智能技术解决第一个“代替”问题的方案,即运用智能技术对检索表达方式进行适当的分析、处理,尽量以自然语言来表达利用者需求,以满足利用者的需求意愿。因此,表达语言自然化的要求就促进了智能技术在档案信息检索中的应用。
3、利用者档案信息需求由单一性向复杂性转变
21世纪将是人类在知识方面取得伟大进步的时代,随着人们生活水平的迅速提高,人们的需求将变得更加丰富多彩,对档案信息的需求也日趋复杂起来,利用者将不再满意传统检索系统将档案信息检索与档案信息获取分裂的做法。传统检索概念的最大特征就是把找到的信息线索作为检索的结果,这样的结果就是当时利用者的需求,而现在利用者不再满足只获得档案信息的线索,更希望获得原始信息或者能直接解决问题的相关知识,这就体现了利用者在信息需求的类型上更为多样和复杂;同时要把档案信息组织为知识,就要求档案信息检索系统具有能够进行语法语义分析等现代智能技术。再说,利用者所需档案信息的内容也不尽相同,包括政策、法规、凭证、经验、教训、知识等各方面,而这些档案信息和需求又常常是相互联系的,因此,利用者对检索提出了更高的要求,只有在检索中运用概念联想、数据库动态链接等智能技术,才能帮助利用者实现其需求目的。可见,只有实现智能检索才能满足利用者日益复杂的信息需求。
(二)科技环境分析
1、档案信息检索系统自身发展的要求
在网络日益成为日常信息传输手段的时代,要从海量档案信息中找出利用者所需信息,传统的人工检索方法和技术显然已力不从心。摩尔斯定律认为:一个情报系统如果对使用者来说取得情报要比他不取得情报更费事更麻烦的话,这一系统就不会得到利用。事实证明,当系统的用户需求和环境发生变化时,如果该系统仍然维持原有模式和功能而不能相应发展的话,那么,这种过时的检索系统恰好为摩尔斯定律所言中,即利用者就会觉得用它比不用它更费事更麻烦,这样的系统除了死亡,就不配有更好的命运了。因此,系统只有与时俱进,不断进行技术革新和升级才能生存下来,譬如运用模拟人类思维的分辨和联想来适应利用者需求和检索环境的变化,使信息检索系统自身逐步实现智能化。
2、人工智能技术进步的影响
档案信息检索系统智能化的产生得力于人工智能技术的发展。人工智能技术,说得通俗一点,实际上就是一种能够进行计算、推理等思维活动的智能机器,现已发展到能够进行模式识别、物景分析、联想记忆模拟、自动定理证明、自动程序设计、专家系统、自然语言处理的程度。其中模式识别、物景分析、自然语言处理和专家系统等技术均与信息检索智能化相关联,例如模式识别可用于基于图像的检索,专家系统是智能检索实现的基础。人工智能技术用于档案信息检索系统,必将导致档案信息检索理论和方法发生实质性变化,使档案信息检索进入智能化的新时代。
三、档案信息检索智能化的发展趋势
档案信息检索智能化建设的发展方向,应与图书、情报基本一致,主要显现在:
(一)向智能信息检索技术的方向发展
20世纪80年代以来,国内外智能检索系统开发呈现出加速发展的势头。二十多年来,智能检索系统不断由智能检索接口系统向智能信息检索系统转变。智能检索接口系统是利用人工智能技术对传统信息检索系统的接口进行改善,即对检索策略的构造和检索后的反馈进行调节,但未改变检索系统内部的结构和组织方式。前期智能检索接口系统没有区别不同的利用者,后期系统对不同利用者的专业、身份、兴趣等建立了详细的用户模型,使系统能根据不同利用者提出不同的检索策略。其优点是实现了原系统数据结构与现有系统的友好链接,其缺点是没有实现真正意义上的智能检索。智能检索系统则是完全基于知识的全面信息检索系统,完全更新了整个系统的结构,其基本结构由用户界面、文本处理和知识库组成。其中,知识库是一个由知识库系统、数据库系统、检索推理系统组成的分布式系统,各部分相对独立。其知识库系统包含了检索专家的知识、经验和相关领域的知识,如专业知识、领域专家知识等,并按照一定方式组织存储起来,作为推理的前提。其检索推理系统根据推理机制进行具体的推理检索,能够充分利用知识库中已有规则和知识推出未知内容,提炼出符合利用者需求的信息,实现智能化检索。文本处理系统利用计算机自动处理自然语言形式的文本输入,即利用知识库中的语言学及相关科学的知识,对文本进行语法语义分析,通过理解文件内容主题,将其表示为知识库中的知识和数据库中的数据元素,不断地丰富目标知识库和数据库。与智能检索接口系统相比,智能信息检索系统的优势十分明显,并随着信息技术和人工智能技术的发展,智能信息检索技术必将日臻成熟并取代接口技术,实现档案信息全面智能检索。
(二)向多维检索系统的方向发展
在信息网络化时代,网络给人们带来的是海量信息。从网络信息利用的情况来看,人们使用最方便和最广泛的是Web,因此,智能信息检索系统一旦与web成功结合,就会大大提高该系统的使用效率。就信息传播便捷有效的要求而言, web与智能检索结合不仅是必要的,而且INTERNET、网络数据库和web网间数据库链接技术的迅猛发展为实现这一结合提供了可能。例如GeneCards 系统,就是实现web检索的一个较为成功的范例。该系统作为一个人类基因及其产物和相关疾病的数据库,是一个以网页界面浏览的知识平台,既有完整的导览辅助应用系统,又有专家建议的提示,再加上拼字检查功能,已成为一套十分方便好用的生物医学资源工具。
(三)现代化档案馆应该沿着信息检索智能化的方向发展
基于概念和语义的检索技术和跨语言检索技术等新的检索技术的产生,网络技术的发展,已使档案信息检索智能化趋势显露出来,档案馆只有沿着这一方向前进,才能实现真正意义上的现代化,其社会功能才能全面地发挥出来。
参考文献
1、粟莉:《我国智能情报检索研究的回顾与展望》,《情报科学》2001第2期。
2、冯惠玲、张辑哲主编:《档案学概论》,中国人民大学出版社,2001年6月第1版。
3、李明、沈红君:《情报检索智能化》,《情报理论与实践》,1996第6期。
邹吉辉,攀枝花学院档案馆馆长、人文社科学院教授,中国档案学会会员,已发表档案学论文38篇。电话:(0812)3370668、6992606;邮编:617000
 

 
(文/小编)
免责声明
• 
本文为小编原创作品,作者: 小编。欢迎转载,转载请注明原文出处:http://www.dawindow.com/tech/201811/1786.html 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们kf@dawindow.com。
 

Copyright © 2018 档案之窗(dawindow.com)     深圳司捷科技有限公司    版权所有       粤ICP备18047471号-1