JIANGSU TEACHERS UNIVERSITY OF TECHNOLOGY
科技信息检索
学 院: 计算机工程学院
专 业: 网络工程
班 级: 08计三W
学 号: 08141310
姓 名: 周倩倩
2011 年 04月
现代网络信息检索
摘要:网络信息资源的全球化,信息检索的方法多种多样,为信息的获取提供了更新更快捷的途径,使用户可以方便地获得更专业化的信息资源。本文主要论述了信息检索的发展和网络检索的特点,从多方面叙述了网络检索技术以及其检索方法的运用。
关键词:网络资源,信息检索,检索模型,信息检索技术
1、网络信息检索的发展过程
在1990年以前,没有任何人能够在互联网上检索到信息,人们都是通过手工检索和光盘检索来获取信息,直到1990年AlanEmtage等人发明了能够实现简单的FTP文件检索的Archie。随着WWW的出现,基于网页的信息检索工具迅速发展起来。伴随着网络技术的发展,网络信息检索工具也取得了长足的发展。
2、网络信息检索的特点
2.1数据丰富且分布广泛。由于网络的高度开放与自由,网络信息资源非常丰富,包括电子期刊、新闻、天气、股市行情等还有各种数据库、软件资源及个人主页、BBS等各种信息;它们的格式不一,包括文本、图像、音频和视频等信息对象,这些信息分布面广,信息源遍布全球,多语种且涵盖了几乎所有的知识领域,类型繁多。
2.2交互式界面且操作方便。所有的网络信息检索工具都具有交互式作业的特点,网络信息检索具有良好的人机会话界面和方便的帮助支持系统,用户只要提出自己的检索要求而不需要去执行检索过程就能得到自己的检索结果,不需要用户花太多的时间去学,只要掌握一些检索技巧就可以检索自己需要的文献,使用起来简单、方便。
2.3检索速度快且灵活。网络信息资源检索十分快捷。用户可以不分时间和地点,也不分空间,可随时利用网络来查阅各类信息资源,寻找自己感兴趣的文献。同时用户在网上检索文献信息资源还可以从多种载体、多种角度进行检索,网络系统还可根据用户输入检索内容的情况,控制检索结果,用户可以根据检索结果来调整检索策略。
3、网络信息检索技术
3.1智能化技术。网络信息检索智能化是基于自然语言的检索形式,机器根据用户提供的自然语言检索式进行分析,形成建设策略进行建设。智能化运用于信息检索主要包括智能搜索引擎、智能浏览器和智能自动搜索软件。目前,智能搜索引擎是一个研究热门,它除了能提供传统的快速检索、相关度排序等功能,还能够对知识有一定的理解与处理能力,并且允许采用自然语言进行检索,具有信息服务的智能化、人性化特征。
3.2多媒体检索技术。随着网上非文本信息的日益增多,以往抓哟针对文本信息而设计的信息检索系统已无法适应时代的变化和满足人们的需求,于是产生了多媒体检索技术。多媒体检索技术出来利用传统的数据库对图像的文字信息和管理外,还要理由多媒体对象的特征等进行检索和查询。多媒体建设是一种基于内容特征的检索,它不仅可以对多媒体对象的内容进行检索,而且还可以检索出多媒体对象的特征。
3.3 XML。网络结构的混乱嘈杂,以及缺乏统一标准化的描述方法和手段,严重影响了网络信息检索质量。而XML(ExtensibleMarkupLanguage,可扩展标记语言),实际上是Web上表示结构化信息的一种标准文本格式,它没有复杂的语法和包罗万象的数据定义。作为一种可扩展语言,XML具有强大的可扩展性,良好的数据库存储格式,较长的保值性,高度的结构化和便于网络传输等优点。
4、网络信息检索的模型
目前,常用的网络信息检索模型有布尔逻辑检索模型、概率检索模型、向量空间模型、基于本体的信息检索模型等。
4.1布尔逻辑检索模型。
逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,主要的运算符有逻辑“与”、逻辑“或”、逻辑“非”。用户可以根据检索项在文档中的布尔逻辑关系提交查询,检索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,即所检索的文档要么与查询相关,要么与查询无关。
4.2概率检索模型。
它是基于贝叶斯概率原理而提出的,建立在相关性理论基础上,它根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相关性来进行信息检索。基于对相关性的不同理解可建立不同的模型,由此可导出不同的排序输出原则。比如当文件按相关概率递减原则排列时可以获得最大的检索性能。
4.3向量空间模型。
它是将文档和查询以向量的形式来表示,通过计算向量的相似度来判断文档与查询的相似度,并将查询返回的结果按相似度进行排序。向量空间模型只是提供了一个理论框架,可以根据需要使用不同的权重评价函数和相似度计算方法,因此,该模型具有广泛的适应性和强大的生命力。
5、掌握实用的检索技巧
用户通过掌握一些实用的检索技巧,可以极大地提高检索的效率。
5.1提高检全率的技巧。通过使用上位词或相关词来降低检索词的专指度,如使用同义词、近义词、简称等。这是由于检索软件的智能化程度较低,一般执行与关键词的简单字面相匹配,因而会漏检与关键词相关或一致的概念,使用上位词或相关词可以全面地检索出有关信息。取消某些过严的,尽可能在所有检索的字段中检索;使用逻辑词“OR”进行
检索;使用多个检索途径;使用多元搜索引擎来检索同一个主题概念。
5.2提高检准率的技巧。通过增加或换用下位词和专指度较高的词来提高检索式的专指度;增加某些概念进行;利用“NOT”一些不相关的概念;检索词出现的可检字段;使用逻辑词“AND”进行检索;利用二次检索功能,即利用前一次检索的结果作为后一次检索的范围,从而逐步缩小检索范围;转换搜索引擎,即先通过多元搜索引擎了解网上是否有相关信息以及在哪里可找到这些信息,再利用搜索引擎进行更深入的检索。
5.3提高检索速度的技巧。机检和手检有机结合起来。无论是利用各检索站点的特色服务,还是利用不同引擎的优点,都属于机检。机检即计算机检索,包括光盘检索、联机检索、网络检索。手检即手工检索,主要是利用工具书和期刊查找资料。尽管计算机检索的出现变革了信息检索,改变了传统手工检索的方式。但是,由于机检受信息量、网速等诸多因素的极大影响,往往会出现信息拥拥堵的现象,使用户感到束手无策。因此,有时也需要将机检与手检有机结合,以达到更好的效果。
随着因特网技术的发展,网络信息检索技术也应该加快其改进和完善的步伐,才能满足日益增多的检索需求。同时,信息用户作为信息检索的主体,要掌握网络信息检索的基本策略,不断提高自身的检索技能,从而更好地实现检索目的。
参考文献:
[1]张冬梅.浅议网络环境下的信息检索[J].网络财富,2009(11):124-1253.2.4
[2]沈扬.浅论网络信息检索[J].科技信息,2009(31):82-109
[3]林群霞,黎小平.网络信息检索及其前沿技术的发展[J].惠州学院学报,2009,(3):69-73