视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
网络信息检索及其检索工具
2025-09-29 05:15:44 责编:小OO
文档
摘  要

进入20世纪90年代以后,互联网的发展风起云涌,人类社会的信息化、网络化进程大大加快。与之相适应的信息检索的交流平台也迅速转移到以WWW为核心的网络应用环境中,信息检索步入网络化时代,网络信息检索已基本取代了手工检索。

网络信息资源的迅猛增长,使人们获得有用信息越来越困难,网络检索工具应运而生,文章介绍了网络信息检索工具的类型和功能,提出了检索工具的发展趋势。

关键字:网络信息检索;检索工具;因特网;web资源检索

目  录

摘  要    I

1 信息检索的定义    1

2网络信息检索简介    1

2.1网络信息检索定义    1

2.2 网络信息检索的原理    1

2.3网络信息检索与传统信息检索的区别    2

2.4网络信息检索技巧    2

3网络信息检索工具类型    3

3.1非web资源检索工具    3

3.2web资源检索工具    3

4网络信息检索工具的功能    4

5网络信息检索展望    5

5.1网络信息检索的展望    5

5.2网络信息检索工具展望    5

参考文献    6

浅谈网络信息检索及其检索工具

1 信息检索的定义

什麽是信息?信息是消息,人们在学习、工作、日常生活中随时随地都在接受和利用信息;信息是资源,它具有使用价值和价值;信息是财富,且是无价之财富;信息是生产力要素,更是一种不可估量的促进生产力发展的新动力。因此,人类社会的发展,科技技术的进步,都离不开信息资源的开发和利用。而且,信息资源的真实状况及开发利用程度,已经成为衡量一个国家经济、文化、科技以及综合国力的重要指标。我们怎样快速的查找信息和有序的整理信息?信息检索是最快的途径。

信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术。人们获取信息源的方式主要有:①传统的信息检索方法,通过人工查询在图书馆等提供文献的机构进行文献的查询和获取活动;②联机信息检索相对于前者来说具有实时性、完整性、共享性、广泛性等优点;③网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。

2网络信息检索简介

随着信息技术的飞速发展,信息已成为全社会的重要资源,对信息的占有程度及信息处理水平的先进程度已成为衡量一个国家或地区现代化程度的重要标志,而网络上丰富的信息在更大程度上改变了人们的工作和生活的方式。Internet是当今世界上规模最大、覆盖面最广、信息资源最丰富、发展最为迅速的信息网络,基于Internet的网络信息检索的研究,无论对研究人员还是一般用户来说,都有着很强的现实性和实用性。

2.1网络信息检索定义

网络信息检索是指通过网络信息检索工具检索存在于Internet信息空间中各种类型的网络信息资源。

2.2 网络信息检索的原理

网络信息检索工具是网络信息检索技术的实物体现。目前,常用的网络信息检索模型有布尔逻辑模型、模糊逻辑模型和概率模型等几种方式。

(1)布尔逻辑模型——这是一种简单而常用的严格匹配模型。用户可以根据检索项在文档中的布尔逻辑关系提交查询,搜索工具根据事先建立的倒排文档结构确定查询结果。标准的布尔逻辑模型为二元逻辑,所搜索的文档要么与查询相关,要么与查询无关。利用这种模型进行查询,其查询结果一般没有按照内容的相关特性排序。

(2)模糊逻辑模型——它在查询结果处理中引进了模糊逻辑比较,并且按照相关的优先次序排列查询结果,这样就可以克服布尔逻辑模型信息查询结果的无序性。

(3)概率模型——它是基于贝叶斯概率原理而提出的,根据词条、文档间的内在联系,利用词条间和词条与文档间的概率相依性来进行信息检索。

2.3网络信息检索与传统信息检索的区别

 

           检索方式

比较方面网络信息检索传统信息检索
检索时间
检索指标查全率高查准率高
检索费用相对低相对高(信息使用费、服务费、通讯费)
信息内容范围数字化、多媒体信息纸制文献信息
检索信息质量查全率高查准率高
2.4网络信息检索技巧

目前常用的信息检索方法有两种:一种是利用搜索引擎进行关键词、主题词或自然语言检索。最著名的搜索引擎有AltaVista、Excite、HotBot、Info seek等;另一种是按主题分类指南进行检索,如Yahoo ! 就是按主题组织资源、逐次分类,供读者按需查词的;有的检索工具两种方式可以随时切换使用, 如Info seek。相比之下, 前者信息的获取太杂乱, 鱼龙混杂, 精确度太低, 需通过多次筛选才能找到所需信息。 而后者的信息组织系统性较强,精确度较高。但主要问题在于获取率较低且很难反映信息之间的关联性。由此可见, 两种方法各有利弊, 读者要根据检索的目的来挑选和使用检索工具,同时要学习一些提高检索效果的方法和技巧。

(l) 检索关键词具体化;

(2) 运用词组检索;

(3) 巧用Boolean逻辑词:AND、OR 和NOT。

3网络信息检索工具类型

网络信息检索工具是指在因特网上提供信息检索服务的计算机系统,其检索的对象是存在于因特息空间中各种类型的网络信息资源。按检索资源的类型,可分为两大类:即非web资源检索工具和web资源检索工具。

3.1非web资源检索工具

非web 资源检索工具是以 FTP、Telnet、Gopher等为检索对象。

(1)FTP类的检索工具

这是一种实时的联机检索工具,用户首先要登陆到对方的计算机,登陆后即可以进行文献搜索及文献传输有关的操作。使用 FTP(文件传输协议)几乎可以传输任何类型的正文文件、二进制文件、图像文件、声音文件、数据压缩文件等。在这类检索工具中,Archie是最常用的。Archie是自动标题检索软件,它借助于 FTP来访问。用户只需告诉其要检索文件名的有关信息便可获得文件所在的主机名、路径。与一般检索工具不同的是,它不用主题来实现相应的检索,而只能根据文件名和目录名进行检索。它是获取免费软件和共享软件资源不可缺少的工具。

(2)Telnet 类的检索工具

它指的是借助远程登陆在网络通信协议的支持下,在远程计算机上登陆,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问,使用远程计算机中对外开放的资源。

使用Telnet协议进行远程登陆时需要满足以下条件:本地计算机上必须装有包含Telnet协议的客户程序;必须知道远程主机的IP地址或域名;必须知道登录标识与口令。

(3)基于菜单式的检索工具----Gopher 

Gopher是一种交互式、菜单式信息查询软件,它将各种信息资源加以分类,再用菜单的形式显示给用户。目前通过Gopher可以进行以下类型信息查询:文本文件信息查询、 Telnet信息查询、电话簿查询、专有格式文件查询。

3.2web资源检索工具

web信息资源是指建立在超文本、超媒体技术基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面展现和提供信息的网络资源形式,与之对应的 web 检索工具多种多样,大体分为三类:搜索引擎、目录型检索工具、多元搜索引擎。

(1)搜索引擎

搜索引擎使用自动索引软件来发现、收集并标引网页 ,建立数据库;以 Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项;代替用户在数据库中找出与提问匹配的记录 , 并返回结果且按相关度排序输出。使用此类工具的检索方法被称为“关键词搜索”,可以在主页查询,也可以在类目下查询。此类检索工具的优点是信息量大且新 , 速度快;缺点是准确性较差。著名的搜索引擎如Meta Vista、Excite、天网、悠游等。

根据其逻辑功能的不同,可分为:搜索器、分析器、索引器、检索器、用户接口。

(2)目录型检索工具

它是按照某种分类体系编制的一种可供检索的等级结构式目录。分类方法以学科分类为主,也有采用图书分类方法的。使用此类工具的检索方法被称为“分类搜索”,这是一种“自顶向下、逐步细化”的搜索方法。自顶开始,每一层都分布有若干“链接点”,选择其中一个,就可沿此分支进入下一层,直到出现所需目标。此类检索工具的优点是检索质量较高,缺点是检索到的信息数量有限,且新颖性不够。有代表性的目录型检索工具如 Y ahoo、G alaxy、Lycos、网易、263 等。现在,搜索引擎和目录型检索工具逐渐整合在一起,以增强检索能力。

(3)多元搜索引擎

多元搜索引擎是将多个搜索引擎集成在一起,并提供一个统一的检索界面 , 且将一个检索提问同时发送给多个搜索引擎,同时检索多个数据库,再经过聚合、去重之后输出检索结果。其优点是省时,缺点是由于不同搜索引擎的检索机制、所支持的检索算法、对提问式的解读等均不相同,导致检索结果的准确性差。常用的多元搜索引擎有DOGPI LE、INFEREN等。

4网络信息检索工具的功能

网络检索工具产生和发展的历史虽然不长,但它的功能却非常强大,关键词检索(Keyword)是最基本功能,包括以下几个方面:

(1)布尔逻辑检索

布尔检索在网络信息资源检索中使用的相当广泛,常用的布尔逻辑算符有 3 种: 逻辑或(运算符为 OR/ or ,有时也可用“|”符号表示)、逻辑与(运算符为 AND/ and ,有时也可用“&”、“+ ”号表示)、逻辑非(运算符为NOT/ not,有时也可用“!”、“- ”号表示)。

(2)词组检索

词组检索是将一个词组作为一个运算单元,进行严格匹配以提高检索的精度和准确度。词组检索是一般数据库中最常用的方法,是通过使用逗号、双引号和括号进行检索。

(3)字段检索

字段检索是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的手段,多以字段限定方式实现。

(4)截词检索

为提高查全率而设计,绝大多数网络检索都支持这一功能,有的是自动截词 , 有的是有条件的截词,尤其在西文检索工具中更是广泛使用。

(5)位置检索

位置检索是指允许指定 2 个单词之间的词序和词距的检索。词序指单词之间前后顺序 , 词距指 2 个单词之间间隔单词数。其操作符多为“NEAR” 。

(6)概念检索

概念检索是指使用某一检索提问词进行检索时 , 能同时对该词的同义词、近义词、广义词、狭义词同样进行检索 , 以达到扩大检索 , 避免漏检的目的。

5网络信息检索展望

5.1网络信息检索的展望

人类已经进入了信息社会,信息社会化与社会信息化是当今重要的时代特征。信息检索作为传递、搜索信息的手段发展愈来愈快。

如果不懂得信息检索,要在浩如烟海的各种信息中寻找自己需要的信息,就如同大海捞针一般困难,掌握了信息检索的方法和技巧,就可以使信息的查询过程更有条理性、计划性,避繁就简,事半功倍。所以,我们应充分利用信息资源,避免重复劳动。科学研究具有继承和创造两重性,纵观科学技术发展史,积累、继承和借鉴前人的研究成果是科技发展的重要前提 。更新自身知识积累,适应社会发展需要。在信息社会,人们需要终生学习,不断更新知识,才能适应社会发展的需求。掌握信息检索的方法与技能,是形成合理知识和更新知识的重要手段。

5.2网络信息检索工具展望

科学技术的日新月异和用户需求的不断提高促使网络检索工具相应发展, 其发展趋势大致可以分为以下几个方面:

一是检索工具的智能化。智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表达的检索要求进行分析,形成检索策略进行检索。它主要包括智能搜索引擎、智能浏览器、智能化自动索引软件。检索工具的智能化的内涵在于检索工具具有学习、分析、辨别推理的能力,它们按照用户的要求,对信息进行更深一步的分析,然后交由用户。

 二是用户友好化进一步提高。未来科技的发展都要以人为本,网络信息检索也不例外,用户友好化是一个重要的发展趋势。它主要包括两个方面的内容,一是用户界面友好化,使用户更方便、快捷的使用各种检索工具,满足用户各种检索要求。另一方面是更好的检索结果提供方式,使用户方便的进行浏览、选择和利用。

 三是信息提供的深入化。这也包括两个方面,一是检索深度的提高,现阶段, 网络检索大多实行相关性检索,其结果往往是海量的,这会分散用户的注意力, 背离原有的目的。为避免这种情况,就要求提高检索深度,由相关性检索向直接性检索发展。另一方面是检索内容的综合化与专业化相结合。网络既提供广泛的信息,又提供更深的内容,依次服务于用户。

网络信息检索工具的研究具有非常重要的意义 , 随着信息技术和新一代因特网的发展 , 它的研究和应用也将迈上一个新的台阶 , 我们期待着网络信息检索工具的发展为网络信息资源检索带来一个美好的明天。

参考文献

[1]魏秀萍.《试析网络环境下高校图书馆的计算机文献检索》[J].甘肃联合大学学报:社会科学版,2005,21(1):94-96.

[2]王曙燕,周明全,耿国华.基于内容的多媒体信息检索技术研究[J].现代电子技术,2005(2):73-75.

[3]梁红妮,何晓萍.信息检索技术的发展与教育的探讨[J].情报探索,2005(1):32-34.

[4]彭丽喃. 专门、专业网络检索工具研究 [J ] . 现代情报 , 2004 , (1) : — 90.

[5]高琳,龚立群. 网络信息检索工具的分类及其发展趋势[ J ]. 昌吉学院学报, 2004 (3) :  - 91.下载本文

显示全文
专题