视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
信息检索复习资料
2025-09-26 03:22:12 责编:小OO
文档
信息检索复习要点

第一章

一、情报和文献

1.情报(P4  1.2.3)

   情报就是为了解决一个特定问题从一定文献资料中提取或经过传递获得的知识。

   知识性、传递性、针对性是情报的3个基本属性。

2.文献(P5  1.2.5)

   记录有知识的一切载体叫文献。

   知识内容、信息符号、载体材料、记录方式是文献的4个基本要素。

二、文献按载体划分(P5~6  1.3.1)

1.印刷型

2.微缩型

3.视听型

4.电子型

三、文献级次划分(P6  1.3.2)

1.零次文献:非正式出版物或非正式渠道交流的最原始的文献。如手稿、演讲、听取经验交流,甚至包括口头言论。

2.一次文献:依据作者本人的研究或成果制作成果创作的文献,即通常所说的“原始文献”、“第一手资料”。如图书、期刊论文、科技报告、学位论文、专利说明书等。(原创性)

3.二次文献:按一定的方法对一次文献进行加工,使之有序化而形成文献。如目录、索引、文摘等。(有序性)

4.三次文献:一般是围绕某个专题或出于特定目的,根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩等深度加工而形成的文献。如各种评述、进展报告、教科书、词典、年检、百科全书等。(综合性)

四、ISBN和ISSN(P7~9  1.3.3)

1.ISBN(国际标准书号)

(1)它是由国际标准化组织1972年公布的一项国际通用的出版物统一编码。它是由10位数字组成,共分4段【组号、出版社号、书序号、校验码(1位数,ISBN最后一位数值)】。

(2)校验方式:将ISBN 1~9位数字顺序乘以10、9、8、7、6、5、4、3、2这9个数字,将这些乘机之和再加上校验码,如果能被11整除,则这个ISBN号是正确的。

2.ISSN(国际标准连续出版物编号)

(1)实现对全世界文献的管理。由8位数字组成分2段,每段4位数字。中间用“-”隔开前7位是刊名代号,最后一位是计算机检验位。

(2)检验方式:将ISSN 1~7位数字顺序乘以8、7、6、5、4、3、2这7个数字,将这些乘机之和再加上检验号,假如能被11整除,则这个ISSN号是正确的。

第二章

一、信息检索(P12)

从广义的角度讲,文献检索是指把文献按一定方式组织和存储起来,并针对用户的需求找出所需的文献过程,亦叫信息检索。而人们一般所指的文献检索,是指狭义的文献检索,即最后一个过程——信息检索,文献的查找过程。

二、信息检索的类型(P13  2.1.2)

1.按照检索的对象的不同,人们将信息检索分为文献检索、数据检索和事实检索。

2.按照检索的方式的不同,人们还常将它分为手工检索和计算机检索。

三、图书的四大常用检索点(P20  2.3.1)

1.书名

2.作者

3.主题词

4.分类号

四、检索语言的基本种类(P19  2.3)

检索语言是文献检索中用了描述文献特征和表达信息提问内容的一种专门化的人工语言,是信息组织和文献检索共同使用的语言。

检索语言大致分为分类语言(P19)和主题语言(P24)两种。

(1)最早的图书分类法(P20  2.3.1 2)

我国西汉刘向、刘歆父子所著的《七略》。它首创的“七分法”对后世我国的分类思想的形成和发展影响极大。

(2)四库全书(P21 小资料)

纂修与清乾隆年间的《四库全书》,从收集编纂到成本,共用10年(1173-1782),集我国古代文献典籍之大成。共著录图书3461种,79309卷,36000余册。《四库》将各种书籍分为经部、史部、子部、集部。各部下分若干类,类下细分为属。

(3)全球使用最广的分类法(P21 2.3.1 3)

《杜威十进分类法》(DDC)是当今世界上影响最大、用户最多的图书馆分类法。

(4)、中图法(P23  2.3.1 4)

《中国图书馆图书分类法》是我国建国后编制出版的一部具有代表性的大型综合性分类法,简称《中图法》。

它首先将知识门类分作哲学、社会科学、自然科学三大部类,同时根据马克思列宁主义、思想的指导作用和文献分类本身的需要,增设马列主义、思想和综合性图书两大部类,构成5大部类。根据文献分类的需要,类表将马列主义、思想,哲学和综合性图书3个基本部类直接设置为基本大类,同时将社会科学部类扩充为9个基本大类,自然科学部类扩充为10大类,这就构成了22个基本大类。(分类表如下)

《中图法》基本大类展开示意表

马克思主义、列宁主义、思想············A  马克思主义、列宁主义、思想、理论

哲学········································B  哲学

社会科学····································C  社会科学总论

                                             D  政治、法律

                                             E  军事

                                             F  经济

                                             G  文化、科学、教育、体育

H  语言、文字

I   文学

J   艺术

K  历史、地理

自然科学····································N  自然科学总论

O  数理科学和化学

P  天文学、地球科学

Q  生物科学

R  医药、卫生

S  农业科学

T  工业技术

U  交通运输

V  航天、航空

X  环境科学、劳动保护科学

综合性图书··································Z  综合性图书

五、文献检索的方法(P27  2.4)

1.常用法(也称工具法)

(1)顺查法

(2)倒查法

(3)抽查法

2.追溯法

3.循环法(也称综合法)

六、文献检索的程序(P30  2.4.3)

(可能论述:从检索程序入手,就一个检索课题如何利用纸本文献、数据库、网络资源全面搜集资料)

1.分析待查项目,明确主题概念

2.选择检索工具

3.确定检索途径和检索标识

4.查找文献线索,索取原文

七、查全率和查准率(P31  2.4.4)

1.查全率

   亦称检全率、命中率、召回率等,指系统实验检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的实有信息资源的总数之比。

查全率=检验出的相关信息资源量/系统相关信息资源总量* 100%

查全率反映的是检索系统检出的相关信息资源的能力

2.查准率

   亦称检准率、相关率、检索精度,指系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总是之比。

查准率=检验出的相关信息资源量/检出的信息总量* 100%

查准率反映的是检索系统排除与检索提问无关信息资源的能力

第三章

一、计算机检索的四个阶段(P34  3.1.2)

1.脱机检索时代

2.联机检索时代

3.光盘检索时代

4.网络检索时代

二、学会提炼检索词

三、布尔检索及逻辑组配(P39  3.2.1)

规定检索词之间的逻辑关系的运算符,称为布尔逻辑运算符。布尔逻辑运算符包括逻辑“或(OR)”、“与(AND)”和“非(NOT)”。

1.或(OR)运算符,也可用“+”代替,表示并列。其含义是,检索的记录至少有两个检索词中的一个。

2.与(AND)运算符,也可用“*”代替,表示相交关系或限定关系。其含义是,检出的记录中,必须同时含有所有的检索词。

3.非(NOT)运算符,也可用“-”代替,表示排除不需要的检索词。用于缩小检索范围。

四、检索策略(P50  3.3)

广义上的检索策略是为实现检索目标而制定的全盘计划或方案,指导整个检索过程

狭义上的检索策略师指检索式。它是用来表达用户提问的逻辑表达式,是对多个检索词之间的相互关系和检索顺序作出某种安排,是整个检索策略的综合体现。

1.扩检(P55  3.3.5)

   一般将设置的检索范围太小,命中文献不多,需要扩大检索范围的方法称之为扩检。

2.缩检(P55  3.3.5)

   一般将设置的检索范围太大,命中文献太多,需要缩小检索范围的方法称之为缩检

第四章

一、IP、DN、URL(P63  4.1.2 5)

1.IP(Internet Protocol 互联网协议地址)

为了使加入互联网的计算机在通信时能够相互识别,网际互联IP协议规定每台正式入网的计算机都要有一个唯一的网络IP地址。

一个IP地址由4个字节共32位的数字串组成,这4个数字串用小数点分隔。每个字节的取值范围0~255,可用十进制或十六进制表示。IP地址是互联息定位所必须的,每台上网的计算机都有一个唯一的IP地址,它的作用类似于上网计算机在信息高速公路上的门牌号码。【如120.94.184.118(重师大学城雅风苑A栋某寝室端口IP)】

2.DN(Domain Name 域名)

由于IP地址是数字形式,不便记忆,互联网就采用了域名系统(DNS),依据通信地址给每台主机起一个名字,这个名字就被称为域名(DN)。

域名一般由2~5段字符组成,采用层次结构,每一层构成一个子域名(Sub-domain),各子域名之间以圆点分隔最右边的子域名是顶级域名(Top-level domain)。

【如重庆师范大学的域名www.cqnu.edu.cn表示这台主机是在中国(cn)这个顶级域名下,属于教育机构(edu)这个子域名,cqnu表示这个这是重庆师范大学内的一台主机,www是它的主机名(说明他是一台Web服务器)】

3.URL(Uniform Resources Locator 统一资源定位器)

为了使连入互联网的计算机查询信息时,特别是通过Web浏览器查询信息时,有一个标准的资源地址访问方法,人们开发了一种标识方法,成为统一资源定位器(URL)。

URL用于互联网中按照统一方式来指明和定位一个WWW资源地址。

URL由协议方式、主机IP地址(或域名)、端口(属于可选项)、路径、文件名构成。

【如URL地址http://www.cqnu.edu.cn/lib/index.html ,这是一个使用超文本传输协议HTTP提供超文本信息服务的资源,其计算机域名为www.cqnu.edu.cn ,从域名上看出这是中国教育科研网上的一台计算机,访问的超文本(文件类型为.html)是位于该计算机的lib目录下的index.html。】

二、搜索引擎的概念(P66  4.2)

搜索引擎是人们对网上各种信息资源进行标引和检索的一种工具,它是一种能通过互联网接受用户的检索标识,并向用户返回符合其检索要求的信息资源网址的网站。

搜索引擎又称搜索机,是网上的导航工具,是一种搜索WWW信息的软件。

1.根据搜索引擎信息搜集方法和服务提供方法的不同划分

(1)目录式搜索引擎(全称分类目录式搜索引擎)

目录式搜索引擎是以人工方式或半自动方式搜集信息。

优点:信息准确、导航质量高

缺点:需要人工介入、维护量大、信息量少、信息更新不及时。

代表:Yahoo、新浪分类目录

(2)机器人搜索引擎(也称全文检索型搜索引擎)

优点:信息量大、信息更新及时、无须人工干预

缺点:返回信息多,可能有很多无关信息,用户必须从结果中进行筛选。

代表:Google、百度、北大天网

服务方式:面向网页的全文检索服务

(3)元搜索引擎(也称多元搜索引擎)

这类引擎本身并没有存放网页信息的数据库,靠集成多个搜索引擎运行。

优点:可以同时获得多个源搜索引擎的结果,因此返回的信息量更大、更全。

缺点:对检索结果的控制能力低。

代表:Dogpile

服务方式:面向网页的全文检索服务

机器人搜索引擎的结构(搜索引擎的工作程序):搜索器、索引器与索引数据库、检索器、用户接口。四个部分。(P77)

二、布尔检索技术在搜索引擎的应用

百度(P103):逻辑与(“+”或空格)、逻辑非(“-”)、逻辑或(“|”)

Google(P107):逻辑与(“+”或空格)、逻辑非(“-”)、逻辑或(大写“OR”)

三、site,inurl,intitle,filetype 等检索语法的使用和结合使用(P86)

1.Site 按网域搜索

表示搜索局限于某个具体的网域、网站或者网站频道

使用方法:[关键词 site:网址]或[site:网址 关键词]

2.Inurl 按URL搜索

表示搜索结果所返回的网页URL链接中包含第一个关键词,后面的关键词则出现在链接中或者是网页的文档中。

使用方法:[inurl:目录 关键词]

3.Intitle 按网页标题搜索

   表示搜索的关键词包含在网页的标题中。

使用方法[intitle:关键词]

4.Filetype 按文件格式查找

   表示用以控制查询结果中输出具有特定文件类型扩展的文件。

使用方法:[关键词 filetype:文件格式(后缀名)]

四、精确检索、二次检索、网页快照、高级检索等实际检索的实际应用(P88  4.3.3)

1.精确检索

2.二次检索

在当前搜索结果的基础上再进一步查找

3.网页快照

是直接从搜索引擎数据库缓存中调出的该网页的存档文件,以方便用户在浏览网页内容后决定是否访问该网站,或是在对应网页发生变动时查看原始网页。

4.高级检索

通过设置相应的选项,搜索者可以严格界定关键词的出现状况,从而得到精确地搜索结果,提高搜索效率。

五、熟悉百度和Google的基本检索和高级检索、Google的学术搜索引擎

1.Google的学术搜索引擎( 网址:http://scholar.google.com )是目前影响最大的学术搜索引擎。(P95~97  4.5.1)

优先:相关性、全文搜索、非在线文章搜索

2.百度(P99~104  4.6.1)

百度是目前全球最优秀的中文信息检索与传播技术供应商。

特色:

(1)检索结果能标示丰富的网页属性,并突出用户的查询串,便于用户判断是否阅读。

(2)支持二次检索

(3)相关检索词推荐技术

(4)搜索框提示

(5)百度快照巧妙的解决了搜索用户经常遇到的死链问题

(6)常用搜索功能

(7)智能性、可扩展性的搜索技术保证最快地收集互联息

(8)支持多种高级检索语法

(9)精确匹配——双引号及书名号

(10)高级搜索和个性设置

3.Google 谷歌(P104~107  4.6.2)

Googol是目前世界排名第一的搜索引擎,中文名为谷歌。

特色:

(1)手气不错

(2)集成化的工具条

(3)繁简转换

(4)支持多种高级检索语法,而且语法种类比百度丰富。

第五章

一、数据库的类型

1.参考数据库

参考数据库指主要针对印刷出版物开发的,指引用户能够快速、全面的鉴别和找到相关信息的数据库。属于二次文献

2.全文数据库

全文数据库即收录有原始文献的数据库。属于一次文献

3.事实数据库

事实数据库指包含大量数据、事实,直接提供原始资料的数据库,又分为数值数据库、指南数据库、术语数据库等。属于三次文献

二、掌握我馆所有的正式数据库中的本地镜像数据库

(各自的文献收录类型,如哪些是期刊数据库,哪些是图书数据库,哪些是硕博论文数据库,哪些是视频数据库;一般检索和高级检索方法,提供的检索途径,文献全文提供的格式,对应的阅读器,文字识别方法,CNKI、维普作为重点)

1.正式数据库的分类

   期刊数据库:中国知网(CNKI)、维普

   图书数据库:书生、超星、圣典EBOOK

   硕博论文数据库:万方

   视频数据库:"知识视界"视频教育资源库、软件通-学习视频库、ADKS 流媒体网上报告厅、超星名师讲坛

2.CNKI(P115  5.2)

CNKI:China National Knowledge Infrastructure 中国知识基础设施工程,是以实现全社会知识信息资源共享与增值利用为目标的国家信息化重点工程,被国家科技部等五部委确定为“国家级重点新产品重中之重”项目,由清华大学、清华同方发起,始建于1999年6月。

检索方法和检索途径(P118~129)

文献提供格式:CAJ和PDF,阅读器:CAJViewer

3.维普(P132  5.3)

重庆维普资讯有限公司(Vipinfo)是最早开发中文科技期刊篇名数据库,是中文期刊数据库建设事业的奠基人。

检索方法和检索途径(P133~143)

文献提供格式:PDF,阅读器:Acrobat Reader

三、馆藏书目数据库的检索方法(P188  5.9,2)

1.登陆

   在浏览器地址栏输入IP地址 202.202.215.132 (或链接http://lib.cqnu.edu.cn )

2.进入检索界面

3.检索

第六章

一、目录、文摘、百科全书的概念

1.目录(P193  6.2.1)

   目录(Catalog)也称书目,是一种揭示和报道书刊文献的检索工具,它著录一批相关的图书或报刊的外部特征,并按一定的次序排列而成。

2.文摘(P197  6.2.3)

   文摘(Abstract),是对文献内容的摘要,即将文献资料中有价值的知识、内容摘录出来,形成准确、扼要、精炼的文字。

3.百科全书(P198  6.3.1)

   百科全书(Encyclopedia)是以词典的形式编排的、荟萃各门类知识或某一门知识的大型参考性工具书。

二、世界三大著名百科全书ABC

A  《美国百科全书》 又称《大美百科全书》

B  《新不列颠百科全书》 又称《大英百科全书》

C  《科利尔百科全书》

三、工具书的分类和特点(P191  6.1.1)

1.检索型工具书(P193  6.2)

   检索型工具书只提供线索属于二次文献

小类:

(1)目录  其代表有:《全国总书目》(年刊,查找后出版的图书的主要工具之一)、《全国新书目》(月刊,报到全国新书出版状况的刊物)、《新华书目报》

(2)索引  其代表有:《全国报刊索引》(月刊,全面系统提供国内报刊文献资料的综合性检索工具)、《(复印)报刊资料检索》(是检索哲学社会科学报刊论文的重要工具)

(3)文摘  其代表有:《新华文摘》(月刊)、《中国社会科学文摘》

2.参考型工具书(P198  6.3)

   参考型工具书你能直接提供内容属于三次文献。

小类:

(1)百科全书  其代表有:百科全书“ABC”、《中国大百科全书(74卷)》

(2)年鉴      其代表有:《中国百科年鉴》、《中华人民共和国年鉴》(全面反映中国社会主义改革开放和现代化建设成就、国家方针和重大事件的综合性、权威性的国家年鉴)、

《中国教育年鉴》(反映中华人民共和国各级各类教育发展情况的年刊)、

《中国统计年鉴》(四号全面反映中华人民共和国经济和社会发展情况的资料性年刊)

(3)手册      其代表有:《生活科学手册》(综合性)、《化学物理手册》(专门性)

(4)名录      其代表有:《中国科学家名人录》、《中华人民共和国名人录》

第九章

一、学术论文的基本格式及写作要求(P258      9.2)

基本格式:

学术论文分两部分:前置部分——题名、论文作者、摘要、关键词、分类号;主体部分——引言、正文、结论、致谢辞(必要时)、参考文献

科技论文目录体系一般不用中文的“一、二、三”,而用阿拉伯数字的编码方式,章节标题的编号和排列采用阿拉伯数字分级编写,即一级标题1,2,3···;二级标题1.1,1.2···2.1,2.2···;三级标题1.1.1,1.1.2···。标题一般不超过4级。引言、概述等编号用“0”。节、条、款、项、目都应有标题,而且字数不能太多,有的刊物要求不能超过15个汉字。

写作要求:

1.论文标题

    准确得体、简短精炼、外延和内涵恰如其分、醒目。一般不超过20个汉字。

2.作者姓名单位

    作者姓名需用真实姓名

3.摘要

    摘要是论文内容不加注释和评论的简短陈述,具有性和自含性。

4.关键词

    每篇论文可选3~8个关键词,必须是论文中具有实际意义的词语或术语,能表示出论文的关键主题内容。

5.分类号

    亦称中图分类号,如果一篇论文涉及多学科内容,可以同时给出几个分类号,但主次分类号须按先后顺序排出。

6.引言

又称前言,引言应言简意赅、不要与摘要雷同,不要成为摘要的注释。

7.正文

正文是论文的主体和核心,一篇论文的好坏,关键在于正文部分的阐述得水平。论文必须围绕论点组织材料,同时采用恰当的论述方法,阐明论点的正确性。

8.结论

    结论是对论文的总结,要求准确、完整、简练,言简意赅的表达文章的本意。

9.参考文献

两种标注方法,“顺序编码制”、“著者-出版年制”

10.致谢辞

用于感谢他人的无私帮助。要求诚恳、真挚、实事求是、切勿哗众取宠。

二、学术论文的选题原则(P261  9.3)

1.创造性原则

2.价值性原则

3.可行性原则

三、参考文献注意事项(详见 参考文献常用代码及著录格式)下载本文

显示全文
专题