绪论
一、开设文献检索课的目的(一)掌握获取新知识的能力 (二)培养研究工作的能力
二、文献检索的基本要求
1、对文献资料的要求 1)满足实验室手头需要 2)课题背景资料的查阅 3)跟踪最新情报
2、文献检索课应达到的基本要求1)学会几种常用工具书的使用 2)了解主要的检索方法
三、文献检索课的主要任务
培养人们的情报意识及获取和运用文献信息的能力
1、定义:情报意识是指人们从思想上对于情报信息在经济、社会、事业发展中的地位、价值、功能与作用的认识,是指人们对情报重要性的认识程度和需求情报的迫切程度,以及捕捉情报、分析情报、判断情报和吸收情报的自觉程度。简言之,情报意识是人们在充分认识情报信息价值的基础上,对其所具有的特殊敏感的一种自觉意识。
2、培养:良好的社会环境是培养情报意识的温床。
3、情报能力包括情报的吸收能力、传递能力和处理能力。
培养情报意识应包括两个方面:第一,培养自觉运用各类检索工具查找信息的意识;第二,培养随时注意捕捉各类信息情报{包括文献型和非文献型}的意识。
四、文献检索的作用 1、继承和借鉴前人的成果,避免重复研究或少走弯路。(桥梁作用)
2、促进智力资源的开发利用和两个文明建设(钥匙作用) 3、协助决策者作出正确的决策(决策作用) 4、节省研究人员查找文献的时间(节约作用) 5、充分挖掘图书馆情报单位藏书的使用潜力 6、继续医学教育作用
第一章 信息检索基础
第一节 情报
一、信息、知识、情报
(一)信息1、定义:可被定义为生物以及具有自动控制系统的机器,通过感觉器官和相应的设备,与外界进行交换的一切内容。在自然界、人类社会以及人类思维活动中普遍存在,是物质存在方式及其运动的规律、特点的外在表现。
2、信息的类型1 文字信息2 图像信息3 数值数据信息4 语音信息
3、信息的基本属性1)客观性2)可传输性 3)分享性4)可识别性
(二)知识
1、概念:知识是人脑的产物,属于意识范畴。知识是人类对各种大量信息进行思维、分析、加工提炼,并加以系统深化而形成的结果。简而言之,理性化、优化和系统化了的信息即为知识。人们通过信息对世界的认识与掌握,是人的大脑通过思维重新组合的系统化信息的集合。
2、分类:知识可分为主观知识和客观知识
(三)情报
1、概念 共同点是:为特定用户的需要而提供的原先未知的必要知识就是情报。
2、情报的基本属性1)知识性: 2)传递性:情报是以传递和运动表现活力。3)社会性: 4)价值性: 5)专指性:
信息、知识、情报的联系与区别
信息 > 知识 > 情报
(四)语言:是人类以声波表达的信息载体,即第一种信息载体。在传递和交换上受着时间和空间的严格。
(五)文字:是人类以符号表达的信息载体,即第二种信息载体。能超越时间和空间的进行交换、传递。
二、信息和情报的区别
1、信息属于整个自然界,情报只属于人类之间。
2、信息是物质和存在物自然发射的,情报是人为加工的。
3、信息没有目的性和争对性,情报具有目的性和争对性。
4、信息是客观的不具有主观性,情报既是客观的更具有一定的主观性。
5、信息是物质的动态反映,情报是知识的动态反映。
6、信息的接受者不限于人,情报的接受者必须是人。
7、信息对人不一定都有用,情报必须是对人有用的。
8、信息当中有一些还不能被人类认识,情报是人类已经能够认识的。
9、信息当中有的还不是知识,情报必须是知识。
10、信息是公开的,不具机密性,情报需要时具有机密性。
二 文献
(一)文献的定义:
1、定义:凡属于人类的知识,用文字、图形、符号、声频、视频等手段记录保存下来,并用以交流传播的一切物质形态的载体,统称为文献。
2、构成文献的三要素 1)知识性: 2)物质载体性: 3)记录性:
(二)、文献的类型
1、按文献载体划分
1)印刷型:即纸质文献.是以纸张为存储介质,用各种印刷技术出版的一种文献形式.
优点:便于直接阅读与交流。很受读者欢迎,符合人们传统的阅读习惯。
缺点:存贮密度太低,篇幅庞大,体积笨重,占据储藏空间过多,难于实现自动化输入或自动检索,携带不便,印刷品有相当大的体积,纸质较重,易受虫蛀,水蚀。不易管理和保存。
2)缩微型:是一种以感光材料为载体(存贮介质),以缩微照相为记录手段而产生的一种文献形式。
优点:体积小、容量大、成本低,便于复制、携带和保存,可大大节省储藏空间。
缺点:要借助缩微阅读机才能阅看,时间长了易疲劳。
3)视听型:又称声像资料或直感资料。是一种以磁性材料或感光材料为存贮介质,借助特殊的机械装置,直接记录声音信息或图像信息而产生的一种文献形式。
优点:具有动静交替、声情并茂、形象逼真的视听效果,可直接表现那些难以用文字描述的事物,声象具备,直观性好,同时有很强的存储能力,能够长期保存,并可反复播放与复制。
缺点:需借助特殊的设备。
4)机读型:全称计算机可读型文献。这是一种以磁性材料为载体,以打字、穿孔或光学字符识别装置为记录手段,并通过计算机处理而产生的一种文献形式。
优点:存贮密度高,存取速度快,可以灵活地进行删改或更新。
缺点:需要较先进的技术设备才能阅读,使用费用较高。
2、按文献内容加工深度划分
1)零次文献:指交谈或会议交流和传递的有用情报,通常未经记载或出版。
2)一次文献:即原始文献,又称情报源、第一手资料、一级文献。凡是以作者本人的生产或科研工作成果为依据而创作的原始论文,不论撰写时是否参考或引用别人的资料,也不论载体和出版类型如何,均为一次文献。
特点:含有前所未有的发明创造,或者新的见解与理论。属于这类文献的有:期刊论文、专利说明书、科技报告、会议文献、学位论文、专题著作等。
3)二次文献:是对许多无序的一次文献进行收集加工整理而成的报道性、检索性的文献资料,是对知识的第二次加工。常见的二次文献有目录、书目、题录、文摘、索引等。
4)三次文献:是利用二次文献并在其指导下,对大量一次文献,进行综合分析研究加以浓缩和提炼而写成的文献,是对知识的第三次加工。属于这类文献的有年鉴、进展、述评、综述、手册、指南、专著等。
5)四次文献:机读文献库及其产生的磁带磁盘式的书目索引。
3、按文献的出版形式划分:
1)图书:图书为较系统论述某一专题或学科知识的著述。
分类:
供读者阅读的图书
供读者检索参考之用的工具书刊
缺点:出版周期长,所报道的内容比期刊晚。慢3~5年。
优点:知识系统,全面可靠,内容较成熟。
ISBN指国际图书编号
2)期刊:也叫杂志。是一种定期或不定期的连续出版物。
CN指中国刊号(内部交流,不允许流传出去)
ISSN指国际期刊编号
特点:出版周期短,一般有周刊、半月刊、 月刊、双月刊及季刊等类型。
分类:
原始论文性期刊
快报性期刊
检索工具性期刊:
综合性期刊:
其它还有科谱性期刊等。
3)资料:又称非书非刊资料。(科技报告、会议文献、专利文献、学位论文、档案资料、产品资料等)
期 刊
核心期刊:刊载某学科文献密度大、载文率、被引用率及利用率较高,深受本学科专家和读者关注的期刊中的精华。
评价期刊的常用工具:
《医学核心期刊指南》
《中文核心期刊要目总览》
JCR(Journal Cition Report,期刊引用报告)。
确定核心期刊和评价期刊质量的常用方法:载文率法和引文法。
IF(影响因子)= 某年内SCI来源刊引用该刊前二年发表论文总次数 / 该刊前二年发表论文篇数
II(当年被引率)=某刊当年发表的论文被SCI来源刊引用的次数 / 该刊当年发表论文篇数
电子期刊的定义:指从投稿、编辑、出版、发行、订购、阅读乃至读者意见反馈的全过程都是在网上进行,任何阶段都不需用纸的新型出版物,称网络电子期刊。
电子期刊的特点:信息速发性高、信息量大、信息共享性强、交互性强、可读性强、易检索、良好的信息扩展性、内容、形式多样
(四)医学文献的现状(特点)1、数量庞大,增长迅速2、出版类型复杂多样3、文种繁多4、内容交叉渗透,分散重复。5、新陈代谢频繁,老化速度加快6、文献发表的时间“滞后”严重7、交流传播速度加快
(五)医学文献的发展趋势1、文献缩微化2、文献存贮磁性化3、文献形式多样化
第二节 信息检索
•一、信息检索系统是根据社会发展需要和为达到特定的信息交流目的而建立的一种有序化的信息资源集合体。
信息资源 设备 方法和策略 人
1、按信息检索的对象分类
1)数据检索:对象是用户所需的一些数值性数据。其答案是数值、数据。
2)事实检索:其对象是用户所需的一些具体知识和事实。
3)文献检索:其对象是查找某一课题、某一著者、某一事物的有关文献,以及这些文献的出处。
二、信息检索类型
2、按信息组织的方式分类:1)目录检索2)题录检索3)文摘检索4)全文检索5)超文本检索6)超媒体检索
数据库的类型:书目数据库、数值数据库、全文数据库、事实数据库、超文本数据库
第三节 信息检索的基本原理
一、检索系统
检索的实质就是将用户的提问特征与文献组织诸法中的标识进行对比,然后将二者相一致或比较一致的内容提取出来,以满足用户的需要。因此检索系统由两部分组成:一个是存贮,一是检索。
二、检索工具
(一)检索工具的形式(按出版形式划分)
1、卡片式检索工具:是将每条款目著录在一张张卡片上,按照一定的排检顺序编排而成的一种检索工具。
优点:检索比较方便,同时还可以随时更新、增补、剔除,灵活性较大。
缺点:体积较大,易散失,不便于携带和保存。要有一定的人力排卡。
2、书本式检索工具
1)期刊式检索工具:指将文献条目及索引有序排列的定期或不定期连续出版物(每年至少出一期)。
2)单卷式检索工具:以一定的专题为内容,专业性强,收集积累多年的有关文献而编印的。
3)附录式检索工具:它不单独出版,一般附于资料、期刊或图书的末尾或中间。
3、缩微式检索工具(COM式检索工具):所谓COM式是指计算机输出缩微品。就是由计算机将存贮器里的书目著录,按照人们指定的格式与排列系统进行输出,然后加以缩微而得到的胶卷或平片。
优点:是体积小,便于保存。
4、计算机可读文献磁带磁盘光盘式检索工具:它是一种通过程序设计,将文献著录内容转换成数学语言,输入磁带或磁盘、光盘上,用电子计算机阅读的检索工具。
特点:是贮存信息量大、速度快、检索效率高。
(二)按收录范围区分的检索工具
1.综合性检索工具:文献类型和语种的面广,收集的范围涉及多学科。
2.专业性检索工具:收录范围仅限于某一学科。
3.专题性检索工具:收录范围仅限于某一特定题目。
4.单一性检索工具:收录只限于某一特定类型的范围。
(三)按著录内容来划分的检索工具
1.目录:又称“书目”和“文献目录”。是按照某种顺序编制的文献清单或清册,通常以一个完整的出版单位或收藏单位为著录的基本单位。
1)国家书目:是对一个国家出版的全部图书所作的登记统计性书目。我国的国家书目有:《全国总书目》和《全国新书目》。
2)出版目录:是报道国内外书刊出版情况的目录。例如《科技新书目》。
3)馆藏目录:是图书馆、情报部门等的藏书目录。是报道和揭示某一图书馆所收藏图书、期刊、资源的目录。包括分类目录、书名目录、著者目录和主题目录等。
4)联合目录:这是汇总若干图书馆和其它收藏单位所藏文献而编制的目录。例如《医学科学图书联合目录》。
5)专题文献目录:是一种专题性文献检索工具。
2.题录:由一组著录项目构成的反映某一文献形式特征的一条记录。其著录项目包括题名项、责任者项、出处项等。
3.索引:所谓索引,是将图书、期刊等文献中所刊载的论文题目、作者以及所讨论的或涉及到的学科内容主题、人名、地名、专利号、分子式等,根据需要分析摘录出来作为排检标识,注明出处,并按照一定的原则和方法排列起来的一种检索工具。
索引可分为篇目索引与内容索引两种。
4.文摘:它是既揭示文献外部特征,又通过摘录文献要点报道文献内容的一种检索工具。它是检索工具的核心。
1)指示性文摘:旨在把原文的主题范围、目的和方法概略地指示给读者的一种文摘,是对标题的补充说明,以最简要的语言说明文献题目、内容范围、研究目的及出处,文字短,一般为60-70字以内(西文则以30个词为限),所以又称简介和提要。
2)报道性文摘:它是对文献中情报的浓缩,它其本上反映了文献的主要内容,如论点、研究手段与方法、结果与结论,同时也包括有关数据、公式、图表等,并指出该文献的引用书目和插图的数目,最后署上摘要人姓名。一般为500个字左右。
5.综述:对某一时期内某一学科或专题的研究成果或技术成就进行系统的、全面的分析研究,进而归纳整理加以综合叙述的研究报告。是通过对原始文献的综合、评价、压缩处理的文献,属于三次文献范畴。
6.快报:是一种以报道文献速度快,揭示文献内容详细为特征的检索工具。
三、信息检索语言
根据文献信息检索的需要而创制的人工语言。
检索语言分为描述文献外表特征的语言和描述文献内容特征的检索语言两大类。
三、信息检索语言
检索语言是一种专门的语言,是在文献存贮与检索过程用的语言。分规范化语言和非规范化语言两种。
规范化语言是对文献检索用语的概念加以人工控制和规范,对同义词、多义词、近义词等进行规范化处理,同一个词来表达一个概念。非规范化语言也叫自然语言,如关键词、自由词。
三、信息检索语言
信息检索语言的主要功能:
1 简明描述信息的主要概念;
2 容易地将概念进行系统排列;
3 便于将标引语言与检索语言进行相符性比较(检索时);
检索语言类型
体系分类法
分类检索语言 组配分类法
检索语言 体系-组配分类法 先组
标题法
主题检索语言 单元词法
叙词法 后组
关键词法
系统分类 组合时间
描述文献外表特征的检索语言:题名索引、著者索引、引文索引、序号索引等。
描述文献内容特征的检索语言:
分类检索语言
主题检索语言
代码检索语言:用代表事物的代码作为标识系统的索引语言。(化合物分子式索引、环状化合物环系索引、化学物质号索引等) 。
(一)分类语言及中图法
分类语言:一种用分类号表达文献中的各种概念,按学科、专业对各种概念加以分类和系统排列的文献信息检索语言。(美国国会图书馆图书分类法、杜威十进分类法、国际十进分类法、中国图书馆分类法、国际疾病分类等)我国文献分类的主要依据是《中国图书馆分类法》(简称《中图法》)。请见书 第七页 (P7) 《中图法》
定义:依一定的思想观点,以学科分类为基础,综合图书资料的内容、特点,分门别类组成的分类表。以等级制为标记制度,依照从总——分、一般——特殊、低级——高级、简单——复杂的逻辑次序,逐层展开各门学科知识的类目等级体系,系统地组织文献。
《中图法》第四版将文献知识分为5大部类,即马、列、思想;哲学;社会科学;自然科学;综合性图书。下分22个基本大类。
例如 O:数理科学、化学
Q:生物科学
R:医药卫生
每个类目采用拉丁字母和阿拉伯数字相结合的混合号码
R 医药、卫生(17个二级类目)
1 预防医学、卫生学 2 中国医学
3 基础医学 4 临床医学
5 内科学 6 外科学
71 妇产科学 72 儿科学
73 肿瘤学 74 神经病学与精神病学
75 皮肤病学与性病学 76 耳鼻咽喉科学
77 眼科学 78 口腔科学
79 外国民族医学 8 特种医学
9 药学
每个类目还可细分至六、七级类目,如 :
R6 外科学
R65 外科学各论
R655 胸部外科学
R655.1 胸壁
R655.2 胸膜
R656 腹部外科学
R656.1 急腹症
R656.2 腹部疝
R656.3 腹壁
R656.31 腹壁炎症
R656.32 腹壁损伤
(二)文献标识码
文献标识码与中图法分类号不是一回事
根据《中国学术期刊检索与评价数据规范》的规定,对文献标识码规定如下:
A——理论与应用研究学术论文(含综述)
B——实用性技术成果报告
C——业务指导与技术管理性文章
D——一般动态性信息(通讯、报导、会议活动、专访等)
E——文件、资料
主题检索语言类型
依据标识组合时间分类:先组定组式、后组式
(1)先组定组式语言(列举式语言):标识在编表时(标引前)就已固定组合好,标引和检索时不必或较少进行组配的一种情报检索语言。
例:标题法 乙型肝炎—先天性
主题检索语言类型
(2)后组式语言(组配式语言):
标识主要供组配使用,标引时不将标识组配在一起,到检索时才将标识组配起来的一种情报检索语言。
单元词语言、叙词语言
例:乙型肝炎/先天性
主题检索语言类型
依据标识是否受控分类:受控语言:标题法、叙词法、单元词法、非受控语言(自然语言):关键词法
主题检索语言与分类检索语言比较:
主题:专指性、直接性、组配灵活
分类:系统性、间接性、严密性
趋势:分类-主题一体化
1、单元词语言
2、单元词是指从文献中抽取出来经规范化的、能表达文献主题的最小和最基本的词汇单位。
早期的后组式主题检索语言
20世纪50年代初,美国陶伯(M.Taube)等创立
单元词法:以字面上不能再分的词汇单元——元词作标识,以字面组配表达文献主题。
单元词语言
优点:
与标题语言一样,标识受控
将“标题”分解为单元词,通过若干单元词的组配专指地表达主题概念,是后组式检索语言 如:胃+肿瘤+治疗
每个单元词都可作为检索入口,提供多途径检索
可利用单元词的增减扩大、缩小或改变检索范围
2、标题词语言
1)、定义:指来自普通语言中那些比较定型的事物名称,并且经过规范化,用以表达文献主题内容的词、词组或短语。
2)、特点:①以自然语言为基础。
②不需经过概念分解或字面分解。
③经过规范化。
3)、基本要求:a具有检索意义。b专指性,能直接精确地表达文献论述或涉及的主题。c通用性,必须选用能被普遍接受的词。d唯一性。一个概念只用一个标题词表达,一个标题词只表达一个概念,一个标题词只用一种书写形式。E定型性,尽可能选用比较定型的词。若词组标识中词序不够定型,则进行倒置。
4)、分类:主标题词、副标题词(按作用分)
单级标题、带说明语标题、倒置标题(按结构分)
5)、标题词表:该表是文献的标引者标识存贮文献的依据,又是检索者在该系统中检索时选择标题词的依据。因此,它是标引者、系统、检索者三者之间语言交流的工具和桥梁。
6)、标题词索引是以规范化处理的能表达文献实质内容的词作为标识,并将全部标识按字顺排列的检索系统。特点是直观性强,比较适合从事物出发进行检索。
7)、优点:具有较强的直观性,主题词的字顺系统容易掌握。具有直接、快速、灵活、查准率高的优点。缺点;查全率低。
3、叙词语言
新型的后组式主题检索语言
与单元词出现同期,美国穆尔斯(C. N. Mooers)创造
是对单元词语言的直接继承,但克服了单元词语言的不足,吸收并综合了多种标引语言的原理和方法,是能结合计算机使用的后组式语言,是目前主要的受控语言。
叙词是以概念为基础,经过优选和规范化并且有概念组配和词间语义关系显示功能,用以表达文献主题和检索需求的词或词组。
叙词语言
优点:
概念组配准确,标引能力强
结构完备,词汇控制严格
适合多途径检索,检索效率高
对检索系统的适应性强
叙词语言
缺点:
叙词表编制和管理难度较大
利用叙词语言标引和检索较复杂,使信息报道速度相对较慢
叙词,是以规范化的词汇来表达文献内容的主题。
规范化也就是对文献中的同义词、近义词、多义词等加以规范,同一主题概念的文献相对集中在一个主题词下。
采用参照系统间接反映主题概念之间的关系
如:“肾功能衰竭” renal failure
或 Kidney failure
MESH: renal failure
see Kidney failure
采用主题词检索,能实现较高的查全率和查准率。
4、关键词语言
自然语言形式的情报检索语言
随计算机出现,为适应索引编制自动化的需要产生
关键词是直接从文献的题目、正文或文摘中抽出的具有实际意义的语词。即在提示和描述文献主题内容中起关键作用的语词。它是未经过规范化处理的自然语言。
直接以自然语言中未经控制或只作少量控制的语词为文献主题标识,通过关键词轮排方法揭示文献主题。关键词表简单,不必设参照,使用禁用词表。
关键词语言
优点:
直接源于自然词汇,专指性优于其它主题语言
标引无需查表,简便易行,节省人力
及时更新词汇,报道信息快
适于计算机自动抽词标引,标引一致性高、标引深度大
编制方法简单,使用起来方便。
缺点:词语不规范,不能显示词间的等同关系、等级关系和相关关系,查全率、查准率相对较低
由于没有进行语词的规范化,所以文献漏检率较高。
关键词:非规范化(未经严格规范化处理)检索语言,属于自然语言范畴。能够及时反映文献的最新信息,用法简便。
如:Apoptosis
但对同义词、近义词未经严格规范,因此同一主题概念的文献标引相对分散,容易导致漏检和误检。
(三)著者索引
以著者姓名作标识的索引就是著者索引。
著者姓名的组织规则:
1、无论东、西方人的姓名,均是把姓在前,名在后(在生活中和原始文献著者项中,英、美等西方人一般是名在前,姓在后),按字母顺序组织排列。
2、一些带有称号、宗教称呼、前缀等的特殊姓名,要注意按有关规定处理。
3、团体著者名称仍按字顺和个人著者排在一起。
四、信息检索工具
1 手工检索工具
2 机械检索工具
3 计算机检索工具
4 网络信息检索工具
(1) 工作原理;
(2) 搜索引擎 (通用、专用)
文献检索工具的结构
检索工具一般由编辑使用说明、目次表、正文、索引和附表等五个部分组成。
1.编辑使用说明:帮助使用者了解和使用该检索工具,为使用者提供必要的指导,一般包括编制方法和原则、使用范围、收录年限、著录格式、查找方法及注意事项等。
2.目次表:揭示正文部分或者整本检索刊排列的名称、排列次序及所在页码;
3.正文:为检索工具的核心,由按一定规则排列的一篇篇文献条目组成;一般为了方便识别,每篇文献条目按照前后顺序赋予顺序号,一个顺序号代表一条文献条目;
4.索引:检索工具的检索途径(检索入口)主要体现在其所附的索引部分,一般一种索引就是一种检索途径。常用的索引有主题索引、著者索引、分类索引、专利索引等。
5.附表:一般包括所收录的刊物名称、所使用文字的翻译、各种简全称对照、术语以及所使用的主题词表,甚至文献入藏单位及代号等。
五、信息检索方法
•1 顺查法
•2 倒查法 常用法
•3 抽查法
•4 追溯法(引文法)
•5 分段法 (循环法、交替法、)
一、方法
(一)常用法:又叫工具法、直接法。是利用各种检索工具查找文献资料的方法。这种方法是目前人们最常用的检索方法。又可分为以下三种。
1、顺查法:按照检索课题的时间范围,由远及近,从前往后查找。
优点:查的文献较全面、系统,查准率较高。
缺点:费时费力,工作量大,检索效率不高。
2、倒查法:与顺查法相反,是一种由近及远、逆时间顺序的查找方法。
优点:节省时间,检索效率高。
缺点:不全面,不系统。
3、抽查法:是针对学科或课题的发展特点,抓住其发展较快,文献发表较多的一段时间,逐年查找的方法。
优点:省时间,检索效果好。
缺点:必须在熟悉该学科、课题发展特点的情况下才能使用。
(二)追溯法:即滚雪球法,直接检索法。是从已知文献所附的参考文献入手,逐一追查原文,再从这些原文后面的参考文献逐一扩检,一环扣一环地追查下去。
优点:在没有检索工具或检索工具不全的情况下能借助于参考文献追查到一些文献。
缺点:查得文献不全面,且比较陈旧。
(三)分段法(又叫循环法):是常用法和追溯法两者的结合。
其特点是可以弥补因检索工具不全而造成的遗漏。
(四)浏览法:就是对最新出版的期刊资料目录进行浏览,查找有无与自已课题相关的最新文献发表。
缺点:文献面较窄,漏检可能性大。
优点:内容较新。
六、文献检索的途径
外表特征1 题名途径2 著者途径3 序号途径
内容特征4 关键词途径5 分类途径6 主题途径7 其他
分类途径
•按照文献的内容在分类体系中的位置作为文献信息检索的途径。
•它的检索标志是给定的分类号码
如《中国图书馆分类法》
国外有:《国际十进分类法》 《杜威法,DDC》
分类原则
•按《中国图书资料分类法》R类编排;
•纯中医名词术语的文献入R2
关键词途径
•是以题目、文摘和正文中出现的具有实质意义的词语作为检索标识,利用关键词索引查找文献的途径
•如:程序性细胞死亡;细胞凋亡;细胞凋零
主题词途径
•是以主题词为检索标识,利用主题索引查找文献的途径
•主题词:经过主题词表规范化的词
•《医学主题词表》MESH
•副主题词:对主题词进行限定的规范化的词
•主题词-副主题词组配在一起使用
题名途径
•是以书名、刊名或文献题名作为检索标识,通过书名目录、刊名目录或篇名索引检索文献的一种检索途径。
序号途径
•专利号
•标准号
•报告号
•化学物质登记号
•国际标准书号(ISBN)
•国际标准刊号 (ISSN)
特点:明确、简短、惟一
著者途径
•用文献的著者、编者、译者的姓名或机构团体名称编制而成的索引
•按著者姓名字顺编排
•姓在前,名在后
•Smith , L.
•Xu QY
选用检索途径应掌握以下三项基本原则:
1、从已知文献特征入手选择检索途径
2、从课题检索的要求选择途径
3、从检索工具的具体情况选择检索途径。
常用的检索途径(1)主题途径(2)著者途径(3)代码途径(4)题名途径(5)分类途径
七、计算机检索基础
文献检索的技术手段
手工检索:利用各种印刷型检索工具,人工查找所需的文献信息。
计算机检索:根据信息特定的需求,利用计算机从相关数据库中检索所需要的文献信息。
网络信息检索:通过互联网上提供的网络信息查询工具,从网上获取文献信息。
计算机检索系统包括文献存储和文献检索两部分,分别对应数据库的建立和利用。
计算机检索是目前广大医学临床与科研工作者获取医学文献信息最常用的方法和手段,具有信息量大、操作技能容易掌握、方便快捷等特点。
(一)数据库基本概念
数据库的定义:计算机把大量的数据项有机地集中起来存放在数据文件中,构成一个存放数据的整体,即数据库。
数据库文件: 各项数据以二维表格形式存放于数据文件中,一个以二维表格形式存放在磁盘上的数据文件称为数据库文件(库文件)。
(二)字段、记录、文档
字段:计算机检索的最基本单位。计算机检索的重要字段包括篇名(Title)、作者(Author)、作者地址(Address)、刊名(Source,来源)、关键词(Keyword)、主题词(MeSH)、文摘(Abstract)等。
记录: 在一个二维表格中,每一栏称为一个字段(Field),多个字段构成的一条完整信息称为一条记录(Record)。
•文档(File):数据库中一部分记录的集合。文档中的一条记录就是一篇文献的题录或文摘。
•一个数据库可以由一个文档组成,也可以由多个文档组成。
(三)计算机检索的布尔逻辑运算符
逻辑与 AND
A AND B,要求检出文献中同时包含概念A和概念B,其作用是缩小检索范围,提高查准率。
逻辑或 OR
A OR B,要求检出文献中包含概念A或概念B或同时包含概念A和概念B,其作用是扩大检索范围,增加命中文献数。
1、布尔逻辑运算符
•(Boolean searching)
•AND:A AND B 检出记录中同时含有检索词A和检索词B
•OR:A OR B 检出记录中含有检索词A或检索词B的文献
逻辑非 NOT
A NOT B,要求在检出的包含概念A的文献中去掉含有概念B的文献,其作用是缩小检索范围。
其它运算符
NEAR、 WITH
布尔逻辑运算符示意
八、文献信息检索原理
•指通过一定的方法和手段,使信息存储与检索这两个过程所采用的特征和标识达到一致,以便有效地获取和利用文献。
检索原理
信息源 信息用户
入选信息 信息需求
关键
概念分析 词表 课题分析
标引语言 数据库 检索语言
检索结果
九 信息检索步骤(1)
•1 分析研究课题,制定检索策略
•检索策略:是根据检索要求所采取的检索方针和检索方式。
(1)检索概念的组配;
(2)检索工具的选择;
(3)检索范围的限定;
检索表达式:见各个检索概念之间的逻辑关系、位置关系等用检索系统规定的各中组配符连接起来,成为人和机器可以识别的和执行的命令形式。
•2 确定检索方法,利用检索工具;
•3 选择检索途径,查找文献线索;
•4 评价检索结果,索取原始文献。
计算机检索的特点:检索速度快、检索途径多、更新快、资源共享、检索更方便灵活、检索结果可以直接输出
计算机信息检索系统的构成?
•从物理构成来说,包括计算机硬件、软件和数据库、通讯线路和检索终端五部分
数据库的类型:书目数据库、数值数据库、全文数据库、事实数据库、超文本数据库
计算机信息检索的基本技术
计算机检索服务的类型
•联机信息检索服务:MEDLARS
•光盘信息检索服务:MEDLINE, 中国生物医学文献数据库CBM,中文生物医学期刊数据库CMCC
•网络信息检索服务:PUBMED, OVID, Springer, 维普医学全文数据库,CNKI
对文献检索的要求一、灵活性: 二、全面性: 查全率:指的是系统在进行某一检索时,检索出的相关文献与系统文献库中的相关文献总量之比率。三、准确性: 查准率:指的是系统在进行某一检索时,检索出的相关文献量与检索出的文献总量之比率。四、快速性:
检索效果评价指标
被检出相关文献量
查全率:R =
相关文献总量
被检出相关文献量
查准率:P =
被检出文献总量
未检出相关文献量
漏检率:M =
相关文献总量
被检出非相关文献量
误检率:N =
被检出文献总量
•描述检索效果的参数
• 主要有:查全率(recall factor)、查准率(也称适中率,Pertinency factor) 、漏检率(omission factor) 、 误检率( 也叫检索噪音,noise factor) 以及新颖率、
•检索速度等。
提高查全率、查准率的方法
提高查全率的方法:
用主题词检索;
主题词、关键词、同义词间用or 组配;
用上位词(扩展下位词)检索;
截词检索;
少用副主题词组配。
提高查准率的方法:
用主题词检索;
用下位词(专指度)检索 ;
检索词的字段限定 ;
副主题词组配 。
扩展检索与缩小检索
•扩展检索:初始设定的检索范围太小,命中文献不多,需要扩大检索范围的方法,主要有:概念的扩大,增加同义词,年代的扩大; 使用上位词;
•缩小检索:又称二次检索,指开始的范围太大,命中文献泰多,或查准率太低,需要增加查准率的一种方法。主要有:概念的缩小,语种的限定,特定期刊的限定,使用下位词等
第三节 信息检索技术
一、全文检索
1 内容与外表特征组合检索
2 全文分类专题检索和二次检索
3 全文关键词单汉字检索
4 位置限定检索
5 后控词表检索
第三节 信息检索技术
•二、联机检索 (实时性、完整性、共享性、广泛性);
1 WWW联机检索
2 Telnet 联机检索
三、光盘检索
1 光盘工作站; 2 光盘网络
3 点对点光盘检索;4 多媒体光盘检索
第三节 信息检索技术
四、多媒体检索
1 视频检索
2 声音检索
3 图像检索
五、超媒体和超文本检索
六、网络信息检索下载本文