任务五 信息检索具体步骤
信息检索的具体步骤如图1-2所示。
图1-2 信息检索的具体步骤
1.分析研究课题
分析研究课题是指在着手查找信息前对课题进行分析,明确学科或专业的范围,弄清检索的真正意图及实质。它包括了解课题的内涵和外延,以便确定检索标志(检索词、分类等);明确课题所需信息的内容、性质和水平及出版国别、语种和年限;了解并掌握课题的国内外情况;同时还要在分析的基础上形成主题概念,包括所需信息的主题概念有几个,概念的专指度是否合适,哪些是主要的,哪些是次要的等。还有些检索工具要求使用相应的词表和类表对选择出来的检索词进行核对,力求检索的主题概念能准确反映检索需求。
可从以下几个方面确定检索范围。
(1)专业范围:确定课题涉及哪些专业及其相关的学科。
(2)时间范围:确定该课题需要检索信息的年代范围。
(3)地理范围:各国出版的检索工具以收藏本国的信息为主,因此要了解某课题在哪个国家处于领先地位,原则上就采用这个国家的检索工具。
(4)语种范围:视该课题在哪国占优势,选择使用该国母语的检索工具。
(5)信息类型:各种检索工具收录信息的侧重点是不同的,即使是综合性检索工具也未必面面俱到,因此要选择与课题有关部门的、针对性强的、适合课题需要的检索工具。
2.选择检索工具
利用哪些检索工具进行查找,直接影响检索效果。要根据课题的要求,选择与所查课题相适应、质量较高、检索手段较完善的检索工具,须了解和掌握检索工具的使用范围、收录特点,然后可通过三次信息的选择和检索,如《工具书指南》、《书目指南》、《数据库目录》等工具指引到二次信息检索工具。
例如,美国E.P.Sheehy编著的《Guide to the Reference Books》(参考工具书指南),介绍了大约14000多种工具书,是目前世界上主要的指导人们使用工具书的工具书。需要注意的是,单从个别信息集合体的检索工具、数据库中选择符合课题的检索工具,虽直接而具体,但却不够全面;通过查阅国内外出版的检索工具、数据库指南的介绍来选择确定,虽系统而全面,但有时却会受到各种条件的限制,如馆藏的限制。
在选择检索工具时,要考虑的主题问题如下。
(1)在内容和时间方面,要考虑检索工具、数据库内容对课题内容的覆盖面和一致性,如应综合考虑检索工具、数据库收录信息的齐全、编制的质量、使用的方便等因素。
(2)在手段和技术上,有机检条件的一般就不选择手检工具,机检无疑具有较高的检索效率。但是数据库收录的信息至多上溯至20世纪六七十年代,若需较久远的信息,则未必被回溯建库,所以在选择时必须掌握其收录信息的年代范围,才能获得满意的结果。
(3)考虑价格和可获得性,应选择就近容易获得的检索工具。
小资料
什么是工具书?
工具书是专供查找知识信息的文献。它系统汇集某方面的资料,按特定方法加以编排,以供需要时查考之用。根据工具书的基本性质和使用功能,可以将其划分为检索性工具书和参考性工具书(美国工具书专家盖茨称其为控制—检索型工具书和资料型工具书,Information:control and access,Sources of information)。另外还可以根据语种、学科内容、规模大小等标准进行划分。
3.确定检索途径
检索途径是进入检索的入口。归结起来,检索途径有两类,一是反映信息内容特征的(主题、分类)途径,二是反映信息外部特征的(著者、题名、代码等)途径。上述两类途径构成了信息检索的整个检索途径体系。
(1)分类途径。
分类途径是按学科分类体系查找信息的途径,采用的是分类目录和分类索引。它以学科概念的上、下、左、右的关系来反映事物的派生、隶属、平行、交叉的关系,能够较好地满足族性检索的要求。
(2)主要途径。
主要途径是利用信息主题内容进行检索的途径,即利用从信息中抽象出来的,或者经过人工规范化的,能够代表信息内容的标引词来检索。它打破了按学科分类的方法,使分散在各个学科领域里的有关课题的信息集中于同一主题,使用时如同查字典一样,按字顺找到所需的主题词,在该词下列出反映该主题内容的有关信息。其最大优点是接近人们的工作和生活实际,直接、准确,采用的概念易于被理解或为人所熟悉,把同性质的事物集中于一处,使查检时便于选取。在各学科和其分支交叉渗透日益强化的当前,这种途径的检索是深受欢迎的。
(3)题名途径。
题名途径是根据信息的题名来检索信息的途径。它将信息的题名按字顺编排成一个体系,既简单易行,也便于查检,比较符合一般用户对信息的使用习惯。知道信息题名的用户可以通过这种途径获取所需的信息,但题名往往较长而且复杂,题名相同或相似的甚多,容易造成误检,故不宜作为主要的检索标志。有的检索工具没有将内容主题相同的信息集中,缺乏相关信息的反映等,所以在文摘性和题录性刊物中,一般不采用信息题名途径,而仅仅对期刊进行刊名字顺排列。
(4)著者途径。
著者途径是以著者(包括个人及团体著者)的名称,按照字顺编排成一个体系,通过这一体系的排列规律,把某一著者的信息集中起来的途径,通过这一途径能获取该著者的所有信息。
著者途径在国外非常受重视,许多文摘性刊物和题录性刊物都把著者索引作为最基本的辅助性索引之一。一般来说,科研人员各有所长,尤其是某些领域的知名学者、专家,他们的文章代表了一定的研究水平和动向,通过著者线索,可以系统地发现和掌握他们的研究进展,可以查询某著者的最新论著,以及同类或相关信息。这种途径的检索既快速又方便,但查得的信息缺乏系统性、完整性。
(5)代码途径。
代码途径是通过已知信息的专用代码,如国际标准书号(ISBN)、国际连续出版物号(ISSN)、专利号、合同号等,查找信息的途径。它们是一些信息类型的特有标志,与信息有对应的关系。这种索引一般都按照缩写字母字顺加代码次序排序。在已知信息代码的前提下,用此途径检索信息比较方便、快速,尤其是ISBN、ISSN的唯一性使得检索更体现其快速和便捷的特点。正是由于信息代码的唯一性,人们在对信息的外表特征进行记忆时就更应该重视对ISBN、ISSN等的记忆。
小资料
什么是ISSN?
ISSN是国际标准连续出版物号(International Standard Serial Number)的英文缩写,是为各种内容类型和载体类型的连续出版物(如报纸、期刊、年鉴等)所分配的具有唯一识别性的代码。分配ISSN的权威机构是ISSN国际中心(ISSN International Centre)、国家中心和地区中心。ISSN国际中心的总部设在法国巴黎。如果一种刊物想达到国际标准,必须向国际机构提出此项国际刊号的申请。
(6)其他途径。
有些检索工具还附有一些特殊索引,可用特殊途径找到所需信息的线索,如已知题名、会议时间和地点,则可用“图书索引”和“会议索引”等来检索所需的信息。另外根据学科性质和它们的不同特点,也出现了以下特殊的标志,这些标志构成了辅助检索途径,如以地质地理科学的地域区划和地名为标志编制的专门索引。
在计算机信息系统中,检索途径还有很多,几乎信息的每个特征(如出版社、出版年代等)都可作为检索途径。显然,检索途径的多少直接关系到检索的便利性。
上述检索途径各有特色,使用时不可偏废。在检索信息时,应根据检索要求、已知条件、设备是否齐全等因素,尽量综合利用各种途径,取长补短,进行优化选择,以提高检索效果。
例如,为科学研究确定课题,为了解某一学科的发展历史、研究现状和发展趋势,为制定战略决策和进行预测而收集有关信息,应以分类途径为主,辅以主题检索途径;为研究解决某一具体问题或攻克某一技术难关,应以主题途径为主,辅以分类途径;如果已知检索课题的外部特征,则应选择题名、著者、代码等检索途径;如果已知检索课题的内容特征,则应选择主题途径或分类途径。
选择检索途径可供参考的意见如下。
(1)从已知信息特征选择检索途径。
如果事先已知题名、著者、代码等条件,应相应地采用题名目录、著者索引、代码索引或有关的目录索引。用这些途径进行检索比较快速、方便和有效。若与分类途径或主题途径配合使用,即从分类途径或主题途径查出一批信息,掌握一些著者姓名,然后采用著者途径进行追溯,更能收到较好的检索效果。
(2)从课题检索要求选择检索途径。
如果课题检索的泛指性较强,也就是说所需信息的范围广,要求“特性检索”,那么选用主题途径为好。检索途径选择不当,将会造成误检和漏检,影响检索效果。
(3)从检索工具提供的索引选择检索途径。
检索工具提供的每种索引,都是一种检索途径,应充分熟悉和使用。目前国内外检索工具提供的索引情况不一,多则十余种,少则一两种。因此,选择检索途径还要根据检索工具的具体情况来决定。
检索途径确定后,就要根据课题要求拟定相应的检索标志。当选择内容途径时,有时检索工具还要求将确定的检索标志与相应的词表或类表进行核对,以提高查准率。
小资料
什么是ISBN?
国际标准书号(International Standard Book Number,ISBN)是国际通用的图书或独立的出版物(除定期出版的期刊外)代码。出版社可以通过国际标准书号清晰地辨认所有非期刊书籍。一个国际标准书号只有一个或一份相应的出版物与之对应。如果新版本的内容在原来旧版的基础上没有太大改动,那么在出版时不会得到新的国际标准书号。当平装本书籍改为精装本出版时,原来相应的国际标准书号也应当收回。
4.选择检索方法
选择检索方法是指选择实现检索计划的具体方法和手段。前面已介绍了几种检索方法,在实际工作中究竟采用哪种方法或综合哪几种方法最为合适,主要根据检索条件、要求和背景等因素而定。
5.制定、调整检索策略
(1)信息检索的策略。
所谓信息检索策略,即将课题的提问及其检索词与检索工具的收录内容、编排特点相匹配而确定的检索方案或程序。制定检索策略的主要内容是,在分析检索课题的基础上,确定要利用哪些检索工具,确定查找年限和专业范围,确定检索用词并判明各词之间的逻辑关系与查找步骤等事项。
(2)制定检索策略的关键环节。
①对检索课题的标引要准确。这是关系到确立检索目标的大问题。
②选择检索工具要注意质量。例如,当检索某一课题时,在有多种检索工具可供利用的情况下,要选择那些收录内容全面系统,收录年限较长,收录地域范围较广,学术权威性较高,编排方法科学,功能较多,易于使用的检索工具,这样才能提高检索效果。
③选择检索途径要全面、综合地考虑,因为各种检索途径都有其利弊,只有全方位、多途径地选择适合检索要求的检索途径,才能达到取长补短、事半功倍的检索效果。
综上所述,详尽分析检索课题,从而确定检索目标,是制定良好检索策略的基础;选择适当的检索工具,是使合理的检索策略得以实施的前提条件;检索途径的确定和检索词的调节,是检索过程的关键环节。只有优化这些环节,才能优化检索策略。
(3)制定检索策略可供参考的意见。
①要正确处理检索手段与检索目标的关系。制定检索策略,必须以能实现检索目标为前提条件。
②信息检索的特点,一般来说,具有检索目的的唯一性,检索手段的随机性。就是说,检索的目的是唯一的、不变的,但检索方法和手段要综合各种条件和背景来灵活、多样地选择。实现同一检索目的,往往具有几种不同的检索方法和途径,应从中优化出一种最省时、省力的方案。
③要结合实际,因地制宜,以充分利用现有设备和本单位、本地区的馆藏信息资源为原则,不可超越主、客观条件所允许的范围去制定检索策略。
④要广开思路。除了利用检索工具书外,还应注意直接利用普通书刊,特别是丛书、丛刊、文集、资料汇编、方志之类的书刊,对于查找专题资料来说,这往往能迅速达到检索的目的,甚至可以达到事半功倍的效果。
(4)检索策略的调整。
检索过程是一个动态的随机过程,在某些检索环节中,会不可避免地产生一些和检索目标相差甚远的现象。例如,检索词过宽或偏窄而造成扩检或漏检,检索词不规范而引起误检等。所以,有必要在评价检索效果的基础上,对检索结果进行信息反馈,便于重新修正检索策略,调整检索手段,进行新一轮的循环检索,从而实现检索目标的完善。
检索失误一般表现在误检率和漏检率上。如误检率高,则必须进行缩检,其方法如下。
①对原检索词增加限定条件,如时间、文种、著者、新检索词等。
②换用下位类检索词或下位类符号作为检索标志,进行专指性更强的主题检索或分类检索。
在漏检率高的情况下,进行扩检的方法正好相反:减少限定条件;使用上位类主题词或分类号检索;用相关主题词或相关类号进行检索。
6.获取原始信息
这是检索过程的终结,也是进行信息检索的最终目的。需要注意的是:
(1)将期刊名称缩写(或代码)转换成全称;
(2)对于非拉丁语文字(日文、俄文等)信息的拉丁译文,要还原成原文的名称。
要进行一次成功的信息检索活动,除了要掌握一般的检索知识和方法外,更重要的是要培养综合性的检索能力。当然,这与广泛的知识积累,加强语言文字的阅读理解能力,注重调查研究等方面是分不开的。
此外,还须注意以下有助于检索成功的若干经验。
(1)注意早期的知识积累,掌握常用主题词和分类法在不同检索工具中的标引特点和检索工具著录内容的变化情况等。检索工作最好由科研人员亲自动手,才能熟悉情况,避免漏掉微小的重要信息。
(2)注意尽量利用各种有利条件,从最简捷的途径着手检索。具体项目、针对性问题,多从主题索引、关键词索引入手;广泛性、系统性的问题,可考虑从分类体系中查找。欲了解最新信息动向,可以从近期文摘刊物分类目次中选择适用的范畴进行一般性浏览,吸收“印象”。
(3)要善于交叉补充。除了利用检索工具进行检索外,还要注意利用工作之便,在各种现期刊物中补充查找。如有条件,最好能利用几种文摘交叉进行检索,起到信息线索的核对作用,尽管会出现重复,但肯定会得到不少补充,降低漏检率。
(4)查阅信息必须做好记录,最好有专用的笔记本,也可以用卡片或活页本。每次记录时,注明查得信息的各项内容和特征,如著者姓名、期刊名称、卷期、年份、页次、题目名称、文摘号及内容摘要等,将其记录在卡片上,可以事后编排分类,成为专题性的积累,为日后的检索创造便利的条件。
(5)对于检索所需的信息线索,在阅读时要掌握好时间,培养快速阅读的习惯和能力,要能很快地浏览全文并摘出要旨。还须运用专业知识和敏捷的思维,决定取舍。阅读时,还要注意记下那些对于进一步检索有所启发的要点,以免过后遗忘。一些在早年发表的信息,可能已被大型参考书所引证,或者随着时间的推移,内容已经老化,被新的论点所取代,但有时也不宜忽略,因为它可能仍不失参考价值。
7.信息识别的常识
(1)信息类型的识别。
不同类型的信息在各收藏单位有着不同的管理方法、入藏地点和借阅规则,在检索工具中也有不同的著录格式。所以检索者只有识别出信息的类型才有可能查找到所需的一次信息。各种类型的信息都具有一定的著录特征,不难识别。
(2)刊名缩写及其解决办法。
为了节省篇幅,检索工具一般都将刊名缩写。刊名缩写是检索者经常遇到的问题,不掌握将缩写刊名还原的知识,查找一次信息时就会遇到困难。缩写刊名的查找方法有以下4种。
①利用检索工具的刊名缩写表。
大型的检索工具一般都有与之相匹配的刊名缩写表,使用起来很方便。根据这些辅助工具,可以将缩写刊名转化为全称。
②掌握刊名缩写规则。
为了统一刊名缩写,国际标准化组织(ISO)在1972年颁布了ISO—4—1972(E)《国际期刊名称缩写法则》的国际标准,1974年又提出了一份推荐标准ISO—833—1974(E)《国际期刊名称用语缩写一览表》,它们都对刊名的缩写做了统一规定。
③利用美国的《刊名缩写表》(Periodical Title Abbreviations)。
例如,缩写刊名“J.C.S.S”可利用《刊名缩写表》查出其全称为“Journal of Computer and System Science”(《计算机与系统科学杂志》)。当原缩写不符合ISO标准规定时,可利用此表查找(此例中“System”的缩写为“sy”,而ISO标准规定是“syst”)。
④按照外文缩写习惯来解决。
例如,Mech. Eng.是Mechanical Engineering(《机械工程》)的缩写。
另外要强调的是,拉丁文关于出处的说明不是刊名的缩写,如ibid(出处同上),Op. cit(在所引的著作中),Loc. cit(在上述引文中),V.S.(参见上文)等。总之,刊名缩写还原时,应首先使用检索工具配套的辅助工具,若检索工具没有相应的刊名缩写表时再考虑使用其他方法。
小资料
什么是ISO?
国际标准化组织(International Organization for Standardization,ISO),是世界上最大的非政府性标准化专门机构,是国际标准化领域中一个十分重要的组织。国际标准化组织的前身是国家标准化协会国际联合会和联合国标准协调委员会。1946年10月,25个国家标准化机构的代表在伦敦召开大会,决定成立新的国际标准化机构,定名为ISO。大会起草了ISO的第一个章程和议事规则,并认可通过了该章程草案。1947年2月23日,国际标准化组织正式成立。ISO的任务和宗旨是促进全球范围内的标准化及其有关活动,以利于国际间产品与服务的交流,以及在知识、科学、技术和经济活动中发展国际间的相互合作。它显示了强大的生命力,吸引了越来越多的国家参与其活动。