实用信息检索方法与利用(第三版)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 信息与信息源

1.2.1 信息

关于信息的定义有多种,不同学科有不同的定义,自然科学、信息科学的信息多指数据、指令,管理科学中所说的信息多指消息、情报,但即便如此,同属社会科学的消息、情报与信息也有一定的差距。即使是同一学科也可能出现差异很大的命题,而这些定义都从不同的方面揭示了信息的某些特征和性质。

信息论的奠基者香农认为,信息就是能够用来消除不确定性的东西。这一定义是从通信科学的角度来探讨信息概念的,指出了信息的一个价值——减少不确定性,即当一个信息为人们所感知和确认后,这一信息就成为一定意义上的知识,这种知识可以作为信息来传递。

控制论创始人维纳说,“信息既不是物质,又不是能量,信息就是信息。”根据维纳的说法,物质、能量和信息是相互区别的,是人类社会赖以生存发展的三大基础——世界由物质组成,能量是一切物质运动的动力,信息是人类了解自然及人类社会的依据。他第一次把信息与物质、能量相提并论。

我国国家标准《情报与文献工作词汇基本术语》中,关于“信息”的定义是:“信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不定性减少。”

信息具有以下特点。

① 普遍性:信息是普遍存在的。从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体。信息无处不在、无时不在。人们对世界的认识是无限的,因此信息资源的扩充与累积也是无限的。

② 载体的依附性:信息不能独立存在,需要依附于一定的载体,同一个信息可以依附于不同的媒体。载体形式多种多样,如:印刷型、机器型、声像型、网络型等。文字既可以印刷在书本上,也可以存储到计算机中,信息可以转换成不同的载体形式而被存储下来和传播出去,供更多的人分享。而“分享”的同时也说明信息可传递、可存储,载体的依附性具有可存储、可传递、可转换的特点。

③ 时效性:信息所反映的总是特定时刻事物的运动状态和方式。当人们将该时刻的信息提取出来之后,事物仍在不停地运动,这样,已脱离源物质的信息就会逐渐失去效用,最终只能充当一种历史记录。如果传递很慢,那么再有用的信息也常常会失去其应有的价值,比如新闻、股市信息等。

④ 传递性:是指信息在空间和时间上的传递,信息可以在空间上从一个地方传到另一地方。同样,信息也可以从一个时期传递到另一个时期,信息储存就是信息在时间上的传递。信息借助于一定的物质载体才能进行传送,信息的传递性决定了信息的可扩散性,信息通过各种渠道、媒介传播。

⑤ 共享性:信息资源可以共享。信息可以被一次、多次、同时利用。在信息的扩散和用户分享信息的过程中,载体本身的信息并不因此而减少,各用户分享的信息份额不因分享的人的多少而受影响。信息资源的共享将极大推进人类文明的发展。

⑥ 可转换性:信息的物质载体形态是可以互相转移变换的;信息在一定的条件下可以转化为物质、能量、时间、金钱、效益、质量等。正确而有效地利用信息,可以创造更多、更好的物质财富,开发或节约更多的能量,节省更多的时间。信息不能直接满足人们物质需要,但能够满足人们精神生活的需要,信息可以促进物质、能量的生产和使用,信息可以增值;信息只有被人们利用,才有价值。当然,信息不会真的变为物质与能量,其功效在于通过合理而有效的利用,“节约”更多的物质与能量。这正是人们需要信息的原因。

⑦ 可伪性:人们容易凭主观想象来认识理解信息,或孤立地认识理解信息,从而易于产生虚假信息,如“盲人摸象”;此外,由于人们的认识能力有限或动机不纯,也容易形成伪信息,如各种“假信息”等。信息的可伪性提醒我们,一定要注重信息的来源和信息的筛选,注意防止“垃圾信息”或信息污染。

1.2.2 信息源

信息源,就是信息的来源。信息源是产生、载有和传递信息的一切物体、人员和机构。

1.2.2.1 按出版类型分类

(1)图书

图书是指内容比较成熟、资料比较系统、有完整定型的装帧形式的出版物。科技图书是一种重要的科技文献源,它大多是对已发表的科技成果、生产技术知识和经验的概括论述。科技图书的范围较广,主要包括:学术专著、参考工具书(指对某个专业范围作广泛系统研究的手册、年鉴、百科全书、辞典、字典等)、教科书等。想要较为全面、系统地获取某一专题的知识,参阅图书是行之有效的方法。而出版周期长、内容不便于随着时间的变化而更新,是一般图书的缺陷。

(2)期刊

期刊也称杂志,是指那些定期或不定期出版、汇集了多位著者论文的连续出版物。构成期刊的要素有以下四个方面:一、连续出版;二、有一个稳定的名称;三、每年至少出版一期,有卷、期或年、月等表示连续出版下去的序号;四、由众多作者的作品汇编而成。科技期刊在科技情报来源方面占有重要地位,约占整个科技信息来源的65%~70%。它与专利文献、科技图书三者被视为科技文献的三大支柱,也是科技查新工作利用率最高的文献源。

与图书相比,期刊最突出的特点是出版迅速、内容新颖、能迅速反映科学技术研究成果的新信息。期刊还具有连续性的特点,使期刊成为人们寻找研究上的新发现、新思想、新见解、新问题的首要信息源。有些新发明、新创造、新观点在诞生之初并不是成熟的、稳定的、可靠的,它们往往不被图书接纳,却被期刊采用,这也正是期刊被称为当代文献骨干的重要原因。本书第三、四章将专门介绍中外文期刊的检索。

(3)专利文献

专利文献通常是指发明人或专利权人申请专利时向专利局所呈交的一份详细说明发明的目的、构成及效果的书面技术文件,经专利局审查,公开出版或授权后的文献。广义的专利文献还包括专利公报(摘要)及专利的各种检索工具。专利文献的特点是:数量庞大、报道快、学科领域广阔、内容新颖、具有实用性和可靠性。由于专利文献的这些特点,它的科技情报价值越来越大,使用率也日益提高。

专利文献在传递经济信息和科技信息方面发挥着极为重要的作用。尽管专利文献只占期刊文献的10%左右,却能提供40%左右的新产品信息量。全世界新技术的90%~95%是通过专利文献公之于世的。据说,只要系统地搜集美、日、英、法、德五国专利,就可以了解西方科技发展情况的60%~90%。

(4)标准文献

标准文献是技术标准、技术规格和技术规则等文献的总称。它是记录人们在从事科学试验、工程设计、生产建设、商品流通、技术转让和组织管理时共同遵守的技术文件。其主要特点是:能较全面地反映标准制订国的经济和技术政策,技术、生产及工艺水平,自然条件及资源情况等;能提供许多其他文献不可能包含的特殊技术信息。它具有严肃性、法律性、时效性和滞后性。

标准文献,特别是产品标准,是搜集产品信息的来源之一。通过这类文献,可以对产品的分类、品种、规格、性能、参数、质量等级、试验和转换方法、包装标志等所作的统一规定有所了解,也可以知道对原材料的品种、规格、物理性能、化学成分、试验和检验方法,以及工艺、试验、分析、测定、检验、验收等的规则和方法所作的规定。

(5)会议文献

会议文献是在各种会议上宣读和交流的论文、报告和其他有关资料。传统会议文献多数以会议录的形式出现。会议文献的特点是专业性强、内容新、学术水平高、出版发行较快。会议文献大部分是本学科领域内的新成果、新理论、新方法,且经过会议主办者审查、推荐,经过专家学者提问、讨论、评价、鉴定,再由本人修改后出版。所以可靠性较高。会议文献基本上是会议上首次公布的成果,不在其他刊物上发行,因而越来越受到人们重视,成为了解新动向、新发现的重要信息源。

会议文献的形式有会前产生的预印本、议程和发言提要、论文摘要(有相当多的会前文献不对外发行,只供与会者);有开会期间产生的开幕词、讲话、报告、讨论记录、会议决议和闭幕词以及在会上散发的临时性材料等会中文献;有的会议结束后经主办单位整理发表正式的会议资料,常以会议录、汇编、论文集、报告、学术讨论报告、会议专刊为名出版,形成会后文献。约40%的会后文献以期刊的形式出版(如特辑、专辑等),也有以图书形式出版的专题论文集,还有以连续性会议文献的形式定期或不定期出版的,如丛书、丛刊等。

(6)技术档案

科技档案是企事业单位、国家机构,社会组织及个人从事生产、科研、基建及管理活动中形成的对国家和社会具有保存价值的应当归档保存的科技文件材料,一般有具体事物的技术文件、图纸、图表、照片和原始记录等。详细内容包括任务书、协议书、技术指标、审批文件、研究计划、方案大纲、技术措施、调查材料、设计资料、试验和工艺记录等。这些材料是科研工作中用以积累经验、吸取教训的重要文献。技术档案一般为内部使用,不公开出版发行,有些还有密级限制,因此在参考文献和检索工具中极少引用。

(7)科技报告

科技报告,是科学技术工作者或课题组记录某一科研项目调查、实验、研究的成果或进展情况的报告,又称研究报告、报告文献。出现于20世纪初,第二次世界大战后迅速发展,成为科技文献中的一大门类。每份报告自成一册,通常载有主持单位、报告撰写者、密级、报告号、研究项目号和合同号等。按内容可分为报告书、论文、通报、札记、技术译文、备忘录、特种出版物。大多与政府的研究活动、国防及尖端科技领域有关,发表及时、课题专深、内容新颖成熟、数据完整,且注重报道进行中的科研工作,是一种重要的信息源。查寻科技报告有专门的检索工具。

科技报告的特点是:单独成册,所报道成果一般必须经过主管部门组织有关单位审定鉴定,其内容专深、可靠、详尽,而且不受篇幅限制,可操作性强,报告迅速。有些报告因涉及尖端技术或国防问题等,所以一般控制发行。目前,世界上各发达国家及部分发展中国家每年都有相当数量科技报告产生,尤以美、英、法、德、日等国的科技报告为多。

(8)政府出版物

政府出版物是指各国政府部门及其所属机构出版的文字、图片以及磁带、软件等,又称官方出版物。它可分为行政性文献和科技性文献两类。行政性文献(包括立法、司法文献),主要有政府法令、方针政策、规章制度、决议、指示、统计资料等,主要涉及政治、法律、经济等方面;科技文献主要是政府部门的研究报告、标准、专利文献、科技政策文件、公开后的科技档案等,有些研究报告在未列入政府出版物之前就已经出版过,故它与其他类型的文献有重复。政府出版物对了解各国的方针政策、经济状况及科技水平,有较高的参考价值,一般不公开出售。

(9)学位论文

学位论文是高等院校或研究机构的学生为取得各级学位,在导师指导下完成的科学研究、科学试验成果的书面报告。有价值的学位论文,尤其是较高层次的学位论文,应能表明求取学位者对某学科的理论知识的掌握程度、概括能力和独立从事科学研究的能力。求取学位者在拥有大量资料的基础上提出自己的研究成果、实验创造和论文见解,具有独创性、新颖性、科学性的特色,其质量要经过学位或学术委员会的考核。前苏联对2万名科技人员的调查表明,对学位论文感兴趣的占被调查总数的28.6%,仅次于标准和专利文献(44.1%),高于会议文献(23.5%),这表明学位论文是一个重要的文献信息源。

1.2.2.2 按照内容加工深度分类

(1)一次文献

一次文献又称原始文献,是指公开并正式发表的科学研究、工作实践中的新成果、新知识和经验总结等。原始文献是获取可靠信息的依据,核实信息的可靠性应以原始文献为准。这是最基本的文献信息源,具有新颖性、创造性、系统性等特点。包括阅读性图书、科技报告、会议论文、专利说明书、学位论文等全文数据库。一次文献数据库是电子文献信息源中非常重要的信息源,是直接获取原始文献的主要途径之一。一次文献数据库有中国期刊全文数据库、超星数字图书馆等。

(2)二次文献

二次文献信息源是指人们将大量无序的一次文献信息使用一定的方法进行加工整理后所形成的信息集合。其文献形式是二次文献。二次文献信息源将大量分散无序的信息有序化,具有浓缩性、汇集性、有序性的特点,具有按照文献的内部特征或文献的外部特征来报道揭示和检索一次文献的功能,能系统地反映一次文献信息,为用户提供检索所需文献的线索,是检索一次文献必不可少的工具。包括书目数据库、题录、文摘、索引等数据库。电子文献信息源中,二次文献数据库往往是某一领域全面系统的电子文献信息源,具有较高的学术性和权威性,是获取原始文献的重要线索来源。二次文献数据库有化学文摘(CA),工程索引(EI)等。

(3)三次文献

三次文献是通过二次文献提供的线索,选用一次文献内容,进行分析综合后形成的,包括词典、百科全书、年鉴、名录、指南、综述等。它是借助二次文献,全面系统地搜集相关信息,经过筛选、分析、加工整理、概括、浓缩等手段,按科学方法加以组织形成的信息资源。三次文献的特点在于高度浓缩和深度加工。目前三次文献电子信息源都在向网络化方向发展。比如:Knovel电子工具书(http://www.knovel.com)、“在线工具书大全”(http://www.hrexam.com/dictionary.htm)等。