多元化背景下高校图书馆学科服务的实践与发展
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1 数据密集型科学的兴起

随着数据密集型科学的兴起,数据成为科学研究的基础,数据的价值得到重视。高校图书馆在这种背景下自然成为数据管理机构的首选。高校图书馆作为信息服务的媒介之一,在处理各类文献信息方面具有得天独厚的优势,其具备数据管理和数据服务的能力,开展数据服务对高校、社会和用户都具有重要意义。

大数据、云计算、科研第四范式都是数据密集型科学兴起的体现。大数据的概念发展到现在,全球已经出现了很多能够处理的较大数据规模软件工具和解决方案。大数据呈现出“4V+1C”的特征,即数据量大(Volume)、数据类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)、复杂性(Complexity)。其中,数据量大是指数据规模庞大,目前各种移动设备或电子设备产生的数据量越来越大;数据的格式和类型越来越多样化,多源信息产生大量的异构信息;数据量大会使数据的价值密度降低,我们需要从大量的数据中找到有价值的信息,完成数据价值的挖掘会更困难;处理速度快是指对数据实时处理时效性要求高,这是大数据区分于传统数据挖掘最显著的特征;复杂性是指数据的处理复杂,需要有新的方法来满足异构数据统一接入和实时数据处理的要求。用户交互技术的发展以及移动终端设备的不断优化,使得人人都可以成为数据的提供方,也可以成为数据的使用方。当我们使用社交网站交流的时候,它可以记录我们的社交行为;当我们使用搜索引擎检索信息或资料的时候,它可以记录我们的搜索过程、行为和结果;当我们在网上购物的时候,它可以记录我们的喜好,从而根据我们的喜好,向我们推荐商品;微博可以记录人们所产生的即时的想法和意见;图片视频分享网站记录人们的视觉观察;百科全书网站记录人们对抽象概念的认识;幻灯片分享网站记录人们的各种正式和非正式的演讲发言;机构知识库和开放获取期刊记录人们的学术研究成果。从互联网的发展来看,网络社会化、信息社会化和商务社会化使信息网络向人际网络转变,信息处理向关系处理转变,电子商务向社会商务转变。这些转变使数据间的关系越来越复杂,从而加深了数据处理的难度。从研究方法上说,科学研究第四范式应运而生。2009年,格雷先生在The Fourth Paradigm一书中提出了科学研究的四个范式并且描述为:经验范式,相对应的是经验科学,产生于几千年前,是描述自然现象,以观察和实验为依据的科学;理论范式,相对应的是理论科学,产生于几百年前,使用模型或归纳方法进行科学研究;模拟范式,相对应的是计算科学,主要模拟复杂的现象;第四范式,相对应的是数据密集型科学,是目前新兴的科学研究范式。科学研究第四范式是继经验范式、理论范式和模拟范式之后的一种针对数据密集型科学的新的研究方法论。该方法论是将数据作为科学研究的对象和工具,基于数据来探索、设计和实施科学研究,构造一个开放协同的研究模式以应对数据洪流。其主要特点是:数据依靠工具获取或者模拟产生,利用计算机软件处理数据,依靠计算机存储数据,利用数据管理和统计工具分析数据。在这种新方法论的影响下,科学研究的方法向以数据为驱动的方向转换,对科学研究的方式和服务的模式都产生了深刻的影响。而高校图书馆作为科学研究的重要基地,是数据、信息和知识的主要储存场所,必将受到数据密集型科学的影响。大数据的出现以及科学研究范式提出新的要求,对高校图图书馆数据的存储、处理和利用提出了挑战。云计算是分布式计算技术的一种,在未来,终端只有一个通向云端的接口即可,不再需要存在终端的软件,它是一种经济的解决方案。总体来说,不管是大数据、云计算,还是数据密集型科学都强调了数据的重要性,都是科技进步的体现,都是为智慧社会而服务,为人类服务。