云环境下我国综合数字档案馆建设模式研究
上QQ阅读APP看书,第一时间看更新

第一节 主要概念界定

一 数字档案馆

1.数字档案馆定义

数字档案馆(Digital Archives)是伴随着计算机技术、网络技术的发展而产生的一个新概念。最早在1994年由玛格丽特·赫斯特罗姆(Margaret Hedstrom)提出了“电子档案馆”(Electronic Archives)的概念,其后不断有学者提出相类似的概念,如虚拟档案馆(Virtual Archives)、无墙档案馆(No Wall Archives)、全球档案馆(Global Archives)等。经过二十多年的发展,数字档案馆(Digital Archives)的提法逐渐被大家认同,其他的名称已经很少使用。

数字档案馆这一概念也是处在不断地发展之中的。通过对各种不同的定义进行归纳,可以把数字档案馆的定义分为以下两类。

第一,信息系统说。这是最常见的定义,也被称为狭义的数字档案馆。即从技术的角度来看,数字档案馆是一个信息系统,这个信息系统不管是单机的,还是网络的,不管是集中化管理的,还是分布式的,不管是以单个实体档案馆为基础,还是以多个实体档案馆为基础,从本质上都是一个以数字档案为管理对象的信息管理系统。如:“数字档案馆是指各级各类档案馆为适应信息社会日益增长的对档案信息资源管理、利用需求,运用现代信息技术对数字档案信息进行采集、加工、存储、管理,并通过各种网络平台提供公共档案信息服务和共享利用的档案信息集成管理系统。”[1]和其他的信息系统一样,这个信息系统应该有五个要素组成。①数字档案资源,这是数字档案馆建设的核心和存在的基础,是数字档案馆区别于其他的信息系统的重要标志;②计算机(台式机、服务器、平板电脑、智能手机等各种终端设备)、各种网络设备(路由器、交换机、防火墙)、存储设备(光盘库、磁带库、磁盘阵列)等硬件资源,这是网络数字信息服务的硬件基础;③数字档案馆建设中的各种技术标准、规范和在此基础上开发的管理软件,这是数字档案馆进行管理和提供服务的技术手段;④用户,即数字档案资源的利用者,是数字档案馆的服务对象;⑤数字档案馆的管理者、技术人员。

第二,群体说。群体说是从数字档案馆信息系统的连接广度这个角度来定义数字档案馆的,此数字档案馆也被称为广义的数字档案馆。如有学者认为数字档案馆是依靠各种信息技术,以档案信息资源服务为目的,各方联合共建的“档案信息资源空间”,[2]这里强调的是数字档案馆的共建整合。2014年底,国家档案局发布的行业标准《电子档案基本术语》(DA/T58-2014)中也认为数字档案馆是一个“通过各种网络平台提供利用的档案信息集成管理体系”。也突出了信息的集成性。

广义的数字档案馆实质上还以个体的数字档案馆为基础,只不过是通过网络技术将不同地域的单个数字档案馆连接起来,突出了数字档案馆的集合性、共享性、群体性。离开了一个个具体的狭义数字档案馆,广义的数字档案馆就缺失了建设的基础,而广义的数字档案馆是数字档案馆的根本建设目的,如果仅有一个个狭义的数字档案馆,那么就会导致在一个地区、一定的范围内利用档案是方便的,但从整个社会来说,形成了一个个档案信息的孤岛,各个数字档案馆之间无法进行信息的交换,无法进行跨平台检索,不便于档案信息的整合,不利于人们的利用,不利于最大限度地发挥档案信息资源的作用。因此,数字档案馆建设的最终目标是建设广义的数字档案馆。

2.数字档案馆类型

根据不同的分类标准,可以把数字档案馆划分为不同的类型。

第一,以数字档案馆的建设主体性质划分。

国内的数字档案馆,都是在实体档案馆基础之上建设开发的,按照主体建设单位的性质不同,可以将数字档案馆划分为综合数字档案馆、企业数字档案馆、事业单位数字档案馆。

综合数字档案馆以国家各级综合档案馆为基础,可以分为中央、省、市、县(区)四级,这些档案馆已经具有了多年的历史,拥有了大量的档案资源,以它为基础,将传统纸质档案数字化,接收各级政府机构和事业单位形成的电子文件,保证数字档案资源的安全,为党政机关和公众提供优质的档案服务,是综合数字档案馆的主要目的。综合数字档案馆的管理对象分为存量电子文件和增量电子文件两部分,以后增量电子文件成为其主体,这些文件主要是在电子政务系统中形成的,所以在建设的过程中,往往要依赖于电子政务平台,根据不同的用户,提供不同安全级别的服务。

企业数字档案馆是在原国有大中型企业档案馆的基础上建立起来的新型数字档案管理机构。它以服务于企业信息化建设为目标,将企业形成的各类档案文件进行集中统一管理,为企业发展提供快捷、智能的档案信息服务。这些企业数字档案馆的建设,往往和具体的企业的信息化发展程度、企业对档案工作的重视程度、企业的规模等因素有着密切的关系,在建设过程中,也要注意和企业已有的各类信息系统的连接。

事业单位数字档案馆是在各事业单位档案馆的基础之上发展起来的,我国许多事业单位(包括研究院、高校等)对档案工作非常重视,建立了档案馆。随着高校信息化的建设,已经有许多单位在开发数字档案馆系统,如南京大学的南大之星档案管理系统。这类数字档案馆,以服务于本单位的发展为基础,接收和管理本单位发展过程中形成的各类数字档案信息。同企业数字档案馆一样,也需要注意和本单位已有的各类信息系统的连接。

以上三种类型,是我国数字档案馆建设的主要类型,其中综合数字档案馆既是主体,也是本书主要的研究对象。

第二,以数字档案馆建设的合作方式划分。

以合作方式划分,我国的数字档案馆可以分为个体模式的数字档案馆、联合模式的数字档案馆。

个体模式的数字档案馆是指单个的数字馆个体模式以单个的档案馆出资建设为主,而联合模式则是多个档案馆共同出资合作建设数字档案馆,各档案馆共同利用这一数字平台进行数字档案资源的管理利用。由于数字档案馆是运行在网络环境中的一个虚拟平台,网络本身的属性,超越了地域空间、官僚层级空间,其发展也不再受现实中实体档案馆的制约,因此,采用联合模式将是数字档案馆建设发展的一个方向。

第三,以数字档案馆建设项目开发方式划分。

数字档案馆建设是一个庞大的系统工程,一般的档案馆很难独立完成,需要和软件开发商、数据处理公司等多方合作,根据项目是否外包,可以把数字档案馆建设模式分为自建模式、外包模式和混合模式三种。[3]自建模式是指档案馆依靠自己的技术力量独立承担数字档案馆的建设工程;外包模式是指档案馆通过招标的形式,将建设项目委托给一些专业的技术公司;混合模式是指档案馆根据自身的情况,完成数字档案馆建设项目中自己熟悉的部分,而将自己无力承担的部分以合同形式委托给专业的技术公司完成。在这三种形式中,早期的数字档案馆建设,由于系统比较简单,有些档案馆技术力量强,往往采取自建的形式。但由于网络的发展,技术的复杂性越来越高,加上档案馆信息技术人才缺乏,外包形式或混合形式是数字档案馆的主流方式。在这种形式中,项目需求分析、项目建设目标等工作由建设主体提出,项目中的应用系统开发外包给专业的软件公司,项目中的数据处理——纸质文件数字化也大多外包给数据处理公司,项目中的服务器和网络维护一般由档案馆的技术人员完成。

二 电子政务

1.电子政务的定义

电子政务一词是由英文Electronic Goverment(E-Government)翻译而来,是伴随着新公共管理和政府再造运行的兴起,利用信息技术提高政府效率的一种政府创新形式。对于其定义,不同学者也给出了不同的定义。如汪向东将电子政务进行广义和狭义划分:“广义的电子政务,是指各级各类国家机关以良政为目标,应用电子信息通信技术手段,进行的各种政务活动与行为的总称;狭义的电子政务,往往特指政府机构为改进公共行政管理和社会服务,利用电子信息通信技术手段尤其是基于互联网实现的政务活动与行为。”[4]其实质就是利用信息技术等技术手段对政府的对外服务、公民参与和内外关系等方面不断进行优化和改进的过程。

如果说数字档案馆是信息技术的发展作用于档案管理而产生的新形态,那么,电子政务也可以说是信息技术作用于政府而产生的新的政府形态。在信息化的大潮和新公共管理的理念支持下,各国政府开始了运用信息技术改良政府办公的运动,即电子政务。我国1999年的“政府上网工程”,开启了电子政务的局面,进入21世纪,我国的电子政务迈入了全面快速的发展阶段。截至2015年底,我国电子政务建设已经取得长足的发展,中央部委和省级政务部门主要业务信息化覆盖达到90.8%,地市级政务部门主要业务信息化覆盖率达到76.8%,县级政务部门主要业务信息化覆盖率达到52.5%。[5]中国互联网络信息中心(CNNIC)发布的第39次《中国互联网络发展状况统计报告》显示,截至2016年12月,全国共有gov.cn域名53546个。另外,政府网站在信息公开、政民互动、网上办事等方面发挥着重要的作用,政府网站的普及率不断提高,各级地方政府网站的覆盖率已经接近100%。

2.电子政务的建设内容

电子政务在其发展过程中,主要关注三个领域:①电子行政,即改进政府内部业务流程;②电子服务和电子公民,主要连接公民,服务于公民;③电子社会,即连接社会与其他组织(如企业、非营利性组织及社团组织等)。根据这三个领域,可以将电子政务的内容划分为以下三类:①政府对政府(Government to Government,简称G2G),是一种政府间的电子政务应用,是电子政务的基础工程,处理政府机关中的隶属关系、业务指导关系、平行关系、不相隶属关系之间的电子政务;②政府对企业(Government to Business,简称G2B),即政府通过网络快捷地为企业提供各种管理、服务和政府采购;③政府对公民(Government to Citizen,简称G2C),即政府通过政务网络系统为公民提供出生、入学、就业、社会保障、死亡等过程的各种服务。

在电子政务的发展过程中,很多政府机关已经实施了办公自动化系统、电子公文系统,无纸化办公的时代即将来临,作为文件档案最终保存在机构的各级综合档案馆中,自然也要接收各类电子文件。因此,我国各地的综合档案馆在建设数字档案馆的过程中,都是搭乘电子政务这趟班车,把数字档案馆建设纳入电子政务建设的整体规划中,使综合数字档案馆成为电子政务体系中的一个重要的信息资源库。电子政务的发展模式,对综合数字档案馆的建设有至关重要的作用。

三 云计算

1.云计算的定义

数字档案馆的技术本质是一个信息系统,技术的发展对其建设模式有很大的影响,其中云计算技术就是代表。

截至目前,云计算的定义众多,没有统一,很多机构和个人都对“云计算”的定义进行了阐述。

代表性的定义有:

Whatis.com的定义:“一切能够通过互联网提供的服务”(cloud computing is a general term for the delivery of hosted services over the internet)。[6]

美国国家标准和技术研究(NIST)的定义:“云计算作为一种模式,提供了便捷的、可随时通过网络访问配置计算资源(包括网络、服务器、存储、应用和服务)共享池的能力,这些资源能够快速部署,并只需要很少的管理工作或与服务供应商进行很少的交互”。[7]

这些定义既有从技术角度进行描述的,也有从商业模式角度进行总结的。既涵盖了应用层面,又包括了底层资源的组织和管理。由于所处的语境不同,所以各自有侧重点。从总体上看,云计算包括两个层面的含义:一是云计算平台;二是云计算服务。

云计算平台有些类似于操作系统,通过它管理资源池,这种资源池被称作“云”,“云”是一些虚拟计算资源,包括各类服务器和网络资源等。云计算平台通过虚拟化等技术将分布在不同地域的众多计算机连接起来,形成一个统一管理和统一调度的整体,可以快速调动各种软、硬件资源协同工作,完成计算、存储和沟通任务。用户不再需要关注技术内容,无须为烦琐的细节烦恼,可以更加专注于自己的工作。

云计算服务代表了一种新的商业模式,即按需使用的商业模式。从“云”的管理者角度来看,“云”中资源可以随时扩展,动态管理。从“云”的用户角度来看,“云”中的资源可以根据申请而使用,根据使用量来付费。“相对于传统的计算资源服务模式,‘云’服务就像是从发电机模式转向电网集中供电的模式,它意味着计算机能力也以作为一种公共资源进行流通,就像煤气、水、电一样,取用方便,费用低廉。”[8]

云计算平台是云计算服务的基础,通过这个平台,将大量的计算资源集中起来,协同工作,对“上层”服务进行有效的支撑。而云计算服务的不断发展和丰富,又对“底层”的云计算平台提出要求,促进了云计算技术的不断创新。

2.云计算的分类

云计算可以按照各种标准来分类,常见的分类方法有以下两种。

第一,按照是否公开发布服务可以分成:“公有云”、“私有云”、“社区云”和“混合云”。

它们在技术上并没有本质的差别,只是运营和使用的对象不同。公有云是由第三方IT公司掌握、操作,可以向不同的企业提供云服务,多家企业共享这些资源并在共同的物理资源上分配自己的虚拟计算力。目前,提供公有云服务的公司有亚马逊、惠普、IBM、谷歌、微软、Salesforce.com等。社区云是大的公有云的一个组成部分,是指在一定地域范围内,基于区域内的网络的互联优势和易整合的特点,结合社区用户的需求,由云服务商提供的一种云计算服务模式。私有云是企业自己建造,只对企业自身提供服务。混合云由多个公有云和私有云组成,一般企业将数据安全性、保密性要求高的服务部署在私有云上,而将对外公共服务的开放数据部署在公有云上,采用混合的形式。

第二,按照服务类型可以分为:基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)等。

IaaS提供虚拟硬件资源服务,如虚拟主机、存储、网络、数据库管理等资源。使用IaaS服务,用户就像租用了一台服务器裸机,可以通过网络远程为这台虚拟的服务器安装操作系统(Windows或Linux),并在其上安装开发的软件,做几乎任何想做的事,有相当大的灵活性。如亚马逊的弹性计算云EC2和简单存储服务S3。当然,IaaS对用户的软件、硬件的开发、管理能力要求也是最高的。

PaaS提供应用程序的引擎或平台的服务。用户使用PaaS服务,相当于在使用已经安装了操作系统和开发软件的服务器,可以用服务商提供的编程环境和语言开发自己的应用。如Google App Engine和微软的Azure等。用户无须关心硬件资源的管理、节点间配合等问题,但需要有一定的应用开发能力。

SaaS将特定的应用软件功能封装成服务,提供给用户使用。用户可以申请、配置应用的功能,但不能进行硬件配置和软件开发。在SaaS环境中,用户相当于购买了一套安装了操作系统和应用软件的服务器,可以根据需求配置使用这些软件。如Salesforce公司的在线客户关系管理CRM服务、Google Docs服务等。用户不需要有任何软件开发能力,就可以轻松地使用这些服务。

3.云计算的特点

云计算是在并行计算、分布式计算、网格计算、虚拟化和面向对象服务的体系结构(SOA)等技术的基础上演进发展而来的,综合了各类技术的优势,具有以下特征。

(1)超大规模。“云”将分布在各地的计算机连接起来,形成了庞大的计算机集群,具有超强的计算和存储能力。Google、亚马逊、微软的云计算都由几十万台以上的服务器组成。

(2)虚拟化。借助虚拟化技术,云计算平台可以对底层千差万别的资源进行统一管理,使大量物理分布的计算资源可以在逻辑层面虚拟成一个整体,即一台超级计算机,非常方便、快捷地实现资源的高度动态和管理,并满足各类应用需求。

(3)高可靠性。云计算使用了多项技术来保证服务的可靠性,如数据多副本容错、计算节点同构可互换技术等,相比本地计算机,云计算更加可靠。

(4)可伸缩性。云计算在平台层面要求运营商可以根据用户需求的增长快速扩展计算资源。同时,用户也可以根据自己的业务需求申请新的资源,方便灵活。

(5)按需服务。云是一个庞大的资源池,用户可以按需购买服务,按使用量付费。

(6)费用低廉。这是云服务最大的优势,即较低的使用成本。云服务的成本降低主要在于:A.云计算的容错技术使得可以采用极其廉价的机器来构建云,并不一定要专业的服务器;B.云计算使用的自动化管理技术使数据中心管理成本大幅降低;C.云计算通过通用平台和分享使资源的利用率大幅提升;D.云计算中心一般都选择电力成本低廉的地区(如水电站附近)来建设云计算中心,降低能源成本。

数字档案馆是以IT技术为基础进行数字档案信息的管理与服务的,云计算等新技术的发展,必然会影响到数字档案馆的IT架构、建设模式。

四 建设模式、顶层设计与IT架构

1.建设模式

模式(Pattern),也被称为事物的标准格式,一般是指事物在发展过程中,产生的一种规律变化与自我重复的样式与过程。事物在发展过程中,某些固定的元素不断以可预测的方式周期性重现,呈现了某种规律性的样式,就形成了模式。寻找事物发展的模式,是人类的基本认知功能之一。

数字档案馆的建设模式是数字档案馆在建设过程中呈现的规律性的样式,是在对相关信息化项目的建设经验分析和总结的基础上,得出的一种可以在数字档案馆建设时借鉴的样本。借鉴他人成功的建设模式,可以减少建设过程中的失误,节省建设资金,加快建设速度。因此,在数字档案馆建设中,一方面要积极进行探索;另一方面,也要不断地思考和总结,发现规律,形成建设模式,以指导数字档案馆建设。

数字档案馆的建设模式,可以从不同角度和层面来进行分析,如从建设主体的角度分析、从合作方式角度分析、从布局方式角度分析、从数字档案馆系统的功能组成分析等可以得出不同的模式。笔者认为,还可以从宏观和微观两个层面来对数字档案馆的建设模式进行分析。从宏观上看,布局模式,即全国的综合性档案馆在建设数字档案馆时的布局安排,中央级、省级等数字档案馆之间的关系,等等。从微观上看,可以对某个数字档案馆内部技术架构进行分析,可以将其技术架构进一步分解为基础架构、数据架构、应用架构等不同的层次。

2.顶层设计

设计是人们为实现某一目标进行的一种有计划的创作或规划行为。顶层设计是将“顶层”与“设计”两个概念结合起来,本意是指从一个系统的顶端开始的总体构想,它源于系统工程学领域的自上向下的设计。在我国,顶层设计一词已经被广泛地运用到各个方面,如电子政务的顶层设计、电子文件管理的顶层设计、国家体制的顶层设计等。顶层设计有三个基本特征:一是顶层决定性,顶层设计是一种自上而下的设计,其核心目的在于实现整体的目标,站在全局的高度,从上而下,顶层决定底层,下层服务上层;二是整体关联性,各个项目与顶层目标之间应该形成有机关联,成为一个整体;三是可操作性,顶层设计的方案清晰、明确,设计的成果是可实施的、可操作的。

数字档案馆从狭义的角度来看,它是一个信息系统,但从一个国家、一个地区的角度来看,它是一个庞大的系统工程,需要处理档案馆与电子政务、档案馆与各类用户、档案馆与档案馆等之间的复杂关系,因此,数字档案馆的建设绝不是买一些硬件和一套管理软件那么简单,它需要站在国家层面进行系统的顶层设计,以减少建设中的重复投资、资源浪费,以使系统达到最优化。

顶层设计在信息资源建设规划中,更多地表现为标准设计(即各个信息系统的建设标准,包括元数据标准、安全标准、技术标准等)、建设模式(布局)和框架设计、领导机制设计等方面。如美国联邦政府进行电子政务建设时的FEAF(Federal Enterprise Architecture Framework)就是一种顶层设计,它定义了美国联邦政府在进行电子政务建设时各个政府机构开发应用时应该遵循的标准,解决了投资规划的步骤、考核的准则等问题,从而达到提高整个联邦政府在电子政务建设中的效率、促进部门间信息的共享、消除信息孤岛的目的。

顶层设计如果做得不好,会产生一系列问题,如效率低下、体制僵化、积极性差等,不利于创新,因此,在信息资源规划中,如何协调顶层设计的统筹规划和各个业务系统的积极性和创新性之间的矛盾,是在做顶层设计时面临的一个难题。

3.IT架构

IT架构,也被称为IT规划,是企业架构的组成部分,是近年来在西方企业IT治理中兴起的一个概念,企业架构主要包括业务架构和IT架构,企业的战略决定了业务架构,业务架构包括企业的业务运营模式、组织结构、流程体系等内容。IT架构是企业信息系统的整体规划和框架体系,通过IT架构实现业务流程和功能,进而实现企业的最终目标。

在IT治理中,既要考虑业务架构,也要考虑IT架构,IT架构是为业务架构服务的,好的IT架构可以很好地服务于档案馆实现其战略目标、提高业务的效率、节省IT投资。

顶层设计、建设模式和IT架构,这三个概念之间,有其相关性,都是指在区域范围内(如某一级政府部门或某集团公司)开展IT规划时,从上层对全局的规划。合理的规划,可以减少重复投资,消除信息“烟囱”,提高IT项目的使用率。但这几个概念的侧重点不同,顶层设计注重的是宏观的调控、战略级的设计,包括标准、布局、领导体制等。IT架构则相对层次较低,特指在政府或企业进行IT建设时的一种框架设计,是复杂信息系统建设必须遵循的标准和规范。建设模式则处在中间层,是对复杂信息系统的建设路径、成功经验的总结,然后形成一种可以让人借鉴的样本,以达到在建设过程中节省人力、物力的作用。建设模式可以分为宏观布局和微观结构,宏观布局需要使用顶层设计的理念,从国家或区域的大局出发,考虑数字档案馆的分布、合作方式、发展的优先级等因素。而微观结构则是从业务和技术的角度,对某个时期典型的数字档案馆的架构进行分析。所以,建设模式既和顶层设计相关,也和IT架构相关。

五 IT治理与治理机制

1.IT治理的概念

IT治理(IT Governance)这一概念最早由劳伦斯·洛(Lawrence Loh)和文卡特曼(N.Venkatraman)于1992年提出,[9]它是现代公司治理的组成部分。关于IT治理概念,中外学者给出了很多不同的定义,如IT治理专家彼得·维尔和珍妮·罗斯认为:“IT治理是指为鼓励期望行为而明确的决策权归属和责任担当的框架。”[10]我国学者刘云峰等认为:“IT治理是公司治理的一部分,是信息不对称情况下,为保证IT决策的责、权、利一致,而设计的激励、约束的制度和流程。”[11]中国IT治理研究中心提出:“IT治理=IT治理思想+IT治理模式+IT治理体制+IT治理机制。”[12]IT治理思想是在IT治理时所遵循的有关管理思想、治理理论,是信息化建设过程中的科学发展观。IT治理模式是根据组织发展目标确定的IT治理定位,是IT治理的经验和路径的模式化总结。IT治理体制是IT治理中的组织和制度体系及其运动方式。IT治理机制是IT治理的沟通机制、IT绩效管理与激励约束机制等。

不同的学者理解的IT治理的定义不同,但在一些核心问题上的理解还是基本一致的。如:IT治理的目的是保证组织的IT与组织的业务战略一致,控制与IT相关的风险,合理利用IT资源,促使IT投资收益最大化,推动业务发展;IT治理在治理主体上和其他治理是一样的,即都是由管理决策人员和利益相关者构成;IT治理的过程主要由决策和管理等构成。所以,“IT治理就是指设计并实施信息化的过程中保持各方利益最大化的制度安排,是一种激励、监督与制衡机制”。[13]

2.治理机制

机制,指一个系统的构造、功能及其相互关系。在系统论中,一般把一个对象看作一个系统,而系统主要是由系统内的元素和元素之间的相互作用构成的,机制就是一个系统的各元素构造及相互关系,是决定系统功能的主要因素。

治理机制是指治理的体系结构和结构之间的相互作用关系。不同学者对治理机制的理解不同,有的认为可分为运行机制、动力机制和约束机制,有的学者认为IT治理机制是“决策机制、执行机制、风险控制机制、协调机制的综合体”,[14]还有学者认为“决策、激励、控制是治理的三大支柱”,[15]是IT治理的核心思想,因此,IT治理机制可以分为决策机制、激励机制和控制机制。虽然不同的学者对机制的内容有不同的理解,但都认为机制对系统的功效有重要的影响,是IT治理中不可或缺的因素。

随着IT技术和档案管理业务的发展,数字档案馆也会逐渐发展演变成为一个复杂的系统,在复杂的信息系统建设时,不仅要有正确的思想,正确的建设模式,要保证系统可靠高效地运行,更需要引进IT治理理论,对数字档案馆中的IT治理机制进行有效分析。建立合理的治理机制,是数字档案馆建设成功的重要保障。