第一章
博士质量评价的理论与方法
第一节
博士培养质量评价
——概念、方法与视角
现代意义的研究型博士肇始于近代德国,早在17世纪,德国就出现了“哲学博士”的称谓,但直到18世纪末、19世纪初,“哲学博士”才逐渐为耶拿大学、柏林大学、莱比锡大学等高校广为接受,成为德国高等教育的一大特色,并随后作为一种崭新的教育模式传至世界各国。[1]美国于1861年由耶鲁大学颁发了第一个哲学博士学位。在移植德国哲学博士培养模式的浪潮中,英国的步伐较为缓慢,直到1919年,英国才有了自己的第一个本土哲学博士。[2]哲学博士和其他类型的博士的主要区别在于它是一种研究型的学位,获取学位的前提条件是撰写一篇博士论文,在学术领域做出原创性的贡献。所谓哲学博士也就是研究型博士,而研究型博士正是本研究关注的对象。
传统上,专门聚焦于博士生教育的研究一直乏善可陈。最近二十多年来,博士生教育的相关问题受到了越来越多的关注,博士生教育的规模与结构[3]、博士生教育中的学术指导[4]、博士生教育中的学术训练[5]、博士生的学术社会化[6]、博士生教育与劳动力市场的关系[7]、博士生的耗损率[8]、博士点的评估[9]、博士生的培养模式[10]等基本问题均得到了比较充分的研究。
20世纪90年代以来,博士学位类型的多样化和博士生教育规模的扩张成为全球性的趋势,博士质量能否得到保障成为政府、社会、学术界普遍关心的问题。英国学术期刊《教育中的质量保障》2002年第2期和2003年第3期分别聚焦于“博士学位授予的质量标准”和“博士论文口试”,用专题的形式探讨博士生教育的质量保障问题,博士质量的相关问题一时成为学界关注的焦点。1998-2006年,我国博士的招生规模迅速增长,从14962人增长到55955人,8年时间增长了两倍多。规模的扩张也带来了质量的隐忧,也正是在这期间,社会上对博士质量的质疑和批评声一浪高过一浪。为了客观评估我国博士质量的真实现状,2007年,受国务院学位委员会的委托,“中国博士质量分析”课题组开始对中国的博士质量进行全面的整体性分析和评估,进一步将博士质量的问题推向前台。
在国内外的博士生教育研究当中,“博士质量”并不是一个经常使用的概念。美国大量的对博士生教育的评估主要是关于博士点(Doctoral Programs)的质量评估,与我们所做的博士质量评估相差甚远;英国有一些关于“博士评价”(Ph. D. Assessment)的文献,多数是一些理论性的探讨,且大多讨论的是博士论文口试的问题。因此,如何评估一个群体——尤其是全中国的博士这样大的一个群体——的博士质量,这无论在实践上,还是理论上,都是全新的挑战。有鉴于此,本节将从概念、方法和视角三个方面对博士质量的评价问题进行探讨:
首先,试图厘清“博士质量”这一关键性的概念,并对它和相关概念(博士生教育质量、博士点质量)的关系进行辨析,这是博士质量评估的逻辑起点;
其次,在厘清概念后,将博士质量评估分为微观和宏观两个层次,进行方法性的探讨。
最后,针对目前博士生教育研究中的问题,探讨“博士生教育”的定义的问题。不同的定义会导致不同的质量评价的基准和视角。
一、概念界定
在探讨评价博士质量的方法和理论视角之前,我们有必要澄清“博士质量”这个核心的概念,以作为讨论的起点。通过文献检索,我们发现,“博士质量”和“博士质量评价”几乎是一个横空出世的概念,在外文文献中几乎找不到对应的术语。在已有研究中,中西方学界谈论更多的是“博士点质量”(Quality of Doctoral Programs)[11]和“博士生教育质量”(Quality of Doctoral Education)。那么,这三个概念之间的关系是什么呢?我们认为,这三者的联系和区别可以概括如下(见表1-1):
表1-1 博士质量、博士点质量与博士生教育质量
(一)博士质量
博士质量属于人才质量的范畴,它测量的是博士这种高层次人才的质量。根据我们的界定,博士质量可分为博士培养质量和博士发展质量两部分。
博士培养质量是博士学位获得者在授予学位证书这个时点上所具备的素质与能力,它体现的是博士在攻读学位期间的质量,它的主要评价指标包括创新能力、知识水平、科研能力、组织协调能力、满足社会需求的能力、社会贡献、学术生产力等等。
博士发展质量是博士学位获得者毕业后的质量,是检验博士研究生培养质量的重要参照,其主要评价指标包括用人单位满意度、就业率、科研业绩(Research Performance)、社会贡献等等。
国内外学界关于博士培养质量的系统研究非常少,但有一些关于博士发展质量的系统研究。评估博士发展质量的一种重要方法是职业生涯路径研究(Career Path Study)。在这方面,美国华盛顿大学研究生教育创新与研究中心(The Center for Innovation and Research in Graduate Education,简称CIRGE)的相关研究最具影响力。该中心的重头工作之一就是收集博士毕业生的就业信息,对各个学科博士在毕业后若干年内的职业发展状况进行评估。
(二)博士点质量
博士点质量又可称为博士学科点质量、博士专业质量,它测量的是作为一种机构类型的博士点或博士科系的质量。美国的博士点质量评估最早可追溯至1925年。当时,美国学院协会(Association of American College)的主席雷蒙德·休斯(Raymond Hughes)主持了这次评估。他从每个学科邀请20 60名大学教师,对38所大学的博士点进行了质量评估。[12]到20世纪60年代,博士点的质量评估再掀热潮,自此之后,关于博士点质量评估的实践就一直如火如荼、不绝如缕。[13]
1980年,全美研究理事会(National Research Council)成立了一个专门的研究委员会,以对美国的博士点进行质量评估,此后,该委员会分别在1982、1993和2007年对美国博士生教育点质量进行了评估。
经过数十年的发展,博士点质量的评价已经形成了自己独有的方法和理论体系。主要标准有:1.教师的学术质量(主要通过同行评估的、主观性的声誉调查法来衡量);2.教师的学术产出(发表论文的数量等)、学术影响力(论文被引次数、获奖次数等);3.博士点在培养博士生方面的效果(包括博士生能够顺利完成博士研究的比例——即博士毕业率,博士生毕业后的职业发展状况,等等);[14]4.博士生对博士点的满意度;5.博士点的特征(人数规模、图书资料、研究资助);等等。
早期博士点质量评估最为看重教师质量,尤其侧重教师的学术声誉,其中最为典型的是阿兰·卡特1966年对106所美国大学博士点质量的评估。卡特认为,质量是一个“主观”的概念,因此学术声誉测量法最为可靠。此后,全美研究理事会分别在1982、1993和2007年对美国博士生教育点质量进行了评估。2007年的评估涉及76个学科、226所院校、5000多个博士点。和前两次的评估不同,这次评估不仅调查了教师的看法,也调查了学生的看法,不过,主要的质量评价手段仍然是针对教师的意见调查(Opinion Survey)。
当然,博士质量评价和博士点质量评价并非毫无关系,因为博士质量是博士点质量的一个重要体现。一般来说,博士质量是博士点质量的重要衡量指标。例如,在1982年全美研究理事会主持的博士点质量评估中,共有4项一级指标,分别是博士点规模、博士毕业生特征、声望调查结果和大学图书馆规模,其中“博士毕业生特征”这一项涉及博士质量的维度,如修业年限、在完成博士学业的同时到具有博士学位点的大学里工作的学生的比例。尤其是最近十多年,博士点质量评估的一个新趋势就是从“教师中心”转向“学生中心”,博士质量日益成为评价博士点质量的重要指标。例如,在2007-2009年全美研究理事会的博士点质量评估中,20项二级指标中有13项与学生特征有关(见表1-2):
表1-2 2007-2009年全美研究理事会博士点评估所采用的20项指标
博士点质量评估需要大量物力、财力的支持,需要各大高校的密切配合,同时对评估方法和评估技术也有严格的要求,因此,很少有国家像美国这样开展大规模的博士点质量评估。英国QAA2007年的报告采用2004年推出的博士生教育实施规则(code of practice)[15]对英格兰和北爱尔兰地区的研究型博士项目进行了实证评估,这是一个少有的例外。
(三)博士生教育质量
另外一个相关的概念是博士生教育质量。和博士质量、博士点质量不同,博士生教育质量的概念比较宽泛,它测量的是博士生教育活动的质量。一般来说,博士生教育的质量可以从输入(Input)、过程(Process)和输出(Output)三个方面来进行测量。博士点质量构成了博士生教育活动的输入因素,博士质量则是博士生教育活动的输出产品(如图1-1所示)。因此,从广义来讲,博士生教育的质量包括博士点质量、博士质量以及博士生教育活动过程本身(即学术指导、课程、学术训练、学术资助等过程)的质量。
图1-1 博士生教育质量的测量内容
本书采取的是狭义的博士生教育质量定义,根据这一定义,所谓博士生教育质量,一般指的是博士生教育活动过程的质量,其衡量指标一般包括博士生导师学术指导质量、学术训练质量、学术氛围、学术服务的质量、博士生的毕业率、博士生的学业成就、博士生的修业年限,等等。其中,学术指导的效果和学术训练的效果往往被认为是最重要的评价指标。
对狭义的博士生教育质量的评价通常可以采用主观评价和客观评价两种方法。主观评价的主要手段是对博士生和博士毕业生的问卷调查,即通过博士生的主观判断来评价博士生教育的质量。
目前国际上对博士生教育质量的评价通常采用主观评价的方法。在美国,内拉德(Nerad)和塞尔尼(Cerny)2002年在梅隆基金会的资助下,进行了名为“哲学博士:十年之后”(Ph. D. :Ten Years Later)的研究[16],该项研究的一个核心问题是“博士对就读期间的博士生教育质量的回溯性评价”(包括博士点的质量、研究训练的质量、课程的质量、学术指导的质量等等)。澳大利亚和英国则开发了比较成熟的研究生研究经验问卷(Postgraduate Research Experience Survey,简称PRES),通过研究生的主观评价来测量研究生教育的质量。它所涉及的一级评价指标主要包括学术指导、技能发展、学术氛围、目标与标准、论文考试。根据英国高等教育学会2007年和2008年的调查结果,所调查的研究生(绝大部分为博士生)对研究生教育质量感到满意,满意指数均接近或略大于4(满分为5分),见表1-3。
表1-3 英国研究生在各项研究生教育质量指标上的满意度[17]
博士生教育质量的客观评价指标一般包括博士生的毕业率、博士生的修业年限、博士生和博士的学术发表等等。例如,美国学者蒂莫西·霍根在1981年的研究中将某一博士点的博士生教育质量等同于该博士点的博士毕业生在学术发表方面的表现。[18]
(四)三者的联系与区别
首先,从评价对象来看,三者存在一定的区别。博士质量评价的主要评价对象是人,具体来说,是博士学位获得者,因此,博士质量评价属于人才质量的评价。博士点质量评价的对象是机构,具体来说是博士点或博士学科专业,更进一步说,它的评价对象包括机构中的人(博士生导师、博士生)和物(图书馆设施、财政资助等等)。博士生教育质量评价是对教育活动的评价,它的评价对象是博士点及博士生导师培养博士生的教育过程,其主要衡量标准为教学效率或教学效果。
其次,从分析单位或者分析单元来看,三者也存在一些区别。博士点质量评价或博士专业评价的分析单位是博士学科点或博士科系,而博士质量评价和博士生教育质量评价的分析单位是个体。
最后,博士点质量、博士生教育质量、博士质量三者之间存在密切联系。例如,蒂莫西·霍根的一项实证研究发现,一个经济学博士点的教师质量(利用卡特1966年的排名作为衡量标准)与其博士毕业生的发表绩效(博士质量的一个维度)之间存在显著的正相关关系[19],也就是说,博士点质量与博士质量之间存在正相关关系。
但它们之间的关系并不总是正向的。例如,一般认为,博士点的质量越高(也就是教师的研究生产力越高),博士生教育的质量也越高。但实证研究表明两者并不总是存在正相关。华盛顿大学研究生教育创新与研究中心(CIRGE)最新的一项针对社会科学博士点的研究表明,博士点的声誉与学生对论文写作训练的满意度之间也没有必然联系。[20]
二、博士培养质量评价的层次与方法
在本节中,我们主要讨论博士培养质量的评价方法问题。广义来讲,博士培养质量应当涵盖德智体美这四个方面。不过,考虑到博士生教育的特性,“中国博士质量分析”课题组在评价博士培养质量时,坚持“以学术为基准、兼顾其他”的原则,以评价博士的学术质量为主。
博士培养质量的评价可以分为微观和宏观两个层次。微观层次的评价是针对某一个博士或某个小群体博士的评价,宏观层次的评价则针对一个较大的博士群体,例如这次“中国博士质量分析”课题组所做的博士质量分析涵盖了全国所有博士培养单位,就属于典型的宏观层次的评价。
无论从评价要素还是从评价方法来看,微观层次的博士质量评价和宏观层次的博士质量评价都具有显著的差异,例如,意见调查法、文献计量法、比较法一般并不用于个体层面的博士培养质量评价。(见表1-4)
表1-4 评价博士培养质量的层次与方法
微观层次的博士培养质量评估是博士培养单位的一项经常性的教育活动,一般采取同行评议的形式,通常包括课程论文评分、综合考试、论文评阅、论文答辩(或称论文考试)、学习档案(Portfolios)[21]等等,可以说,博士培养质量的评估贯穿着博士生教育的始终。在这些评估方式当中,论文评阅和论文答辩(在英国又称为论文口试)最为重要,因而相关研究也较多。[22]
论文评阅和论文答辩是评估博士培养质量最为常见的手段,但在具体的操作方面,则存在显著的国别差异和院校差异。例如,和美国、法国、中国、比利时等国家不同,英国的论文口试是不公开的,未经允许,不可旁听。英国有些大学在举行论文口试时,甚至只允许答辩考官和博士生本人在场,即便是学生本人的导师,也不允许列席。再以英国为例,有些学校要求论文评阅人在论文答辩之前提交独立的评阅报告,有些学校则不做这种要求,只要求几位评阅人在论文口试后提交一份联合的评阅报告。[23]
除了评价方式的多样性之外,博士培养质量的评价还呈现出不确定性和主观性的特点。在20世纪,高等教育变得越来越理性化和现代化,吊诡的是,博士生训练仍然保留着前现代的特点。直到20世纪90年代,博士生训练仍然是一个相对自治的教育实践领域,保留了自身的游离、超然以及贵族般的面孔。[24]在英国,毕业口试或毕业答辩(Ph. D. Viva)仍然笼罩着神秘的色彩,甚至被称为“英国高等教育中最不为人所知的一个秘密”。[25]博士培养质量评价的主观性、不确定性主要表现在以下三个方面:
首先,博士学位授予最重要的质量标准是“通过博士论文做出原创性的学术贡献”,然而,何谓“原创性的学术贡献”,这一点在学术界常常很难达成共识。有学者发现,人文社会科学对“原创性”的定义和自然科学的定义存在很多差异。[26]在极端的情况下,优秀之作也会被误判为平庸,从而成为沧海遗珠。美国学者弗兰克·布尔然(Frank Bourgin)的遭遇生动地说明了这一问题。布尔然在上世纪40年代所写的论文中指出,美国的开国元勋们立国的本意并非执行亚当·斯密的经济路线,而是主张参与经济活动,服务公众。这一论点在当时被视为怪谈,因此不被接受。在时隔四十多年后的1988年,布尔然的观点逐渐为学界所接受,并且产生了相当大的学术影响,芝加哥大学重新审核了布尔然的博士论文,最终授予他博士学位。从攻读博士学位到获得博士学位,布尔然几乎花了整整50年,可谓历尽艰辛。[27]
其次,作为博士培养质量评价中最为重要的一种手段,论文评阅的过程往往掺杂着人情、学术竞争、意识形态等多种因素,有时难以实现完全的客观和公正。出于机密的考虑,论文评阅报告是不能对外公开的,即便博士候选人受到了不公正的评价,也难以申诉。
最后,博士研究的成果是高度专门化的,因此,只有学术共同体,尤其是所在研究方向的小学科共同体才具备评价博士论文的资格和能力。
由此可见,博士培养质量的评价(尤其是论文评价)往往呈现出不确定性、非理性的特点,难以被程序化和标准化。也正因如此,博士培养质量的评价通常是学科化、个体化的微观行为,很难上升到宏观的层次。
我们发现,欧美国家并没有进行过全国性的博士培养质量的调查和评价。“中国博士质量分析”课题组这次所做的全国性的博士培养质量的评价,涵盖了港澳台之外全国所有的博士培养单位,这在世界上尚属首次。这对课题组提出了理论上和方法上的双重挑战。微观层次的博士培养质量评价尚且带有如此多的不确定性和主观性,宏观层次的博士质量评价的难度,就可想而知了。为了客观评价我国的博士培养质量,我们主要采用了意见调查、论文比较法和文献计量法这三种方法。
在博士点质量评估中,意见调查(Opinion Survey)是一种被广为采用的方法。在评估博士培养质量时,课题组同样采取了这种方法。我们通过大样本的问卷,调查了博士生导师、研究生教育负责人、博士生对博士培养质量各项指标的评价,从宏观的层面对我国的博士培养质量进行了评价。
博士论文质量是博士培养质量的核心反映,而质量的高低总是通过比较得出的,因此,在评价我国博士的博士论文质量时,我们采用了比较的方法,由各培养单位聘请相关的学科专家,分别从纵向和横向的维度,对我国博士论文的质量进行了历时分析和国际比较分析,在此基础上,课题组再做出综合性的判断。
不管是意见调查,还是对博士论文质量的同行评价,都不可避免地带有一定的主观性。为了使调查结果更加客观可靠,课题组使用文献计量法,选择性地统计了我国博士生在国内外学术期刊上发表文章的情况,对我国博士生的学术贡献进行了分析。当然,文献计量法也具有很大的局限性:
首先,文献计量法一般适用于自然科学和生命科学领域(因为这两大领域的最优秀的研究成果均发表在国际期刊上),在人文学科和社会科学领域,其适用性要大打折扣(心理学、语言学等接近自然科学范式的学科除外),原因如下:1.和自然科学领域相比,社会科学论文的被引次数要少得多,而且学科之间存在显著差异;2.社会科学领域的学术影响力往往不能在很短的时间内显现出来,并且,和自然科学的研究不同,社会科学的很多研究并不存在“过时”的问题,很多研究在很长时间后仍然具有巨大的学术影响力,因此,如何确定计算被引次数的时间点,这是一个大难题;3.在社会科学领域,很多有影响力的期刊并没有被收录在SSCI目录内,很多社会科学领域的研究更多地是以著作而非论文的方式出版。
其次,在文献计量法中,被引用率常常被视为衡量学术质量的重要标准。不过,这一方法同样具有局限性。正如汤尼·比彻所指出的那样,学科之间存在“都市学科”(研究人员/研究问题比率高的学科)与“乡村学科”(研究人员/研究问题比率低的学科)的区别,都市学科(如高能物理学、生物医学)所吸引的学者数量庞大,而且研究课题相对集中,被引用率自然水涨船高;而在乡村学科(如历史研究、考古学研究)中,研究者的规模较小,而且往往分布在不同的研究领域中,被引用率自然较低,但这并不代表这些研究的质量也低。即便是在同一个学科内部,不同的研究方向之间也会存在热门和冷门的差别。因此,文献计量法的局限性是显而易见的。所以,尽管文献计量法可以克服质量评价的主观性和随意性,但在使用时,应该注意到学科的差别以及方法本身的局限性。也正因如此,著名的文献计量学专家安东尼·拉昌(Anthony FJ van Raan)才指出,在评价研究质量时,还是应当以同行评价为主,文献计量法只是辅助手段。[28]
三、博士培养质量评价的四种视角
博士培养质量评价通常是一种学科化、个体化的微观行为,往往呈现出不确定性、多样化的特点,主观性和多样性是其最明显的特征。从不同的角度出发,人们对博士培养质量的评价标准,即所持的质量观,主要可以归纳为学术成果导向的质量观、学术训练导向的质量观、职业导向的质量观和效益导向的质量观。应该说,要完整、客观地对博士培养质量做出评价不是容易的事情,所有这些对博士培养质量的评价标准,都不可避免地带有一定的局限性。
(一)学术成果导向(产品视角)的质量观
学术成果导向的质量观也可称为产品视角的质量观,这种质量观认为,博士生教育的根本任务在于塑造学者,评价博士质量的最重要的标准是博士在读期间所做的学术成果的质量,如学位论文的质量、所发表的科研论文的质量、课程作业的质量等等。其中,博士学位论文的质量被视为最重要的衡量指标。这种质量观认为,博士学位论文是衡量博士培养质量的最为准确、全面的尺度,博士生有没有广博而扎实的基础知识,对本专业和相关学科发展的历史和现状有没有全面而透彻的理解,有没有站在学科前沿高瞻远瞩地提出和解决原创性问题,从而把科学和学术向前推进一步的创新能力,有没有在博士生阶段结束后继续从事创造性科学研究的后劲,都可以从博士论文的质量中得到体现。从18世纪末研究型博士兴起以来,学术成果导向的质量观一直占据支配性的地位,博士论文几乎成为评价博士质量的唯一标准。然而,随着知识生产方式的转型、博士生教育规模的扩大以及博士生教育实践的多样化,也不断有学者开始对这种过于单一的质量观进行反思。有学者指出,现在应该针对博士的评价问题展开争论,博士论文不是评判博士质量的唯一标准。[29]在丹麦,对博士质量的评价已经不再仅限于博士论文,教学技能、团体合作能力等也被视为评价博士质量的指标。[30]
(二)学术训练导向(过程视角)的质量观
学术训练导向的质量观也可称为过程视角的质量观,这种质量观认为,博士生教育更多的是一种学术训练,研究技能的培养是博士阶段的中心任务。博士生教育作为一个学术训练的过程,不仅包括论文写作,还包括研究方法的培训、学术交流能力的培养,甚至包括师生之间、同行之间人际交往方面的训练。经过训练,博士研究生能够掌握与同行进行有效沟通和获取信息的能力,及时了解学科前沿,从而迅速聚焦,找准方向,做出创新性的成果。因此,仅仅注重结果(博士论文)是不够的,博士生更应该在博士生教育期间获得一些技能、素质和方法,这些技能不仅是未来的学者所必备的,而且是可迁移的——即便博士生在毕业后不从事学术职业,这些技能也能在工作中发挥作用。
(三)职业导向的质量观
职业导向的质量观认为,博士生教育的一个连续性目标应当是帮助博士生做好多种职业准备,博士生作为一种特殊的“产品”,应当符合、满足用人单位的需求和目标,博士生的“可就业能力”和“职业胜任力”是衡量博士质量的重要标准。美国《重塑科学家与工程师的研究生教育》报告指出:“研究生教育过程对主要从事学术研究工作的学生做好就业准备是极其有效的。为了保持我们国家强大的科技事业,必须保持这个优点。但是,研究生教育也必须为那些将主要从事非研究工作的学生的需要提供服务。最近获得Ph. D.的一半以上的研究生——在一些领域,例如化学和工程远远超过半数——在非学术部门找到了工作。这种工作在过去的20年中稳步上升。”因此,为了培养更有才华的科学家与工程师,研究生培养计划应该给学生提供获得更广泛的各种技能的机会。在职业技能上提供学术和非学术部门雇主所需求的技能,特别是向非专业人士表达复杂思想的能力和出色的团队工作能力。[31]但同时,该报告也指出:“我们不信奉职业教育论。我们的理想不是把每个学生引入具体的就业途径,并进行相应的培训,那样做所产生的问题之一是,将会把学生束缚在职业上,而当他们还在研究生院学习时,职业是可能变动的或者职业的数量是会减少的。……因此,我们的目标是研究生具有广泛的经验以保持职业选择的自由,并具有在工作过程中随时转换职业的能力。”[32]但是,强调博士毕业生对就业市场的适应性,并将其作为评价博士培养质量的一个重要指标的同时,也需要注意,市场需求与教育质量本身并非总是保持一致,有些素质、能力等虽然符合市场需求,但其未必是通过博士生教育获得的,而有些素质、能力未能满足市场的需求,也不应该完全归咎于博士生教育。
(四)效益导向的质量观
效益导向的质量观侧重博士生教育的整体质量,注重博士生教育的效率和效益,要求高校向投资者负责任、证明投资者的投入物有所值,或要求高校在不增加投入的前提下维持或提高质量。这是一种以经济价值为基础的质量定义。该质量观的核心是问责制,认为学校所提供的教育必须为投资者(政府、社会团体、个人等)负责。效益导向的质量观的学术标准是以同样(或更少)的资源投入,获取更多(或同样)的学术产出,其能力标准是用同样的资源投入,确保产出更多的能够满足劳动力市场需求的毕业生,同时致力于提高学生获取职业发展的能力。效益导向的质量观的倡导者一般是教育的投资者,在通常的情况下是政府。为了测度教育的效益,政府部门和评估专家发展出了一系列绩效指标,这些指标主要包括博士生毕业率、就业率、完成学业的年限、生均培养成本等等。效益视角质量观和问责制在本科教育质量评估中最为常见,也逐渐适用于博士研究生教育质量评估。尤其是在美国、英国、德国、澳大利亚和加拿大等国家,博士生的平均流失率高达30% 50%,而且修业年限过长,博士生教育的效益问题一直备受关注。近年来,在英美等国的博士生教育质量评估中,博士生的毕业率、修业年限等已成为重要的考察因素。[33]
三、从产品视角到过程视角:博士培养质量评价的新趋势
博士质量的评估不仅仅涉及技术性的方法问题,而且关涉到如何定义“博士生教育”的问题。传统上,博士生教育一直被视为“知识创新”的过程,因此,在评价博士培养质量时,首要的标准是博士论文的质量。近年来,这种只强调产品(博士论文)、相对忽视过程(科研训练)的观点已经逐渐受到挑战。
通过专家咨询法,“中国博士质量分析”课题组筛选出基础和专业知识水平、相关学科知识水平、外语水平、创新能力、组织协调能力、使命感责任感、思想道德水平、科研能力、学位论文质量这9个指标来测度博士培养质量。随后,我们对20666名博士生和9928名博士生导师、2633名研究生教育负责人和31251名毕业博士进行了问卷调查。问卷调查结果表明,在选择评价博士培养质量最重要的指标时,各个群体一致认为创新能力和科研能力比学位论文质量更为重要。而且,只有25%的博士生和29.9%的毕业博士认为学位论文质量是评价博士培养质量的最重要指标。这一事实表明,只强调产品而忽略过程的博士培养质量观已经在逐渐发生改变。
表1-5 不同群体针对博士培养质量评价指标选择的比例(%)
这种态度的转变同样发生在西方国家。美国学者保罗·艾萨克(Paul Isaac)研究了博士生导师对于博士论文的功能与性质的看法。该项研究共向1400名教师发放了问卷,最终回收问卷596份,回收率为42.5%。问卷涉及的问题包括博士论文的目的、论文口试的作用、是否有替代博士论文的备选形式、博士论文的特征等等。研究发现,在“博士论文的目的”这一问题中,选择比例最高的两个选项是“表明研究的技能”(33%)和“对研究技能的训练”(23%),而选择“对知识的贡献”这一选项的比例仅为7%。[34]这表明,越来越多的人将博士论文视为“学术训练的过程”,而非“作为知识贡献的产品”。
这种改变反映了人们对博士生教育的本质理解的变化。从世界范围来看,这一变化至少可以追溯至上世纪80年代,在当时,人们对“何谓博士生教育”这一问题的看法已经产生了分歧。第一种观点认为,博士生教育应该强调知识的贡献,而且这一贡献应当由学术同行来进行评价;另一种观点则认为,博士生教育主要是对学科取向的研究方法和科研能力的训练。[35]如上所述,第一种观点,我们称为产品视角的质量观,第二种观点,我们称为过程视角的质量观。
在对我国研究生教育负责人、博士生导师的访谈中,不少人都流露出了第二种观点,即过程视角的质量观。[36]早在1988年英国大学副校长、校长委员会(The Committee of Vice-Chancellors and Principals,简称CVCP)所发布的《英国博士指南》中,我们就已经发现了将这两种相互冲突的质量观结合起来的尝试,该指南指出,哲学博士不仅仅是“产品”(对知识的原创性贡献),而且应当是“过程”(对研究者的训练)。[37]
这两种质量观的差异在此后的十多年中激发了广泛的讨论。英国学者科林森指出,在英国,博士已经被重新概念化为“对未来研究者的训练”,而非“一篇增进人类知识的著作”。[38]克里斯·帕克指出了博士质量评估中需要关注的五个问题,其中首要的问题就是,在博士考试时,最重要的关注点应当是产品(论文)还是过程(研究者的培养),以及如何平衡两者。他进一步指出,博士生教育到底是“增进知识”还是“训练学者的过程”,这不仅事关博士质量的评价,而且关系到如何开展博士生教育的问题。如果是前者,那么,博士生应当获得最大的独立自主权,将大部分的时间用于从事独立的研究;如果是后者,那么,博士生应当将主要的时间用于接受学术训练,相应地,应当增加博士生课程的数量。[39]
不同的质量观反映了不同的博士目标定位。在产品视角的质量观中,博士学位是以知识为基础的(knowledge-based Ph. D.),博士生教育意味着扩展知识;而在过程视角的质量观中,博士学位是以训练为基础的(Training-based Ph. D.),博士生教育等同于学术训练的过程。[40]
产品视角的质量观认为,博士的质量取决于其学术贡献。这种质量观对质量的定义是“以产品为基础的定义”,认为可以通过对博士生在博士生教育过程中所生产的产品,对其进行质量评估。评估时所涉及的因素主要包括学术原创性(提出新的问题、发展出新的学术研究方法、为已有的问题提供新的视角、将已有的方法或理论应用于新的数据或材料等等)、学术影响力、学术声誉、学术生产力等等。
产品视角质量观的主要倡导者是大学中的学者。研究表明,大学教师对于高等教育质量的看法是“学科中心的”。[41]在评价博士质量时,他们也会以是否推动本学科的发展作为最重要的标准。他们一般认为,最能反映博士质量的是博士论文的水平,而最能准确地评价博士论文质量的是学术同行。
在进行博士质量评价时,产品视角的质量观是有局限性的。例如,有些时候我们很难在短时间内评估某项研究的“原创性”或“贡献”,有些研究的原创性或贡献也许会在相当长的时间之后才会显现出来。安东尼·拉昌发现,有些研究在很长时间内都无人问津,但沉寂多年之后,这些研究会成为广为引用的权威文献,有人甚至借此获得诺贝尔奖,这种情形,拉昌形象地称之为“科学界的睡美人”现象。[42]
产品视角的质量观将博士生教育视为一种“产品”,而过程视角的质量观则将博士生教育视为一种“过程”。根据过程视角的观点,博士生教育更多的是一种学术训练,而非创新学术的过程。这种观点认为,仅仅注重结果(博士论文)是不够的,博士生更应该在博士生教育期间获得一些技能、素质和方法,这些技能不仅是未来的学者所必备的,而且是可迁移的——因此,即便博士生在毕业后不从事学术职业,这些技能也能在工作中发挥作用。例如,新英格兰大学(The University of New England)指出:“博士候选人的首要宗旨是研究方法的高深训练。”[43]
为确保博士生在教育过程中获得必要的学术训练和技能,过程视角的质量观侧重对博士生教育的各个环节(入学考试、招生、中期考试、预答辩、论文评审、答辩)和培养过程中的相关因素(师生关系、经费资助、科研训练)进行质量评估,其目的在于确保博士培养过程中各个环节和相关因素的“一致性”和“零缺陷”。
产品质量观与过程质量观的差异还表现在对博士论文的期待上。与过程质量观相比,产品质量观更为注重博士论文的质量,对博士论文的期待也更高。不过,随着博士生教育规模的扩张,人们不可能指望每一篇博士论文都是绝世佳作。有学者已经指出,我们不应该把博士论文当做诺贝尔奖来评选。德国学者芭芭拉·科姆也指出,在很多欧洲国家,对博士论文的定义正在从“大师之作”(Masterpiece)向“学徒习作”(apprenticeship piece)转变。[44]
我们的研究发现,不同的博士生教育利益群体都在这两种质量观之间摇摆,而且,博士生比博士生导师更倾向于过程视角的质量观。我们的问卷调查表明,有51%的博士生导师认为“博士学位论文”是反映博士培养质量最重要的指标,相比之下,只有25%的博士生认为博士论文是反映博士培养质量最重要的指标。
在某种意义上,产品视角的质量观和过程视角的质量观之间的差异和冲突,反映的是两种不同的博士生教育模式之间的冲突。在两百多年的发展历程中,研究型博士的培养形成了两种截然不同的传统或模式,一种为“欧洲模式”或“德国模式”,一种为“美国模式”。在“欧洲模式”中,博士生是博士生导师的“学徒”,他们通过跟随导师来获得必要的学术训练、习得学科的文化、建立学术界的人脉关系,没有正式的课程,更遑论系统的培养计划。在“美国模式”中,博士生一般到比较晚的时候才选定导师,而在成为正式的博士候选人之前,他们必须经过为期两年的系统化、结构化的课程学习。而且课程学习本身伴随着课程评分等质量评估的程序,通过课程,博士培养单位可以随时对博士生的质量进行评价和监控。[45]在传统的欧洲模式中,博士培养质量的评价侧重的是产品视角,而美国模式则体现了产品视角与过程视角的结合。
在最近二十年的博士生教育改革中,仅仅关注产品视角的传统欧洲模式不得不让位于将产品视角与过程视角结合起来的美国模式,最为典型的例子是英国和德国。传统上,英国人认为博士候选人只要能够在毕业时提交一篇高水平的博士论文,就是优秀的表现,至于博士生是否需要通过课程来完成科研训练,则被认为无足轻重。然而,最近二十年来,在英国经济和社会研究理事会(ESRC)的政策推力下,很多学校不得不在博士生教育阶段开始定性研究、定量研究等社会科学研究方法的课程。即便如此,仍然有很多博士生导师及其博士生对这种趋势进行抵制。在他们看来,博士论文研究完全是自主探究的过程,博士生会在研究的过程中掌握与研究主题相匹配的方法,指定性的研究方法课程反而会不利于创新性的博士论文研究。[46]
尽管遇到一些保守势力的抵制,博士生教育越来越等同于研究训练在英国已经是大势所趋,很多大学都成立了技能发展与研究训练项目(skill development and research training programs)。传统上,英国的大学也提供一定的研究训练,但这些训练都是与本学科的学术研究密切相关的。与此不同,技能发展与研究训练项目侧重的是不仅适用于学术界,而且也适用于企业、政府等工作环境的通用技能。在德国,人们也在呼吁超越传统的学徒制模式,代之以更为正式化、结构化的科研训练,并且建立相应的制度环境,如研究生院、跨学科研究所等。
产品视角与过程视角的差异不仅与培养模式的差异有关,而且与学科之间的差异有关。在博士质量的评价当中,应该侧重成果视角还是过程视角,不同学科存在不同的看法。英国的一份研究指出,在经济学、商科和社会学这三个学科中,经济学和商科的教师倾向于学术训练本位的质量观,前者越来越依赖于精深的统计技术,后者则需要通过大量的学术课程来建立学科认同。社会学对统计技术的依赖则要弱一些,而且学科同质性较强,因此他们更强调通过产品来评价博士质量。[47]
四、小结
产品视角的博士培养质量评价强调博士论文的作用,这与博士生教育的本质要求是一致的。不过,在科研创新难度增大、博士生规模扩大、博士学位类型多样化的背景下,知识创新难上加难。博士生教育规模扩大的一个直接后果是研究产出的剧增。例如,以人文学科为例,从18世纪末以来,关于莎士比亚的《哈姆雷特》,已经出版了25000本(篇)以上的书籍、散文、论文和其他评论。每年,欧洲和美国的大学都会完成超过30000篇关于现代文学的博士论文。[48]学术创新,实属不易!事实上,在评估博士培养质量时,博士培养单位不得不降低对学术创新的要求,或者更改学术创新的定义。因此,博士生教育应当被重新概念化为“对未来研究者的训练”,而非仅仅“一篇增进人类知识的著作”,这要求我们在博士生培养过程当中更加重视课程设置和研究方法方面的培养,加强博士生从事跨学科研究的能力,并提高综合考试在博士质量控制中的作用,这是过程视角质量观给予我们的启示。
德国、英国近年来的博士生教育改革的一个核心问题就是超越传统的学徒制模式,增加正式化的研究训练课程的数量。这表明,传统的博士生教育的“欧洲模式”已经在做出调适,21世纪的博士生教育和博士质量评价必须吸取“美国模式”的优点,在重视“产品”和“结果”的同时,更为关注“过程”。
(沈文钦、陈洪捷)
[1] Clark, W.(2006). Academic charisma and the origins of the research university. Chicago:University of Chicago Press,192-194.
[2] Simpson, R.(1983). How the Ph. D. came to Britain:A century of struggle for postgraduate education. Guildford:Society for Research into Higher Education,135.
[3] Hoffer, T.(2004). Doctorate Recipients from United States Universities:Summary report 2004, Chicago:National Opinion Research Centre.
[4] Ives, G.(2002). The Ph. D. Supervisory Relationship and Process. Monash University, unpublished dissertation.
[5] Burgess, R. G.(1994)Postgraduate Education and Training in the Social Sciences:processes and products. London:Jessica Kingsley.
[6] Delamont, S. , Atkinson, P. , & Perry, O.(2000). The Doctoral Experience:Success and failure in graduate school. London:Falmer Press.
[7] Cartter, A. M.(1976). Ph. D. 's and the Academic Labor Market:a report prepared for the Carnegie Commission on Higher Education. New York:McGraw-Hill.
[8] Bowen, W. , &Rudenstine, N.(1992). In Pursuit of the Ph. D. . Princeton, N. J. :Princeton University Press.
[9] Ostriker, J. , &Kuh, CV(Eds.).(2003). Assessing Research-doctorate Programs:A methodology study. Washington, DC:National Academies Press,9.
[10] 陈学飞等.西方怎样培养博士.北京:教育科学出版社,2002.
[11] Doctoral Program也可译为“博士学科点”。在美国的语境中,有时program相当于“系”(department),有时候program则是跨系的,在另外一些情况中,一个系(department)可以包括几个program。
[12] Ostriker, J. , & Kuh, CV(Eds.).(2003). Assessing Research-doctorate programs:A methodology study. Washington, D. C. :National Academies Press,9.
[13] Cartter, A. M.(1966). An Assessment of Quality in Graduate Education. Washington, D. C. :American Council on Education; Lindzey, Gardner(1982). An Assessment of Research-doctorate programs in the United States. Washington, D. C. :National Academy Press; Goldberger, M. , Maher, B. A. , & Flattau, P. E.(Eds.).(1995). Research-doctorate Programs in the United States:Continuity and change. Washington, DC:National Academy Press.
[14] Maki, P. L. , & Borkowski. N. A.(2006). An Assessment of Doctoral Education:Emerging Criteria and New Models for Improving Outcomes. Sterling, VA, Stylus:XI.
[15] Quality Assurance Agency for Higher Education(QAAHE).(2004). Code of Practice for the Assurance of Academic Quality and Standards in Higher Education, Sectional-Postgraduate research programmes, UK, September:1-39.
[16] 该项研究对来自61所研究型大学6大学科(生物化学、计算机科学、电子工程、英语、数学、政治科学)里的6000多名博士学位获得者进行了调查研究,这些博士学位获得者获得学位的时间均在10 14年之间。
[17] Kulej, M. , & Park, C.(2008). Postgraduate Research Experience Survey 2008 Final report. The Higher Education Academy.
[18] Hogan, T. D.(1981). Faculty Research Activity and the Quality of Graduate Training. The Journal of Human Resources,16(3):400-415.
[19] Hogan, T. D.(1973). Rankings of Ph. D. Programs in Economics and the Relative Publishing Performance of Their Ph. D. 's:The Experience of the 1960s. Western Economic Journal,11:429-450.
[20] Zumeta, W.(2008). What Matters for Excellence in Ph. D. Programs. Working Paper, # 2008-04.
[21] 学习档案是博士质量评估中比较新兴的一种方法,这种方法通过收集博士生在整个学习过程中的相关资料(如论文、研究设计等等)来评估博士生的学习质量。
[22] Jackson, C. , & Tinkler, P.(2001). Back to Basics:a consideration of the purposes of the Ph. D. Viva. Assessment and Evaluation in Higher Education,26(4):351-62; Denicolo, P.(2003). Assessing the Ph. D. :A constructive view of criteria. Quality Assurance in Education,11(2):84.
[23] Tinkler, P. , & Jackson, C.(2000). Examining the Doctorate:institutional policy and the Ph. D. examination process in Britain. Studies in Higher Education,25(2):167-180.
[24] Kendall, G.(2002). The Crisis in Doctoral Education:a sociological diagnosis. Higher Education Research & Development,21(2):131-141.
[25] Morley, L. , Leonard, D. , &David, M.(2002). Variations in Vivas:Quality and equality in British Ph. D. assessments. Studies in Higher Education,27(3):263-273.
[26] Guetzkow, J. & Lamont, M.(2004). What is Originality in the Humanities and the Social Sciences? American Sociological Review,69(2):190-212.
[27] Cude, W.(2001). The Ph. D. Trap Revisited. Torowto:Dundurn Press Ltd. ,13.
[28] Van Raan, A. F. J.(2003). The Use of Bibliometric Analysis in Research Performance Assessment and Monitoring of Interdisciplinary Scientific Developments. Technikfolgenabschätzung, Theorie und Praxis,12(1):20-29.
[29] Monaghan, P.(1989). Some Fields are Reassessing the Value of the Traditional Doctoral Dissertation. The Chronicle of Higher Education,35(29):A1.
[30] Sörlin, S. , etc.(2006). A Public Good:Ph. D. education in Denmark. Ministry of Science, Technology and Innovation.
[31] 美国科学、工程与公共政策委员会、国家科学院、国家工程院、医学研究院.重塑科学家和工程师的研究生教育.徐远超,刘惠琴等译.北京:科学技术文献出版社,1999:11,124.
[32] 美国科学、工程与公共政策委员会、国家科学院、国家工程院、医学研究院.重塑科学家和工程师的研究生教育.徐远超,刘惠琴等译.北京:科学技术文献出版社,1999:11,124.
[33] Brooks, R. , & Heiland, D.(2007). Assessment and Doctoral Education:Recommendations for moving forward. European Journal of Education,42(3):351-362; Bowen, W. G. , &Rudenstine, N.(1992). In pursuit of the Ph. D. . Princeton, N. J. :Princeton University Press.
[34] Isaac, P. D. , Quinlan, S. V. , &Walker, M. M.(1992). Faculty Perceptions of the Doctoral Dissertation. Journal of Higher Education,63:241-268.
[35] Holdaway, E.(1997). Quality Issues in Postgraduate Education. in Burgess, R. G. Beyond the first degree:graduate education, lifelong learning, and careers. Open University Press:60-79.
[36] 北京大学教育学院.“中国博士质量分析”课题调研资料,2008.
[37] OECD.(1995). Research Training:Present and Future. Organization for Economic Cooperation & Devel,141.
[38] Collinson, J. A.(1998). Professionally Trained Researchers? Expectations of competence in social science doctoral research training. Higher Education Review,31(1):59-67.
[39] Park, C.(2007). Redefining the Doctorate. Discussion Paper. Higher Education Academy, York, UK.
[40] Hockey, J.(1995). Change and the Social Science Ph. D. :supervisors' responses. Oxford Review of Education,21(2):195-206.
[41] Holdaway, E.(1997). Quality Issues in Postgraduate Education. In Burgess, R. G. Beyond the first degree:graduate education, lifelong learning, and careers. Open University Press,60-79.
[42] Van Raan, A. F. J.(2004). Sleeping Beauties in science. Scientometrics,3:467-472.
[43] Park, C.(2007). Redefining the Doctorate. Discussion Paper. Higher Education Academy, York, UK.
[44] Kehm, B. M. Developing Doctoral Degrees and Qualifications in Europe. Good Practice and Issues of Concern. In Sadlak, Jan(Ed.).(2004). Doctoral Studies and Qualifications in Europe and the United States:Status and Prospects. Bucarest:UNESCO-CEPES Studies on Higher Education.
[45] Mazza, C.(2008). European Universities in Transition:issues, models and cases. Cheltenham, Glos. , UK; Northampton, Mass. :Edward Elgar Pub. ,53-55.
[46] Deem, R. , &Brehony, K. J.(2000). Doctoral Students'Access to Research Cultures-are some more unequal than others? Studies in Higher Education,25(2):149-166.
[47] Hockey, J.(1995). Change and the Social Science Ph. D. :supervisors' responses. Oxford Review of Education,21(2):195-206.
[48] Gibbons, M. , etc.(1994). The New Production of Knowledge-the Dynamics of Science and Research in Contemporary Societies. London:SAGE Publications.