第三节 面向未来的大学管理研究
我在《细读美国大学》[13]一书中曾引用伯恩鲍姆(Robert Birn-baum)教授关于七个管理时尚的叙述[14],对大学管理中的盲目“追星”现象作过嘲讽。最近为了撰写本章我上网一搜,发现“Analy-tics”已经成为当今新的管理时尚:很多美国大学将其院校研究办公室更名为“Office of Institutional Research and Analytics”“Institutional Effectiveness and Analytics”“University Analytics&Institutional Re-search”,等等。有趣的是,将时间倒推20年,院校研究办公室的名字上顶多加一个“Analysis”,现在变成“Analytics”,换了汤,是否也换了药呢?当然,我们有足够的理由为新的管理时尚辩护,正如莎士比亚在《罗密欧与朱丽叶》第二幕中所言:“名字有什么关系呢?玫瑰不叫玫瑰,依然芳香如故。”[15]同理,院校研究、管理研究或分析论,不管用哪一个名词来指称我们所做的这一堆事情,只要目的是辅助决策,都无可厚非。
然而,从上节关于分析论的描述和定义看,传统的统计分析(a-nalysis)与当今流行的分析论(analytics)之间最大的区别似乎在于数据的体量与品质。华生和纳尔逊以三个“V”来描述大数据的特征,即数据的数量与规模(volume)、数据处理的速度(velocity)和数据种类的多样性(variety)。[16]因此,可以毫不夸张地说,今后研究者对数据的收集、储存、分析以达致决策的能力将决定管理研究这个行业未来的走向,也是他们工具箱里不可或缺的利器。
记得在20年前,假如你想进入任何与数据分析相关的行业,是否会使用结构化查询语言(Structured Query Language,简称SQL)是一道最重要的门槛。事实上,SQL这个编程语言的名称极具象征意义,因为这种语言的使用对象只能是结构化数据(structured data),即严格遵循数据结构来组织、存储和管理数据的仓库,而数据结构的有序性则是统计分析得以进行的基本前提。然而,随着大数据在各个领域的出现和急剧增长,研究人员必须面对越来越多的非结构化数据(unstructured data),而后者完全没有事先设定的数据结构或组织。比如说,网站的搜索词、点击量、监控电视(CCTV)的记录、学生通过网站向教授提出的问题,等等,都是可遇而不可求的非结构化数据。
数据的变化直接影响到以数据为业的人。在传统的数据环境下,研究者对于取得数据全本根本不抱幻想,因此设计样本并进行抽样调查成为一项极为专业的工作,管理研究人员在此具有绝对的权威。但是,大数据分析以全本数据为素材,一步跳过了传统的统计分析程序,从而大大提升了演算法或计算程序(algorithm)编写人员在管理研究中的地位与重要性。
也许,嗅觉敏锐的院校研究人员已经隐约感到大数据对于他们行业的威胁,因而试图通过改名来显示其与时俱进的愿望和能力。有的院校研究部门开始运用分析论的技巧来开发个性化的学术咨询系统,有人借用预测分析的方法来估计学生在课程或专业上的进展程度,也有学校运用预测分析来帮助学校进行招生方面的管理。[17]总的感觉是,美国大学里教师通过学习分析论(learning ana-lytics)来观察学生学业进展的较多也较成功,但院校研究在运用分析论进行管理研究方面的建树却至今乏善可陈。调查显示,美国大学中不到一半的院校运用大数据和分析论来帮助管理或决策。[18]究其原因,可以归结到数据的结构问题、学生的隐私问题、决策的透明度问题等,加上管理方面大数据的极度缺乏。[19]
其实,冷静地观察未来大学管理研究的趋向,我们不难看出,真正需要感到恐慌的并不是管理研究或院校研究人员,而是他们的老板。对于研究者来说,学习新的研究方法或掌握新的研究工具只是时间问题,但对于他们的老板,即大学的校长、院长们来说,这是一个战略问题、思维方式问题。换言之,在日常管理和决策时,用不用大数据可以因“事”而异,但用不用数据,即在决策时能否做到有理有据才是问题的关键所在。这不是一个新问题,院校研究人员在过去几十年中对此已经纠结很久。只是在今天,以研究辅助管理与决策已经随着大数据时代的来临变得迫在眉睫。
面向未来的大学管理研究,由于数据的作用日益凸显,而且数据搜集的方式也已发生变化,因此我们运用数据的态度也需要作出相应的调整。过去我们的研究往往从传统的本体论出发,先清晰界定研究对象,然后设计样本来搜集数据,而数据的来源则必须与研究宗旨相匹配。在大数据环境下,研究者仍然需要设定研究的宗旨或方向,但他们更多是利用现有的、由他人搜集的数据进行挖掘,找到符合自己研究方向的数据并加以分析。传统的研究方法论对于数据的认识论基础比较较真:定量数据(quantitative data)的应用一般遵循实证主义(positivism)的认识论传统,而定性数据或质的数据(qualitative data)则遵循解释主义(interpretivism)的认识论传统。这种认识论的观点直接影响到研究者对数据的处理方法。以后者为例,我们过去在进行质的研究时搜集很多访谈资料和观察记录,但囿于传统的方法论,我们常常不将这些非定量性质的信息当成数据,至少从来没有把它们当成数据加以处理。今天,戴上大数据的有色眼镜来看身边的各种信息,我们突然发现,原来数据并不一定是以数字的形式现身,它可以是图片、影像或文字,而我们在传统的研究方法论中所强调的数据三角验证(data triangulation),其实就是大数据特性其中的一个V——数据种类的多样性(varie-ty)。由此可见,数据作为研究者进行分析的对象没有变,变的是数据的来源、体量、类型和速度。大数据并非太阳底下的新东西,新的是大数据思维。
所谓大数据思维,正如有学者所指出的,就是“一切皆用数据来观察,一切都用数据来刻画,人们以数据的眼光来观察、思考、解释这个纷繁复杂的世界”[20]。因此,大数据思维不是排除传统的统计分析或质的研究,而是要求我们换一个视角来审视各种数据。大数据不能决定我们用什么方法进行分析,大数据思维则能。在选择合适的分析方法时,传统的统计方法、新兴的分析论方法或是其他的定量或定性的研究方法,都是研究者手中对各种数据进行挖掘与解读的工具。
然而,大数据及其分析论之所以在教育研究中至今未能得到广泛应用,研究人员有他们的无奈。迈耶勋伯格和库克耶在他们的书中为我们讲了一个美国快递公司UPS的成功故事。为了提高递送效率并降低成本,UPS在公司的送货车辆上装了感应器及各种无线定位装置来追踪快递车辆的工作状况。研究人员运用“geo-loco”软件所搜集的数据进行分析,不仅能够对快递员的工作状况进行跟踪,而且还能预测其车辆可能发生的故障并及时检修。这样的大数据分析在2011年为UPS总共减少3000万英里的快递里程,节省300万加仑的燃油,并降低3万吨的二氧化碳排放。[21]
UPS以研究辅助管理的经验能否在大学管理中得到借鉴呢?比如说,美国大学最让管理者头疼的是学生的毕业率或辍学率问题,这直接影响一所大学的声誉、排名、资金来源和教学质量。为此美国的大学管理人员已经做了大量的研究工作,通过实证数据和质的研究确认了许多导致学生辍学的学业及社交因素。[22]假设我们能够参照UPS的思路,就这些导致学生辍学的因素建立数据档案,对学生的学习习惯、社交模式、性格特征及其他行为方式进行跟踪,那么大学管理层完全可以通过社交网站、宿舍或教室闭路电视、学生与教授的网络沟通记录、大学教务档案等许多渠道取得有关学生学业进展的大数据。这与UPS搜集快递车辆的工作状况在技术上并无太大差别。但是,学校能够这样做吗?
姑且不论研究者在搜集个人数据时需要得到学生许可,即便是得到许可并完成了研究,其结果如何影响决策,则是摆在大学管理者面前的又一难题。推论至此,也许我们已经开始看到研究者的无奈所在。大数据在商业运用上最为人称道之处就是它的预测能力。研究者以分析论中的预测分析方法干预运营,从而提高效率,防患于未然,如UPS在得到车辆可能发生故障的预警时能够及时采取措施进行维修。但大学在通过大数据分析得知学生学业遇到障碍时,能做的事情却非常有限。为了降低辍学率,有的学校尝试过将大数据分析中显示有辍学迹象的学生拒之门外,[23]但这种决策的结果是没有赶走学生却导致校长引咎辞职。也有的大学为了防止宿舍里的意外事故在走廊里安装闭路电视,因此引发学生大规模的抗议活动。隐私和各种伦理问题成为大学管理层运用大数据进行研究和决策的巨大障碍。[24]从这个角度看,商业分析论中最有效的工具即预测分析恰恰是大学管理研究中最危险的方法:它不仅需要用到学生的个人隐私信息,而且管理者很可能依据大数据分析的结果对学生的行为及其后果作出草率的、未经证实的判断,从而断送学生的学业以至前程。
行文至此,大数据时代管理研究人员面临的机遇和挑战同时现身。机器已经将数据储存变得轻而易举,而编程人员又为非结构化数据的实际运用展示了无限的可能性。教育研究者有理由为这个行业可能受到的边缘化感到沮丧,但这种沮丧的根源是对于大数据及其分析论的无知。比对UPS的成功,我们又看到了教育行业的特殊性以及将大数据用到管理决策上潜在的危险性,因为我们工作的对象是一个个活生生的人,而不是商品,也不是机械的流程。所以,大学的管理研究者不能不懂得大数据,但又不能迷信大数据。他们在大数据时代与时俱进的前提是对于高等教育研究范式及其基本规范的理解,而不能盲目照搬商业管理上的分析论。
从这个观点出发,我在本书余下的章节中希望通过评点自己过去的研究案例,为研究者、也为他们的老板作一个展示,看这两拨工作性质完全不同的人如何通过有效的管理研究进行沟通。为了不伤害到任何研究界的同仁,我只好对自己作“活体解剖”了。当然,我个人所做过研究的范围毕竟有限,而且很多工作是“前大数据”时代的产物,因此有必要在此先作说明。本书既非研究方法教科书,更不是分析论指南,研究者们可以将我的分享当作自己未来研究的参考或框架。对于管理者来说,我希望成为他们的导游,带着好奇的食客进到厨房,看一看他们所享用美食的制作过程。
回到钱锺书对教育系先生的描述,多少年来这早已成为这个行业学者头上挥之不去的一道魔咒。为了提高教育研究的含金量,研究者们在研究方法论上殚精竭虑,试图将教育研究纳入科学的范式,虽然成绩非凡,但在改变自身地位方面却了无进展。统计研究方法的引进虽然将他们打造成抽样调查和统计分析方面的专家,但因为结构性数据在分析方法的运用上相对程式化,研究者们可以施展拳脚的空间也不大。大数据的出现让我们眼前一亮,现代电脑技术的发展加上分析论的引入,使得非结构性数据的运用成为可能,也为未来的大学管理研究开辟了一片新的天地。
按照大数据思维,一切皆可用数据加以观察,研究者们不再会为缺乏数据而烦恼。唯一能让他们感到烦恼的是在运用数据上想象力的缺乏,也就是创新能力的缺乏。遍数大数据在商业领域的成功,无一例外是创造性地运用数据的成功,而不仅仅是分析论的成功。迈耶勋伯格和库克耶认为,未来数据从业者的成功必备三个条件:一是数据,二是处理数据的技巧,三是大数据思维。[25]懂得如何取得数据,学会了如何分析数据,并能从数据分析中得到知识和智慧,这样的研究怎能不受到管理者的欢迎?所以,仅仅为了不再被其他学科看低,教育系的先生们也必须在研究方法论上有所突破,在运用传统的统计分析和当代分析论这两种方法时做到游刃有余。