第二节 大数据时代的管理研究
上述这套撰写研究报告的规范虽然乍一看有点“八股”的味道,但其真正的作用就像公路上的行车线之于司机:在循规蹈矩的司机眼中这些规矩几乎不存在或不需存在,但对胡作非为的司机来说这些规矩足以将他们罚下道路。同理,研究者即便是对研究课题驾轻就熟,也须恪守科学的规范,不能因一时兴起而信口开河。这一点对于从事高等教育研究特别是大学管理研究的人来说尤其重要,因为他们研究的信度与效度直接关系到大学的存在与发展。
在西方,尤其是在美国,虽然教育学院或教育研究所的专家教授们亦以大学管理为其研究课题,但大量的日常研究工作却发生在院校研究办公室(Office of Institutional Research)。2003年,我在与周川教授合编的《院校研究与美国高校管理》一书前言中曾对院校研究做过这样一个描述:
“院校研究是在一定的理论指导下运用科学的方法,尤其是信息科学的方法,对单个高等院校的运行状况及其影响因素进行定量和定性的分析,从而为高校的运作、管理、决策和发展提供现实依据的一种研究。……院校研究与传统的高等教育研究之间最大的区别在于它的研究对象及目的。传统的高等教育研究将人类的高等教育实践作整体或部分的研究,旨在提高人们对高等教育性质与规律的把握和认识;而院校研究则以个别学校为研究对象,研究者就高校机构某方面或各方面收集数据并进行分析,旨在为决策者从规划、管理及日常运作等各方面提供信息和决策辅助。”[5]
好奇的看客一定会问:本书所关注的大学管理研究,不就是院校研究吗?有必要在此故弄玄虚、另立门户吗?说来话长。想当初我在20世纪90年代初开始介绍院校研究时,曾经生搬硬套,将国外的“institutional research”直译为“机构研究”。[6]后经潘懋元教授提议改为院校研究,沿用至今。潘老虽仅改动一词,却直击要害,将研究的重点放在个别院校的管理,而非作为一个整体的高等教育领域。然而,院校研究进入中国高校之后,实为南橘北枳,并未如西方那样在大学里形成院校研究办公室。究其原因,于院校于研究均无干系,却与体制息息相关。在美国大学,院校研究人员属于行政体制,故其职责不在发表而在辅助决策;反之,中国大学的“院校研究”人员属于教研体制,不发表就要走人(publish or perish),故其精力全部放在理论研究上,根本无暇顾及大学的管理问题。(行文至此,我们似乎应该对钱锺书先生半个多世纪前的冷嘲热讽背后的深意有点觉悟了吧!)为了避免任何可能产生的概念上的歧义,我在本书中坚持用“管理研究”来指称以大学管理决策为目的的高等教育研究。
然而,随着大数据时代的来临,教育研究的词典中又添新术语:“analytics”——一般将其译作分析学、解析学或分析论。为统一起见,我在本书中采用“分析论”这个译法。2006年达文波特(Daven-port, T.H.)教授在《哈佛商业评论》上发表文章指出,在许多类似的产品充斥市场的今天,一个企业出奇制胜的法宝就是具有极高专业水准的数据收集、储存、分析以达致决策。事实上,亚马逊、万豪酒店等成功的企业早已借助分析论来指导企业管理和营运的方方面面。[7]他随后出版的同名专著《以分析取胜》[8]更是将分析论推向各个行业,在商界内外掀起一股以大数据分析支持战略决策的热潮。
达文波特的书虽然在分析论的推广方面极具煽动性,但对于究竟什么是分析论却语焉不详。华生和纳尔逊在他们合著的《管理分析论》一书中给出的定义似较为全面、准确:
“分析论是所有运用数据洞察现象以求改善决策的学科的总和。它包含三个组成部分:描述分析(descriptive analytics)重在对数据进行描述、报道及图像化;预测分析(predictive analytics)重在根据数据预测趋势,确认关联;指导分析(prescriptive analytics)则是基于现有的数据以及可预测的趋势对最佳决策提出指导意见并伴以行动步骤。”[9]
换言之,描述分析告诉你已经发生和正在发生的事情,预测分析告诉你将要发生的事情,而指导分析则告诉你应当如何行动。值得注意的是,作者在这个有关分析论的定义中明确指出,许多运用数据洞察现象以求改善决策的学科其实早已存在,因而分析论亦非新生事物。据此,美国大学从20世纪60年代初开始进行院校研究,便是“运用数据洞察现象以求改善决策”的最佳例证,只是当时还没有分析论这一说。今天,分析论在一夜之间受到如此热捧,其中最重要的原因当是大数据或体量巨大的数据突然之间变得唾手可得。像我这样曾以数据为业的人(说俗一点就是吃数据饭的)都不难体会,当你需要通过实证研究解决一个问题时,得到充足的相关数据是一件多么不容易的事!分析员们为此绞尽脑汁,以“上穷碧落下黄泉”来形容都不为过。可如今,随着网络时代的来临,特别是社交媒体在2000年后异军突起,我们身边的数据突然以几何速度增长,这情景,在任何一个分析员眼中都是辛弃疾诗句的电影版本:“众里寻他千百度,蓦然回首,那人却在灯火阑珊处”!
大数据激活了人们潜藏已久的想象力。牛津大学教授迈耶勋伯格(Mayer-Schönberger, V.)和《经济学人》杂志编辑库克耶(Cuki-er, K.)在其合著的《大数据》一书[10]开头讲了这么一个激动人心的故事。
2009年一个新的流感病毒H1N1在美国大地肆虐,引起世界的恐慌。美国疾病控制中心(简称CDC)要求全国的医生在接到病例后及时通知CDC,以便采取对策防止病毒扩散。然而,信息收集起码有两个星期的滞后,因为病人会在出现症状后等一两天才去看医生,医生报告CDC再花几天时间,加上CDC每周一次汇总信息,所以政府公共卫生部门完全无法有效预测病毒的发展及其走向。然而就在此前不久,谷歌的工程师刚在《自然》杂志上发表一篇关于如何利用搜索引擎发现并预测流行疾病的文章。[11]他们假设,当人们感到身体不适时会上网搜索相关信息,如“咳嗽与发烧如何用药”等。谷歌将2003年至2008年的5000万条搜索信息与CDC数据中有关信息进行比对,用搜索频率与搜索人所在地区的相关系数建立数学模式,最后确认的45条搜索词汇,辅以数学模式,使他们能够成功预测疾病的传染区域和病例。他们比CDC棋高一着的地方在于数据的实时性。
这个故事有两个看点。
其一,传统实证研究的起点是搜集与课题相关的各种数据并加以描述,在此基础上就事件的过去总结规律,对未来作出预测,并为决策者找到解决问题的途径。在这个过程中最具挑战性的工作无疑是数据的搜集,因为这关系到以后的步骤能否进行,并直接影响到研究的结果是否可靠。因为研究者不是全知全能的上帝,所以拥有数据的全本(population)对于他们来说纯属奢望,能做的只是尽力设计合理样本(sample),希望数量有限的样本数据能够最大限度地描述它们所代表的那个全本(假如这个想象中的全本确实存在的话)。可现在,“幸福来得太突然”,研究者不仅能够全本在握,而且还具有实时性,怎不让人喜出望外?
在传统的样本设计中,研究者为了增加样本的代表性,必须在研究开始之前就先行决定抽样方法,其可供选择的科学抽样方法包括简易随机抽样(simple random sampling)、系统抽样(systematic sampling)、分层抽样(stratified sampling)、类聚抽样(cluster sam-pling)、多重类聚抽样(multi-stage cluster sampling),等等。虽然多年的统计实践足以证明这些抽样方法的有效性,但因为抽样方法按照特定研究目的而定,研究者在研究开始后一旦遇到新的情况需要对所研究的问题进行调整时,修改样本的空间几乎不存在。可现在,比如谷歌搜索引擎的电子记录是全方位、多层次的,研究者可以随时调整其研究的方向,并能捕捉样本数据中常常容易被人忽略的小团体、弱信号。
其二,大数据及其成功应用开始挑战我们认识世界的方式。之前,统计思维给我们的信心是,尽管人类的认知能力有限,但通过科学的样本设计,我们完全能够实现以小见大、以偏概全。因此经过传统统计训练的人都相信,只要方法得当,我们透过统计分析的显微镜看世界,一样能够看到事物的本质、规律和因果关系。大数据似乎正在颠覆这种信心。假如我们不再需要抽样,而是能够直接进入研究对象数据的全本,那么,之前我们根据样本所做的各种统计测试和推断不是都失去了必要性?谷歌以对大数据的分析向CDC表明,了解病人的行为、他们所在的地区、发病的某些症状等看似无关的变量之间的相关性已经足够。假如仅仅是为了辅助决策,CDC并不需要知道这些变量背后的因果关系。换言之,知道“What”,决策者便能知道“How”,大可不必深究“Why”。
关于这一点,迈耶勋伯格和库克耶为我们作了如下的解读:
“大数据的核心是预测。虽然所谓的人工智能被认为是计算机科学领域的一个分支,更具体地说,是一个被称为机器学习的领域,但这样的表述会引起误导。大数据根本不会试图‘教’一部电脑像人类那样去‘思考’。相反,它是将数学运用到体量巨大的数据上以此来推断概率:如一份电邮属于垃圾邮件的可能性;当一个人打出‘teh’时可能心里想的是‘the’;一个人乱穿马路时的轨迹与速度是否意味着他在赶时间——因此无人驾驶的汽车只需稍稍减速。关键在于,这些系统能够得到足够多的数据来帮助它们作出预测,以保证运作正常。更重要的是,系统的设计中包含了自我改善的能力,因为它们能够在新的数据进入时自动寻找那些先前记录在案的最佳信号和模式。”[12]
不得不承认,大数据的出现为我们提供了一个全新的视角。以前我们也许很少想到,各种变量之间的相关性具有如此神奇的预测潜能。它对于传统的统计思维的冲击几乎难以抵挡。然而有趣的是,在市面上潮水般涌来的各种关于大数据和分析论的文章书籍中,我们见到最多的还是大数据在商业领域的应用。从事教育研究、特别是高等教育管理研究的人们在这来势凶猛的时代大潮面前何去何从?他们如何评估这个行业的走向及他们自己作为研究者未来的命运?他们的工具箱里是否具有足够的收藏来应对行业的挑战?