在物理学界,1905年以“奇迹年”著称。就在那一年,爱因斯坦发表了4篇彻底改变物理学的论文。他解释了布朗运动,印证了原子和分子的存在。他发现了光电效应,向量子力学迈出了关键的一步,并因此项发现在15年后获得诺贝尔奖。他创立了广义相对论,完全改变了我们对时间和空间的认知。然后,在这一年的年末,他写下了世界上最著名的公式:E=mc2。
爱因斯坦的1905年堪称“连胜”之年,一年中爆发出一系列卓越的成就。“连胜”是一个在体育运动或赌博中常见的词。在篮球比赛中,如果你两次投的都是空心球,那么第三次又这样投进时你一点也不会感到惊讶。你甚至可能“感觉”有那么一个神奇并充满魔力的气场在帮助你。虽然数十年来,连胜现象被视为理所当然,但在1985年,一项被大量引用的心理学研究却对是否存在连胜产生了质疑126,这项研究认为投篮时连续得分的概率并不高于掷硬币的概率。该研究表明,这一概念是个谬论,原因在于我们对小数字的心理偏见,就是说连交好运不过是你的感觉,这种好运实际上是概率使然。1985年的研究使心理学家和统计学家产生了争执,至今仍未平息127-130,比如有统计学论文声称,将其称作谬论这种说法可能本身就是个谬论,“连胜”现象在体育运动中似乎确实是存在的127,131。但是,由于辩论是针对体育运动、赌博和金融领域的,这就引发了一个非常有趣的问题:如果用科学家一生中发表的一系列论文来描述他们的职业生涯,那么,他们是否也经历过职业生涯的连胜期呢?
成功的爆发
如第5章所述,对于科学家、艺术家以及电影导演,我们已经知道他们的前3个最成功的成就都是在成果序列中随机出现的。这个发现告诉我们,创造性是随机的,是不可预测的,偶然性是决定主要成就产生时间的最关键因素。换言之,科学家的职业生涯不大可能出现连胜。但同时,随机影响规则引发了一个令人困惑的问题:在我们获得重大突破后会发生什么?
马太效应告诉我们,成功孕育更多成功。因此,当我们有一个高影响力的成果,即使它产生的时间是随机的,我们随后也极有可能产出更多高影响力的成果。然而根据随机影响规则,情况似乎应该是相反的。如果职业生涯中每篇论文的影响力都是随机的,那么一次成功后的下一篇论文可能只是趋于平庸,而不是更为轰动,从而形成对均值的回归。那么,我们取得重大突破后真的会回归平庸吗?
为了回答这个问题,我们分析了职业生涯中高影响力成果产出的相对时间117。确切地说,我们问了这样一个问题:假设某人做出了他最优秀的成果,那么他下一个最佳成果会出现在什么时候?为了衡量职业生涯中两个最优秀成果产出时间的相关性(N*和N**),我们计算了它们两者共同发生的联合概率P(N*,N**),然后将它与代表N*和N**随机独立发生的零假设进行比较。从数学的角度来说,这一比较可以借助归一化的联合概率φ(N*, N**)=P(N*, N**)/P(N* )P(N**),其结果可以由矩阵最好地呈现出来(见图7-1)。如果φ(N*, N**)大约为1,那么职业生涯中最优和次优成果共同发生的可能性就和两者随机发生的情况差不多。但是如果φ(N*, N**)大于1,这就意味着N*和N**更有可能连续出现,表明存在一种随机影响规则未能预测到的相关性。
图7-1 艺术界、文化界和科学界职业生涯中的连胜现象
不同的颜色表现了职业生涯中最高影响力成果的联合概率。φ(N*, N)**﹥Ⅰ(沿对角线的红色块部分)表明两次重大成功比在随机情况下更有可能连续发生117。
图7-1显示了科学界、艺术界以及电影行业职业生涯的φ(N*, N**),从中得出3个重要结论。
· 首先,φ(N*, N**)沿矩阵的对角元素的取值明显偏高,表明N*和N**相对于随机情况更有可能连续出现。换句话说,如果知道你最优秀的成果在职业生涯中何时发生,我们就会非常清楚地知道次优成果会在何时发生——离最优成果不远。科学家接连发表两篇最具影响力的论文,其平均概率是随机情况下的1.57倍。
· 其次,φ的特点是大致沿对角线均匀发散,这表明最优秀的成果产生于次优成果之前或者之后的可能性大致相当。
· 最后,共同发生的特点并不局限于职业生涯中最有影响力的两个成果。如果对其他成对的重要成果重复我们的分析,如N*与N***以及N**与N***,会发现同样的规律。不仅是最顶尖的两个成果靠得很近,第三个优秀的成果也同样就在前两个附近。
这些结果为个人职业生涯描绘了一幅更为精细的画面。虽然每个最高影响力成果出现的时间是随机的,但个人职业生涯中顶尖论文产出的相对时间却遵循着高度可预测的模式。严格来说,个人职业生涯轨迹并不是真正随机的。相反,职业发展中的重大成果产出时间具有高度的群集性,高影响力成果有时会连续出现,呈现“爆发”态势。而且这些特征并不局限于科学家的职业生涯。艺术家和电影导演的重大成果也遵循相似的模式,这表明在大量创造性工作中,成功作品的出现具有普遍性的群集现象。那么,这些不同寻常的模式背后的机制是什么呢?
连战连胜模型
要想了解职业生涯中重大成果爆发式产生的原因,我们还是从前面讨论的Q模型开始。假定科学家每次发表论文,论文的影响力取决于特定分布下的一个随机数,而且这一分布对这位科学家来说是固定的。由于引用量近似遵循对数正态分布,为方便起见,我们可以假定引用量的对数遵从一个平均值为Γi的正态分布。这一零模型所生成的职业生涯很好地遵循了随机影响规则:每个优秀成果,包括最优秀的那个,在职业生涯中都是随机出现的2,116。所有这一切都依赖于运气,也就是从随机分布中抽彩票的回报。
但是,这个零模型却不能重现图7-1所描述的时间相关性。主要原因展示在了图7-2中。为了方便解释,我们在3个领域分别选取一个个体,测量他的职业生涯中Γi的演化。这些样例表明Γi不是固定的。相反,它具有一个基准值(Γo),一直持续到职业生涯的某一时间点,之后上升到一个较高的值ΓH(ΓH>Γo)。这种表现的提升将持续一段时间,直到最终它跌回到与Γo相近的水平。这一观察引发一个有趣的问题:如果假设每个人都具有ΓH这样的短暂提升时期,是否可以用一个简单的模型来解释图7-1所记录的模式呢?
图7-2 “连胜”模型
为方便说明,我们选择并计算了一位科学家(a)、艺术家(b)和电影导演(c)的ΓH。真实的职业生涯有着明显的时序演化,其特点是短期影响力提升。(d)至(f)是职业生涯中连胜期次数的直方图,表明“连胜”现象具有普遍性,但通常又具有唯一性。大多数人都会有连胜期,但多数情况下只有一次117。
注意,这个新的模型只是在Q模型的基础上引入了一个简单的变量,让影响力在一个短暂时期内提升。但有趣的是,这个小小的变化却能够解释随机影响规则或Q模型所不能重现的实验观察(见图7-1)。在ΓH起作用期间,个人的表现相较于平常的Γo处于更高的水准。我们将这一模型称作“连胜”模式,其中ΓH持续的时期等同于连胜期。
“连胜”模型的真正价值体现在真实职业生涯数据的分析上。科学家连胜期的发生时间与强度的参数,让我们可以得到几个重要的观察结果。
· 计算表明,连胜在创造性领域的职业生涯中普遍存在。约90%的科学家经历过至少一次连胜期,艺术家为91%,电影导演为82%。这意味着,连胜并不限于爱因斯坦那充满奇迹的1905年。电影导演彼得·杰克逊(Peter Jackson)的连胜期持续了3年,期间他执导了《指环王》(The Lord of the Rings)三部曲。凡·高的连胜期始于1888年,那一年他从巴黎移居到法国南部,相继完成了《黄房子》《凡·高的椅子》《阿尔勒的卧室》《夜间咖啡馆》《罗纳河上的星夜》《静物:花瓶里的12朵向日葵》等画作。
· 尽管连胜具有普遍性,但它在创造性职业生涯中又具有唯一性。事实上,当放宽计算要求,允许存在至多3个连胜期,我们发现有68%的高影响力科学家仅经历过1次连胜期[见图7-2(d)]。第二次连胜有可能发生,但可能性较低,多于两次则非常少见。
· 连胜在职业生涯中的出现是随机的,这进一步解释了随机影响规则。如果连胜随机出现在职业生涯所产出的成果序列中,而从统计角度看,最高影响力的工作最有可能发生在连胜期,那么其发生的时间也是随机的。
· 连胜期持续时间相对较短。持续时间分布的峰值对科学家来说大约为3.7年,这表明不管连胜在科学家的职业生涯早期还是后期出现,它至多能持续4年。而对于艺术家和电影导演,持续时间约为5年。
· 虽然人们能在连胜期产出更有影响力的成果,但那段时间的产出率并不像我们期望的那样高,只是这期间的成果相较于其他成果质量更优而已。
我们为什么会有连胜期?这里有几个说得过去的假设。例如,创新者可能碰上一个开创性的,或者非常有意义的构想,而后产生了一系列高影响力的成果。或者,由于高水平的工作越来越多地由团队产出,因此个人的连胜可能对应着一个高产的、连续的,却是短期的合作关系。或者,它可能与职位变化有关,比如为评上终身教职,而会在一段固定时间内谋求影响力的提升。对真实职业生涯的分析表明,虽然这些假设都有道理,但没有哪一个能单独解释我们观察到的连胜现象。我们对科学家职业生涯进行了一些初步分析,结果表明,在广泛探索后开始进行专精的研究,似乎是连胜期开始的一个信号。随着更多个人职业生涯的数据可供使用,我们也许能够确定连胜的驱动力和触发因素,从而可以回答一系列新的问题。我们能够预测连胜的开始和终结吗?能够创造一个氛围,以促进连胜的启动,并让它长时间持续下去吗?
科学的真相
The Science of Science
人类活动的爆发(18)
短期的超高水平发挥并不局限于创造性工作,爆发这一特征也常见于各种各样的人类活动。例如,人们通常认为,像打电话这样的人类活动是随机发生的。如果真是随机的,事件与事件之间的时间间隔应遵循指数分布。但测量结果表明并不是这样:在多数人类活动中,事件之间的时间间隔近似幂律分布132-134。这就是说,事件序列呈现出爆发的特征,多个事件在一个相对短暂的时间内发生,但偶尔在两个事件之间有较长的时间间隔。尽管爆发与连胜以不同的方式测量,但这些例子说明连胜与人类活动中的爆发特征具有共性,连胜现象很可能在创造性领域之外也存在。
连战连胜意味着什么
在科学界,未来的影响力对于聘用、职业发展、科研支持以及其他决策都至关重要。然而连胜现象说明,能力表现可能相当不均衡:科学家在连胜期表现得更为出色。连胜发生的时间和强度左右着科学家职业生涯的影响力。就这点来讲,忽略连胜现象以及它在职业生涯中具有唯一性的特点,有可能导致系统性地过高或过低评估一个人未来的影响力。
例如,如果连胜期出现在职业生涯早期,它将带来一段时间的高影响力,但早期的事业高峰可能会逐渐减弱,直到第二个连胜期出现。如果某位科学家还没有经历他的连胜期,如果根据他当前的影响力对其职业生涯进行判断,很可能会低估他未来的潜力。连胜现象与资助机构也有很紧密的关系,因为连胜期和科研经费都是持续4年左右,这也就产生了一个问题,如何让资助经费最大化地推动个人职业发展。
但无可否认,要依据连胜现象实施改变是一个挑战。在终身教职评审中,一位年轻的科学家可能会为他不算出色的成果辩解说:“我的连胜期就要来了!”这显然非常荒谬。连胜也会给有年龄门槛的奖项带来问题。数学界的最高奖项“菲尔兹奖”只授予40岁以下的数学家。中国国家杰出青年科学基金是中国科学家事业成功的重要标志,该基金也不接受45岁以上的申请者。鉴于这些强制性的年龄限制以及连胜期的随机性,这可能意味着相当一部分当之无愧的候选人会失去机会,仅仅是因为他们的连胜期来得迟了一些。
此外,我们初步的分析还表明,在资助决策中考虑连胜现象可能并不像看起来那么简单。比如,我们调查了美国国家卫生研究院资助的授予时间和项目负责人连胜期开始的时间,发现项目负责人更有可能在获得他们第一笔R01资金之前就已经开始了连胜期。也就是说,科学家的连胜并不是发生在获得基金资助之后。相反,资助是产生于连胜之后。这些发现与美国国家卫生研究院强调研究基础是一致的,而且从资助方的角度考虑也是合理的,因为经历过连胜的科学家往往影响力更高,因而也就更值得资助。但同时,如果将资助决策与过去的成功联系起来,这些发现也提出了这样一个问题:资助方可能会错过项目负责人最富创造力的关键时期,特别是考虑到,连胜在科学家个人的职业生涯中通常只会出现一次。
总体来说,如果我们的目的是鉴别并培养那些在各自研究领域中更有可能具备持久影响力的科学家,我们就必须将连胜这一概念纳入考量因素,否则我们可能就会错失极其重要的机遇。耶鲁大学在这方面就有深刻的教训。
前文介绍过约翰·芬恩以及他后来的发现。在67岁时,他发表了研究成果,证实了一个新的电喷雾离子源。这是一个重大突破,或者至少他认为是这样的,但耶鲁大学仍然让他退休,将他请出校园。当他不太情愿地在弗吉尼亚联邦大学重新安顿下来之后,该校为他提供了实验室供其继续研究,自此,他的连胜期得以开启。1984—1989年,他的研究论文一篇接一篇地发表,并最终创立了电喷雾离子化的质谱分析法,使大分子和蛋白质的测量更快、更准确,促进了癌症诊断和治疗上的许多创新。那5年的连胜期,发生在芬恩被强制退休期间,但最终确立了他的事业,并使他获得了2002年的诺贝尔化学奖。他的连胜期是如此明显,看看图5-5便可一目了然。芬恩引用量最高的论文发表于何时?次之的论文是什么时候?再次之的又是什么情况?它们都出现在同一个5年中。
对许多有志于在这个世界上留下印记的科学家来说,芬恩职业生涯中的连胜现象有着极其重要、催人奋进的启示。还记得我们曾在第3章深入讨论过的传统观点吗?我们最优秀的成果将可能产生于30~40岁,那时我们有坚实的经验基础,同时也拥有充沛的精力和满腔的热情来延续我们的高产出。而一旦过了职业生涯的中点,实现重大突破的希望就开始减弱。但连胜现象与随机影响规则一道,否定了这种说法。连胜可以出现在职业生涯的任何阶段,能产出一系列高影响力成果。
所以,本章带来了希望:每一位头发刚刚变白的人,无论是否真的变老,不要仅凭这一点就自我放弃。只要我们像芬恩一样,持之以恒地做出成果,就像为了找到那张幸运的A,从一堆扑克牌中不断抽牌,我们的连胜期有可能就在不远处。
这也意味着,虽然我们不会都有爱因斯坦或芬恩那样的影响力,但只要坚持,我们自己的奇迹年可能就在前方,举目可期,指日可待。