1.2 因子投资的学术起源
学术界对于因子的研究可以追溯到20世纪30年代。Graham and Dodd(1934)提出了价值溢价,而这本Security Analysis(证券分析)也早已成为业界的圣经。之后的60年代和70年代,CAPM和APT相继被提出,它们为研究因子提供了定量的分析工具。自20世纪70年代以来,学者们逐渐发现按照某种风格“打包”的股票能够战胜市场。这其中最值得一提的是Basu(1977)发现的便宜股效应和Banz(1981)发现的小市值效应。由于它们和当时主流的有效市场假说相违背,因此被称为异象。也正是从那个时期开始,学术界开始了轰轰烈烈的因子研究大潮。
1.2.1 实证资产定价
对于学术界而言,研究因子的最主要目标是提出更好的资产定价模型。在这方面的研究中,2013年的诺贝尔经济学奖获得者Eugene Fama、Lars Peter Hansen以及Robert Shiller三位教授功不可没。
对于Eugene Fama,各位读者可能并不陌生,他被誉为有效市场假说之父。他对市场有效性的最大贡献出自Fama(1970)这篇文章。该文提出了联合假说(joint hypothesis)问题,即要想检验市场的有效性就必须先有一个合理的资产定价模型。只有知道了定价模型给出的均衡状态下股票的预期收益率,才有可能正确地检验市场是否有效。毫不夸张地说,自20世纪70年代以来,学术界在实证资产定价方面的研究都是在联合假说的框架下进行的。
在多因子模型方面,Eugene Fama也是当仁不让的代表人物。首先来看看多因子模型的特例CAPM。在CAPM被提出之后,学术界进行了大量的工作来检验它。其中颇具代表性的一篇文章是Fama and MacBeth(1973)。该文章中的方法在检验CAPM时,巧妙地规避了收益率随机扰动项截面相关性的影响,得到了更加令人信服的结果并拒绝了CAPM模型。值得一提的是,Fama and MacBeth(1973)虽然是为了检验CAPM,但提出的回归方法却得到了更广泛的传播,成了因子投资中的一个重要统计手段[1]。
除了检验CAPM之外,Fama的另一个贡献是在Fama and French(1992)一文中整合了学术界后来陆续发现的便宜股效应和小市值效应,它们均是CAPM无法解释的异象。面对诸多异象,人们再也无法无视不能被单一市场因子解释的系统性风险了,学术界也亟待一个新的定价模型的出现。这时Fama and French(1993)横空出世。该文在市场因子的基础上加入了代表便宜股和小市值效应的HML和SMB两个因子,构成了一个三因子模型。时至今日,Fama–French三因子模型早已成为全球各国股票市场上实证资产定价研究的首选,而学术界后来推出的主流多因子模型也都建立在该三因子模型之上[2]。
Lars Peter Hansen对实证资产定价的贡献主要体现在计量经济学理论的突破。除多因子定价模型之外,其他最重要的资产定价模型大概要数基于消费的定价模型(Consumptionbased CAPM,CCAPM)。Hansen(1982)提出的广义矩估计(Generalized Method of Moments Estimator,GMM)在检验CCAPM模型时起到了巨大的作用。由于GMM非常强大,因此也常被用来检验多因子模型。关于这点,Cochrane(2005)有过详细的介绍。
与Eugene Fama认为市场是有效的截然不同,Robert Shiller则是行为金融学的代表性人物之一。Robert Shiller在其代表性论文Shiller(1984)中提出了著名的噪音交易者模型。这篇论文成了日后日益增长的行为金融学文献的起点。在Shiller(1984)的模型中,聪明投资者依股票的内在价值进行投资;而噪音交易者的存在造成了价格和内在价值出现了偏离;价格的过度波动来源于人们非理性行为造成的对基本面信息的过度反应。反观聪明交易者,虽然能对预期回报做出理性反映,但这种反映因受到自身财富的限制而并不充分。与传统金融学不同,行为金融学认为人并非完全理性的、会犯各种认知偏差,并从这个角度研究人的行为如何影响资产的预期收益率。如今,行为金融学也已经被广泛接受,不少学者从投资者行为的角度提出了错误定价因子(mispricing factors),构建了多因子模型。
自20世纪70年代以来到今天,学术界在实证资产定价方面的研究已经走过了近半个世纪。除了上述三位代表性的研究之外,更有大量的学者持续地在这个领域做出杰出的贡献,这些非凡的学术成果为因子投资打下了坚实的基础。这些发现可以归结为理论方面和实证方面两大类。理论方面包括各种统计学方法,用来检验异象和因子,或者比较多的因子模型。以后者为例,主流的统计手段包括Gibbons et al.(1989)检验(简称GRS检验)、Huberman and Kandel(1987)的均值—方差张成(mean-variance spanning)检验以及Barillas and Shanken(2018)的贝叶斯方法。此外,随着近几年机器学习的迅猛发展,也有越来越多的学者将其应用到因子模型检验上。本书的第2章将系统而严谨地介绍研究因子投资时用到的各种常见统计手段。在实证方面,学术成果则主要指的是各种因子以及多因子模型。本书的第3章和第4章将分别介绍这些因子和多因子模型,并针对A股市场进行实证分析。和理论推进的按部就班不同,学术界在实证方面挖因子的努力是十分激进和狂热的。正如一枚硬币有正、反两面一样,这些实证结果一方面的确丰富了人们对股票收益率背后真实驱动的理解,但另一方面很多所谓的发现却仅仅是样本内过拟合的产物,对因子投资并无实质的帮助。
1.2.2 研究现状
如今,学术界已经挖出了超过400个因子(包括定价因子和异象因子)。在发表偏差和多重假设检验(multiple hypothesis testing)的不良影响下,绝大多数因子仅仅是数据窥探(data snooping)的产物。数据窥探是统计学术语,指的是学者们在查看数据之后才去提出假设,进行统计检验,以此达到找到能够获得显著超额收益因子的目的。学术界对于挖因子的狂热和浮躁的态度已经引起很多学者的警惕。2011年John Cochrane在美国金融协会主席演讲时用“因子动物园”(factor zoo)一词来描述当前学术界因子研究的现状(Cochrane 2011),并提出了三个至关重要的问题:(1)哪些因子是独立的?(2)哪些因子是重要的?(3)因子驱动资产价格的原因是什么?
Cochrane(2011)的提问引发了学术界的深刻反思。最近几年,越来越多发表于顶级期刊上的文章致力于回答这些问题。Harvey et al.(2016)研究了316个因子,提出了一种能够利用不同因子之间相关性的全新分析框架,把代表因子显著性的t-值(t-statistic)的阈值从2.0提高到了3.0。Chordia et al.(2020)则对标了前文,认为Harvey et al.(2016)考虑的316个因子仅仅是被发表的,因而仅仅是所有被研究过的因子的子集,所以基于它们的分析会低估多重假设检验的影响。该文使用模拟定量刻画了学术界挖因子的过程,并进一步将代表因子显著性的t-值的阈值提升到了3.4以上[3]。除此之外,Green et al.(2017)使用Fama–MacBeth回归同时分析了近100个因子,发现真正独立的因子少之又少。Harvey and Liu(2018)以“幸运因子”为题提出了一个基于正交化和自助法的分析框架,从一揽子因子中逐一识别对解释资产预期收益率截面差异有增量贡献的因子。
一个新因子被提出后,随着越来越多人使用,它在发表后样本外的效果就会变差。在这方面,McLean and Pontiff(2016)研究了97个因子在被发表之后的表现,发现因子的收益率比论文中的表现降低了50%以上。类似的,Linnainmaa and Roberts(2018)研究了36个财务因子在样本外的表现,绝大多数因子在样本外的表现令人失望。另外,在学术研究中通常没有对交易费用给予充分的考虑,造成对因子收益率的高估。由于因子投资组合一般都是多、空对冲的组合,因此如果不合理考虑做空限制,也会高估因子的收益。当然可喜的是,学者们意识到了交易费用对因子效果的冲击,并开始在论文中对其加以必要的惩罚。
学术界对因子研究的另一个关注点是使用多变量构建复合异象或因子,用它来选股并获取超额收益。在这方面的代表作包括Piotroski(2000)提出的F-Score以及Mohanram(2005)提出的G-Score。使用多指标选股构建的多、空对冲投资组合能够获得主流多因子模型无法解释的、显著大于零的α收益率。本书的第5章将会解读包括上述F-Score、G-Score在内的一些非常有意思的异象。它们可以极大地丰富读者进行因子投资的思路。此外,美国著名的对冲基金AQR Capital Management(以下简称AQR)提出的质量因子也是很好的例子(Asness et al.2019)。就构建符合异象或因子问题,Novy-Marx(2015a)指出,虽然这么做无可厚非,但由于变量数量增多导致过拟合风险加大,因此需要谨慎考虑每个变量对于提升收益率的增量贡献。
从式(1.3)可知,异象的超额收益说明资产的定价中存在错误。近年来,行为金融学得到了长足的发展。与传统金融学不同,它假设人是有限理性的,因此在不确定性下做决策是会出现预期中的偏差以及风险偏好中的偏差。这些偏差对错误定价产生的原因提供了有效的解释,并可以解释很多市场中观察到的异象以及因子。基于这些新的发现,学术界和业界都逐渐同意风险补偿并非因子背后的唯一原因,而人的各种偏差则也是因子成因的必要补充。近年来,越来越多的研究着眼于理解这些偏差以及投资者情绪和收益率之间的关系。这些研究不仅涉及市场整体收益率在时序上的可预测性,也包括不同资产预期收益率在截面上的差异性。
学术界的最后一个关注点可以归结为因子收益率和宏观经济的关系。在不同的经济环境中,不同因子的表现大相径庭。研究经济环境和因子收益率的关系对于因子择时也很有帮助。在这方面,Claessens and Kose(2018)调研了学术界的大量相关文献,是一篇很好的综述。虽然理想很丰满,但是现实却很骨感,宏观经济和因子收益率之间的关系并没有人们预期的那么强,在这方面还有大量的研究要做。
[1]该方法被学术界称作Fama–MacBeth回归法。
[2]除了有效市场假说和多因子模型外,Eugene Fama对实证资产定价的另一个贡献是事件分析(Fama et al.1969)。此外,Eugene Fama在金融学的其他方面——比如公司金融——也有很多广为流传的成果。为了记录Fama对金融领域的贡献,John Cochrane和Tobias Moskowitz挑选了Fama最具代表性的论文编制了一本论文集,题为The Fama Portfolio(Cochrane and Moskowitz 2017)。
[3]Chordia et al.(2020)考虑了两种常见的检验方法,它们的t-值阈值分别为3.4和3.8。