第五节 通货膨胀率动态因子模型建模实践中遇到的问题
尽管笔者对G20各经济体通货膨胀率动态因子模型的建模实践证实了这一宏观经济预测手段是可行的,并且其预测结果也达到了令人满意的精度,为进一步开展有效的通货膨胀率预测带来了希望,但是笔者的建模实践也发现了动态因子模型所面临的不少挑战。下面略举几例。
笔者在建模中遇到了三种来自数据方面的挑战。
第一种情形,虽然名称相同,但数据序列长度不一,定义不同,难以组合成一个跨越整个样本期的完整的时间序列。例如CEIC数据库中有关2000~2016年巴西失业率统计有三个序列(见图3-1):第一个(序列1353701)时间跨度为2000年1月至2002年12月,所注明的数据来源为巴西央行(Central Bank of Brazil);第二个(序列1355101)时间跨度为2001年10月至2016年2月,所注明的数据来源为巴西地理与统计研究所(Brazilian Institute of Geography and Statistics);第三个(序列367049217)始自2012年3月,所注明的数据来源也是巴西地理与统计研究所,是目前巴西失业率唯一一个仍在更新的序列。根据数据库中的说明,编码为1355101的数据序列仅包括了累西腓、萨尔瓦多等6个城区,而编码为367049217的数据序列则扩展至对20多个城区的统计。从重合时段的数据看,巴西央行与巴西地理与统计研究所的指标显然不同,而从定义看巴西地理与统计研究所的两个失业率统计序列也存在巨大差异。巴西通货膨胀率模型始建于2016年1月8日(见表3-1),当时考虑到采用第二个序列仅缺少2000年1月至2001年9月的数据,而这部分数据处于模型样本期的初期,对未来的通货膨胀率预测影响较小,故选用了第二个序列。然而2016年2月起该数据序列停止更新后,仍在更新中的第三个序列至2016年底仅有57个数据点,2012年2月及以前的数据又因口径与第二个序列差异较大无法据以补齐,在动态因子模型中缺少失业率数据是否会对模型的预测产生大的影响还有待进一步观察。
图3-1 巴西失业率
资料来源:CEIC数据库。
第二种情形,原本正常更新的数据序列不再更新,并且不存在可替代序列的情形亦较常见。例如,CEIC数据库中有关巴西实际工资指数(Real Average Wage Index,编码256109901)的数据时间跨度为2000年12月至2015年12月(数据来源为巴西地理与统计研究所),之后不再更新。遗憾的是,搜遍CEIC数据库也未能找到可以替代这一序列的相关数据。无奈之下,在后期更新时笔者只能放弃这一原本有益于预测CPI走势的序列。当多个时间序列同时出现此类情形时,对已建成的动态因子模型而言自然是灾难性的,也就是说,我们不得不重新选取数据,构建一个全新的动态因子模型。
第三种情形,由于意外冲击导致原有数据序列波动异常。例如,由于日本于2014年4月1日起将消费税率自5%上调至8%,日本月同比CPI增长率从2014年3月的1.6%迅速上升至2014年4月的3.4%,而一年之后则从2015年3月的2.3%迅速回落至2015年4月的0.6%。于2015年5月19日建成的日本通货膨胀率动态因子模型虽然明确给出了通货膨胀率即将迅速下降的预测,但由于当时基础数据截至2015年3月,笔者对通货膨胀率迅猛下降的时点还是出现了近两个月的误判。不过好在当前笔者的动态因子模型的运行速度有了较大的提升,新数据公布之后可以迅速校正预测结果,一定程度上可以弥补其对转折点预测的时效性(见图3-2)。
图3-2 日本通货膨胀率
资料来源:CEIC数据库。
建模实践中笔者还发现,采用不同样本区间所建立的动态因子模型存在较大的不同,而与理论上应保持相对稳定的假设相左。例如,在对中国通货膨胀率建模的过程中,当样本期为2000年1月至2015年1月时,笔者得到了图3-3中所示的3个动态因子。而当样本期为2000年1月至2015年3月时,笔者则得到了图3-4中所示的3个动态因子。两个不同样本期中所得到的动态因子并不相同。其实,这一结果从动态因子模型的建模过程中很好理解。
图3-3 中国CPI动态因子模型中所提取的动态因子(1)
注:样本期2000年1月至2015年1月。
资料来源:笔者计算。
图3-4 中国CPI动态因子模型中所提取的动态因子(2)
注:样本期2000年1月至2015年3月。
资料来源:笔者计算。
为避免因计量单位的不同对所提取的因子产生影响,在提取动态因子之前需要先对用于提取动态因子的数据集中的序列进行标准化。当样本区间不同时,各序列的均值和标准差绝非理论上假定的保持不变,而是会有所差异,这样一来在样本区间发生变化后,实际上我们所得到的是一个全新的数据集。尽管这个数据集与之前的数据集在进行标准化之前大部分是重合的,但在这个全新的数据集中所提取的动态因子肯定不会完全与之前所提取的动态因子重合。当然如果考虑到因数据统计口径和对历史数据进行更新,抑或是因某些数据序列已停止更新而不得不重新选取数据进行替代时,新提取的因子将更加偏离之前所提取的因子。
不过,尽管孤立地看各动态因子间存在差异,但当将每次所提取的动态因子进行综合时,其中所包括的信息却是高度一致的,因而将其用于对相关变量的预测所产生的结果也是值得期待的。详见第五章中的相关分析。