第6章 对国民所得变化的测度
第1节
上一章的讨论,向我们提供了一个标准,按照这个标准,我们可以从一个时期或另一个时期的观点,决定一个时期的国民所得比另一个时期的国民所得是大或是小。但提供了任何一种事物增加和减少的标准,并不能提供对这些变化的测度。现在,我们必须要研究这个问题,提出一种适当的测量尺度。
第2节
从任何一个时期的观点看,按照那个时期的偏好和购买力分布,我们关于增加的标准是:对已增加到国民所得中的物品的货币需求超过对从国民所得中取出的物品的货币需求,这就自然表示,从那一时期的观点出发,我们应当使用一个比例作为增加的测量尺度,在这一比例中,对包含在那一时期国民所得中的物品的货币总需求(在人们愿意支付的金额的意义上,而不是不愿意支付的意义上)超过了对包含在另一时期国民所得中的物品的货币总需求。这种测量尺度与我们的标准完全一致。我们会得到两个数字,一个数字表示从时期I的偏好及购买力分布的观点看的变化,另一个表示从时期II的偏好及购买力分布的观点看的变化。显然,考虑到我们在上一章所确定的标准,如果我们能够这样做,这就是我们所要采用的测量尺度。
第3节
但非常不幸的是,这种形式的测量尺度在实践上是完全行不通的。如果采用这种测量尺度,我们将不得不面对作为最后障碍的这样一个事实:按照上面所解释的意义,对包含在任一时期国民所得中物品的货币总需求是一个不切实际的概念。它涉及到的货币数,是通过把包含在国民所得中的以货币衡量的每一种商品的消费者剩余全部加在一起得到的。但正如马歇尔所指出的,以这种方式把消费者剩余全部相加,部分原因是由于互补商品和竞争性商品的存在,这一任务带来了许多困难,这些困难即使能够通过运用复杂的数学公式从理论上克服,但在实践上却肯定是难以克服的。 [60] 即使不考虑这些较遥远的困难,显然,也不可能建立任何拟议中的在其术语中不采用包含在国民所得的各种因素中的需求弹性的测量尺度,或者更确切地说,是有关的各种需求函数的形式。对我们来说,这些数据在相当长的时间内是、而且很可能是难以获得的。因此,任何有关使用这些数据的测量尺度的想法,都必须予以排除。
第4节
沿着这种考虑所表明的思路继续前进,不久我们就会得出这样一个结论:在足以提供对国民所得的变化进行测量的尺度这样的范围内,有重大希望能加以组织的惟一数据是各种商品的数量和价格。除此之外,我们什么也得不到,因此,如果我们要在这种情况下建立任何测量尺度的话,我们必须使用这些数据。这样一来,我们的问题就变成:如果可能的话,以什么样的方式从这些数据中建立一个与在上一章中所得出的国民所得的变化定义相一致的测量尺度?解决这一问题的努力可以从这样三个方面入手:第一,一般性的研究分析,即如果所有有关数量和价格的信息均可获得的话,那么,哪一种测度与该定义最接近;第二,定量分析,即实际上我们可以获得的,从有关数量和价格的样本信息中建立起来的哪一种可实际应用的测量尺度,最接近于以上的测量尺度;第三,一般和定量分析相结合的混合性研究分析,即实际应用的测量尺度,作为以上测量的指数,其可靠性如何?
第5节
在着手分析第一个、而且是最重要的问题时,我们不得不马上承认,完全的成功是不可能的。根据在上一章所提出的定义,国民所得从一个时期的观点看(在这一时期,偏好和购买力分布属于一种情况)将以一种方式变化,从一个时期的观点看(在这一时期,偏好及购买力分布属于另一种情况),将以一种不同的方式变化。为了与此相一致,我们测量国民所得的变化也需要用两个数字来表示,如果偏好和购买力分布在两个时期中各不相同,从第一个时期的观点出发,其变化用一个数字表示,从第二个时期的观点出发,其变化用另一个数字表示。仅仅建立在数量和价格之上的测量尺度,是难以满足这种要求的。因为,虽然我们可以知道,当偏好及购买力分布属于A种情况时,时期I的实际数量和价格,以及当偏好和购买力分布属于B种情况时,时期II的数量和价格,但我们不可能知道,如果偏好和购买力分布属于B种情况时,时期I的数量和价格,以及如果偏好和购买力分布属于A种情况时,时期II的数量和价格。因此,我们最可能希望的是这样一种测量尺度:它与所要比较的两个时期中的任一时期的偏好及购买力分布状况无关,而是当国民所得的内容以不论偏好和购买力分布状态如何,只要它们在两个时期中完全相同,以货币衡量的经济福利将增加这样一种方式变化时,这一测量尺度也总是增加。即使我们能够获得有关数量和价格的全部数据,仅在这些数据的基础上建立一个比这个同我们的定义更为一致的测度,也是不可能的,显然,这种一致的程度是很不完全的。
第6节
对以上情况我们已有所了解,现在让我们转到在获得充分数据的基础上建立测量尺度的问题——从现在开始我们把其称之为充分数据的测量尺度——它将尽可能地与上一节所明确说明的适度的目标相一致。我们所需要的是这样一种测量尺度:每当国民所得的内容以这样一种方式变化时,它将能够表示出国民所得的增加,即,就任一时期的货币而言, [61] 对具有固定偏好和购买力分布的特定大小的团体来说,对于增加了的物品的货币需求比对减少了的物品的货币需求要大; [62] 或者,换句话来说,这一团体在第二时期获得的以货币表示的经济满足,比它在第一时期获得的以货币表示的经济满足要大。当然,这并不是要求,如果当以货币表示的增加的经济满足为E时,我们的测量尺度将表示增加1%,而当以货币表示的增加的经济满足为2E时,我们的测量尺度将表示增加2%。这不仅不必要,而且,在国民所得仅由惟一的一种商品构成的特殊情况下,它甚至还将导致自相矛盾的结果。但是,它要求,当以货币表示的增加的经济满足为E时,我们的测量尺度将表示某种增加,当以货币表示的增加的经济满足大于E时,它将比经济满足的增加为E时表示的增加更大一些。这就是我们所要建立的理论框架,问题是要发现何种理论能最好地实现我们业已明确说明的目的。 [63]
第7节
在我们想要比较的两个时期的第一时期,任何给定大小的团体将其购买力花在一商品组合上,在第二时期花在另一商品组合上。当然,估算每一商品组合时不要重复计算相同的东西,也就是说,包含的应该是提供给消费者的直接服务(如医生的服务)、制成的消费品和一部分当年生产出的耐用机器, [64] 而不应包含生产这些东西所消耗的原料或劳动服务,当然也不应包含“证券”。在此阶段,暂且忽略这样一个事实,即在一商品组合中可能有某些种类新发明的商品,而在另一商品组合中则毫无这些新发明的商品。我们可以把第一个商品组合称为C1,它包含x1,y1,z1…个单位各类商品;可以把第二个商品组合称为C2,它包含x2,y2,z2…个单位同类商品。假设上述各类商品每个单位的价格在第一时期为a1,b1,c1…;在第二时期为a2,b2,c2…。假设我们的货币收入总额在第一时期为I1,在第二时期为I2。由此可以得到以下命题:
1. 如果我们在第二时期购买的各类商品的比例与第一时期相同,也就是说,如果我们在两个时期购买的都是C1这个一般形式的商品组合,那么,我们在第二时期购买的各类商品就等于在第一时期购买的各类商品乘以分数
I2/I1·(x1a1+y1b1+z1c1+)/(x1a2+y1b2+x1c2+)
2. 如果我们在第一时期购买的各类商品的比例与第二时期相同,也就是说,如果我们在两个时期购买的都是C2这个一般形式的商品组合,那么,我们在第二时期购买的各类商品就等于在第一时期购买的各类商品乘以分数
I2/I1·(x2a1+y2b1+z2c1+…)/(x2a2+y2b2+z2c2+…)
根据这两个命题,再作某一假设,就可以部分地解决我们的问题。
第8节
如果在第二时期,一个曾经购买了C2形式的商品组合(即x2,y2,z2…)的人,转而购买C1形式的商品组合,则可以肯定,他的行为不会改变价格,他可以按价格a2,b2,c2…购买其新组合中的物品。类似的命题对于单个人在第一时期也成立,这个人不购买商品组合C1,转而购买商品组合C2。但是,若是整个一群人或者说一个有代表性的人,如此改变消费,则不能肯定,价格不会被改变。如果这群人在第二时期不购买商品组合C2转而购买商品组合C1,则它将不得不支付比如价格a1′,b1′,c1′。同样,如果这群人在第一时期不购买商品组合C1转而购买商品组合C2,则它将不得不支付价格a2′,b2′,c2′。上一节末尾提及的那个假设是,{x1a1′+y1b1′+z1c1′+…}等于{x1a1+y1+b1+z1c1+…},以及{x2+a2′+y2b2′+z2c2′+…}等于{x2+a2+y2b2+z2c2+…}。这意味着,这群人在第二时期只要愿意,便能购买同样的C1组合,尽管它这样做的决定会导致价格变化,就如同该决定并未引起价格变化,它能够做到的一样;而且类似的命题对这群人在第一时期也成立。如果涉及的所有商品都是在供给价格不变的条件下生产的,则上述假设会与事实完全一致。在实际生活中,对许多商品而言,可以合理地假定,消费变化引起的价格上升,大体上能抵消价格下降;因此,一般说来,我们的假设基本上符合实际情况。不过,必须记住,下面的论证均以这一假设为前提。
第9节
让我们从这样一种情况着手论述,即第7节中列出的两个分数要么都大于1,要么都小于1。如果它们都大于1,这意味着,那群人只要愿意,就能在第二时期比在第一时期购买更多的商品,不管购买的是C1形式的商品组合还是C2形式的商品组合。因而,它在第二时期选择C2这个事实证明,它购买的C2组合所产生的(以货币衡量的)经济满足,要大于C1组合所产生的(以货币衡量的)经济满足(该C1组合大于它在第一时期购买的组合), [65] 所以,毫无疑问,要大于它在第一时期实际购买的C1组合所产生的(以货币衡量的)经济满足。但是,因为爱好和分配未发生变化,第二时期的实际C1组合所产生的(用货币衡量的)经济满足,等于第一时期的实际C1组合所产生的(用货币衡量的)经济满足。因此,如果两个分数都大于1,第二时期购买的C2组合所产生的(用货币衡量的)经济满足,就必然大于在第一时期购买的C1组合所产生的(用货币衡量的)经济满足。采用类似的推理,可以证明,如果上述两个分数都小于1,则相反的结果成立。因而在此情况下,以下两个分数中的任何一个
I2/I1·(x1a1+y1b1+z1c1…)/(x1a2+y1b2+z1c2…) 或 I2/I1·(x2a1+y2b1+z2c1+…)/(x2a2+y2b2+z2c2+…),
或介于它们之间的任何表达式,将满足第6节提出的条件,我们的测量尺度要测量出国民所得的变化,就得满足这个条件。
第10节
因此,在上述情况下,我们设定的条件并不决定测量尺度的选择,而只是规定了选择的范围。范围的大小取决于这两个分数彼此相差的程度。在某些情况下,它们之间有一种近乎相等的关系。譬如,在19世纪末叶,英国人获取几乎每样重要商品的能力都提高了,其主要原因都一样,即运输的改进,因为制造业取得的大部分改进,降低了运输工具的价格。在另一些情况下,这两个分数的差距则很大。我或许可以找到直接适用的实例,但我必须满足于举出这样一个实例,它比较的不是同一群人在不同时间的两种状况,而是两群人在相同时间的状况。该实例只是在以下不符合实际的假设之下与我们当前的目的有关,即英国工人和德国工人的偏好相同,他们只是因为收入不同和支付的价格不同而购买不同的东西。此实例取自商务部的报告《德国城市的生活费用》。该报告表明,撰写此报告时,英国工人的习惯性消费在德国要比在英国多花费大约五分之一,而德国工人的习惯性消费在德国要比在英国多花费大约十分之一。 [66] 因此,如果用带有下标1的字母表示英国的消费和价格,用带有下标2的字母表示德国的消费和价格,则有
(x1a1+y1b1+z1c1)/(x1a2+y1b2+z1c2)=100/120, 以及(x2a1+y2b1+z2c1)/(x2a2+y2b2+z2c2)=100/110 .
第11节
虽然在截至目前讨论的那类问题中,我们设定的条件只规定了两个范围,在这两个范围之内选择测量国民所得变化的尺度,但即使在此处,为方便起见,也应在无数个可能的测量尺度当中挑选一个,尽管这种挑选可能是武断的。当我们从这类问题进入到另一类更加难解决的问题时,却不再那么需要作纯粹武断的选择。有时,上述两个分数中的一个大于1,另一个小于1。于是,它们都显然不能指示出那群人所享有的(用货币衡量的)经济满足变化的方向。假设在第二时期,那群人后来的收入比以前的收入能获得更大数量的C2组合,但同以前的收入相比,获得的C1组合却较少。在这种情况下,常识告诉我们,如果分数
I2/I1·(x1a1+y1b1+z1c1…)/(x1a2+y1b2+z1c2…)
远远小于1,而分数
I2/I1·(x2a1+y2b1+z2c1+…)/(x2a2+y2b2+z2c2+…)
只是稍稍大于1,则我们享有的(用货币衡量的)经济满足或许减少了;如果出现相反的情况,我们享有的经济满足则很可能增加了。若一个分数比另一个分数只是稍稍偏离1,似可得出相似的推论,虽然把握没有那么大。如果是这样,则我们获得的经济满足(应该明白,我们谈论的是用货币衡量的满足),在第二时期或许会随着以下表达式
I2/I1·(x1a1+y1b1+z1c1+…)/(x1a2+y1b2+z1c2+…)×I2/I1·(x2a1+y2b1+z2c1+…)/(x2a2+y2b2+z2c2+…)
或该表达式的乘方,或任何其他能作相同变化的公式,是大于1还是小于1而减少或增加。所以,用这种方法构造的分数也许会满足我们的测量尺度必须满足的条件。
第12节
在本书的前几版中,上述常识性的观点是用以下的直接分析予以辩护的。如果
I2/I1·(x1a1+y1b1+z1c1+…)/(x1a2+y1b2+z1c2+…)
大大小于1,这意味着,倘若我们在第二年购买C1组合,则购买的每一项目将比第一年减少很大的百分比,因此——在偏好和分配不变的情况下——我们所能享有的满足很可能将比第一年减少许多,比如说减少K1。若我们在第二年不购买C1组合而购买C2组合,则证明,我们在第二年购买该组合所产生的满足,并不以大于K1的数量而少于第一年购买另一组合所产生的满足。同样,如果
I2/I1·(x2a1+y2b1+z2c1+…)/(x2a2+y2b2+z2c2+…)
只是稍稍少于1,这意味着,倘若我们在第一年购买C2,则购买的每一项目将比第二年只少很小的百分比,因此——在偏好和收入不变的情况下——我们所能享有的满足很可能将比第二年只减少一点,比如说减少K2。因而,第二年实际购买的组合所产生的满足,不会以大于K2的数量超过第一年实际购买的组合所产生的满足。因为在K1大于K2的情况下,更多的时候是第二年的购买所产生的满足少于第一年的购买所产生的满足,只有在较少的时候是第二年的购买所产生的满足多于第一年的购买所产生的满足,并且进一步因为这些不同时候的概率显然都相等,所以,第二年的购买所产生的满足很可能少于第一年的购买所产生的满足。我现在认为,这种推理方法错误地依赖于先验概率。因而有必要更加仔细地考察一下这个问题。为此,让我们用
q1表示用第一时期的收入可以获得的(和已经获得的)C1组合的数量;
q2表示用第二时期的收入可以获得的C1组合的数量;
r1表示用第一时期的收入可以获得的C2组合的数量;
r2表示用第二时期的收入可以获得的(和已经获得的)C2组合的数量;
(q1)、 (q2)、F(r1)和F(r2)分别表示与这些实际的和可能的购买相联系的(用货币衡量的)满足的数量。
已知 q1>q2(1)
r2>r1(2)
q1/q2>r2/r1(3)
因为人们在第一时期宁愿要C1的q1而不愿要C2的r1,所以我们知道 (q1)>F(r1)。同样,我们知道F(r2)> (q2)。而且,由(1),我们知道 (q1)> (q2);由(2),我们知道F(r2)>F(r1)。
可以写作(q1)=F(r1)+AF(r2)=(q2)+B(q1)=(q2)+HF(r2)=F(r1)+K
因此,A、B、H和K均为正,简单移项,则(q1)-F(r2)=1/2(A-B+H-K)。只要q1/q2超过r2/r1很多,由不等式(3),我们就可以说,也许H>K。但我们并不知道A和B的值。所谓非充足理由原理,并不能使我们由这种无知中推论出或许(B-A)<(H-K)的命题。但只有借助于某个这样的命题,我们才能推论出(q1)或许>F(r2)。因而,根本无法对我们的常识性观点作出一般的证明。固然,q1q2越大于r2r1,第二时期的满足越可能小于第一时期的满足;但是,我们却无法指出第二时期的满足以什么数值更可能少于第一时期的满足。正如凯恩斯先生所说,“我们面对的是概率问题,在特定情况下,我们可能有与这种问题相关的数据,但如果没有相关的数据,这种问题就是完全不确定的”。 [67]
第13节
如果这个结论是正确的,则可看出,当以下两个表达式
I2/I1·(x1a1+y1b1+z1c1+…)/(x1a2+y1b2+z1c2+…)
I2/I1·(x2a1+y2b1+z2c1+…)/(x2a2+y2b2+z2c2+…)
当中的一个大于1,而另一个小于1时,并没有一个居于中间的表达式,能使我们根据此表达式是大于1还是小于1,而说出我们在第二时期获得的经济满足是增加了还是减少了。不过,当这两个限制性表达式均大于1或小于1,因而对经济满足在两个时期之间是增加还是减少毫无疑问时,写出介于这两个限制性表达式之间的某一个表达式而不同时写出这两个表达式,实际上要方便得多。有无数个可以采用的中间表达式。在对它们作选择时,因为喜欢这个或那个没有什么深奥的原因,所以,正如凯恩斯先生所说,我们会“理所当然地受代数的优美、算术的简洁、劳力的节省以及在不同时候使用特定速记法的内在一致性等考虑的影响”。 [68] 因而我建议采用物价指数中技术很成熟的两项基本检验标准,因为我们所寻求的测量尺度乃是物价指数的倒数乘以货币收入发生的相应变化,欧文·费雪教授已明确指出了这一点。首先,所选定的公式应该在“比较的一个点和另一个点之间产生相同的比率,而不论以哪一个点为基期”。 [69] 如果向前计算,它显示1910年的物价是1900年的两倍,那么向后计算时,它就不应像所谓沙尔贝克式的未加权的算术指数那样显示,1900年的物价不是1910年的一半。其次,选定的公式应符合费雪教授所谓的颠倒因子检验。“只要什么东西被交换而有价格,就意味着有交换、生产、消费或其他等数量,因而物价指数的问题包含有数量指数这一孪生问题。……没有理由对这两个因素中的一个采用某一公式,而这个公式不适用于另一个因素”。 [70] 因此,所选定的公式应该是这样的,即假设我们所研究的所有商品的货币价值总额,在两年之间由E增加到了(E+e),那么,如果此公式应用于价格时显示有从P到(P+p)的向上变动,应用于数量时显示有从Q到(Q+q)的向上变动,则
{(P+p)/P·(Q+q)/Q}等于E+eE.
除了与这些检验标准相一致外,我们还可以要求测量尺度结构简单,计算方便。把上述种种考虑综合在一起,表明以下公式
I2/I1·
对于我们的目的来说,是衡量变化的最令人满意的尺度。该表达式中I2/I1右边的部分,是费雪教授所赞扬的那种物价指数的倒数,费雪因这种指数具有一般的优点而把头等奖颁发给了它,并称其为“理想的指数”。 [71]
第14节
至此讨论的公式,无论是限制性公式还是中间公式,均建立在以下不言而喻的假设之上,即包含在C1组合或C2组合中的商品,没有一种不是同时包含在这两个组合之中的。所以,如果在任何两年中的一年可以买到某种商品,而在另一年买不到这种商品,我们的测量尺度便完全忽略这种商品在人们购买它的那一年产生的满足。因而,只要在所比较的两个时期之间引入新商品,我们的测量尺度就是不完善的。这一点很重要,因为在与此有关的意义上,新商品不仅包括真正的新商品,而且还包括在新的时间或地点可以获得的老商品,比如12月份可以买到的草莓,由铁路引入印度一些地区的小麦,这些地区的人们以前不知道有小麦。显然,我们不应该把12月份可以买到的草莓与普通草莓同等看待,认为有关草莓的发明提高了草莓的价格,而应该把12月份可以买到的草莓看做是一种独特的新商品。然而,因为新商品常常直到首次被引入后经过一段时间,才会在任何人群的消费中起重要作用,所以由此造成的不完善,在相距较近的两个年份之间不会很严重。我们可忽略新商品的存在,将计算限于老商品,而不会有计算结果无效的严重风险。不过,在相距较远的两个年份之间,由于在后一年份会出现许多以前根本不存在的重要商品,因而一种测量尺度若忽略新商品,那它作为衡量(上一章所界定的)国民所得变化的尺度,就是几乎没有价值的。 [72] 所以,除非能找到某种方法计及新商品,否则似乎就无望比较两个相距遥远的时期。不过,马歇尔发明的环比方法提供了摆脱困境的一种出路。 [73] 按照这种方法,在比较1900年的物价水平和1901年的物价水平时,只需考虑在这两年均可获得的商品,而无需考虑1901引入的新商品和淘汰的老商品;然后比较1901年的物价水平和1902年的物价水平,这回计入1901年的新商品,而忽略1902年的新商品,依此类推。我们可以假设1901年的物价是1900年的95%,1902年的物价是1901年的87%,1903年的物价是1902年的103%。在此基础之上,设1900年的物价是100,我们可以建立一个环比。利用以上数字,这个环比为:
1900 · ·1001901 · · 951902 · · 82.6(即95×87/100)1903 · · 85(即82.6×103/100)
把这些物价指数的倒数(它们显然就是英镑购买力的指数)放入我们测量国民所得的尺度之中,便可得到一个工具,借此可以通过一连串连续的步骤比较由于相距太远而无法直接加以比较的年份。这就犹如我们无法制作一根测量杆,把它带到100英里以外而不变形。因而我们无法直接比较相距1,000英里的树的高度。但是,通过比较1英里处的树和100英里处的树,再比较100英里处的树和199英里处的树,如此继续下去,则可以进行间接的比较。 [74] 当然,必须承认,如果环比方法包含的各个连续的比较都有小误差,且在大多数情况下误差的方向相同,则累积的误差在相距遥远的年份之间可能很大。假如人们像发明新东西一样,同样会忘记如何制造现在正使用的东西,也许不会出现大的累积误差。但实际上,我们知道,发明的伟大进程并未像这样被抵消。因而,由环比方法带来的误差可能会集中于一个方向,以致如果该方法在两个相距遥远的年份之间赋予1英镑以相等的购买力,则1英镑在后一年很可能比在前一年给具有一定爱好的代表性个人带来更多的满足。因此,如果我们的环比测量尺度测得1900年1英镑购买力的指数为90,测得1920年1英镑购买力的指数为100,那么,即使在此期间引入了大量新商品,放弃了大量老商品,我们也可以自信地推论说,在第5节假设的条件下,1920年1英镑带给我们的经济满足的数量,要大于1900年。但是,如果将这些指数颠倒过来,我们却不能以同等的自信推论说(实际上,除非指数的下降幅度很大,否则我们毫无自信作这样的推论),1920年1英镑带来的经济满足量,要小于1900年。
第15节
现在我们转而讨论本章的第二个主要问题。如果我们的选择是完全自由的,则第13节列出的公式就是我们应该选择的公式。但实际上却不能使用它,因为要建立这个公式,需要掌握大量的信息,而实际上并不能得到这些信息。所以,就得用我们所能获得的信息,构造一个典型的或有代表性的测量尺度,使其尽可能地接近于这个公式。我们的数据充分的测量尺度,除了表示收入变化的乘数I2/I1外,由两部分构成,一是C1组合价格变化的倒数(所包括的不同商品的数量等于x1,y1,z1,…),一是C2组合价格变化的倒数(所包括的不同商品的数量等于x2,y2,z2,…)。所以,我们的近似测量尺度也由两部分构成,分别表示C1和C2的价格变化的近似值。采用何种抽样方法能最有效地得到这些近似值呢?
第16节
不管我们考虑的是什么样的商品组合,无论是一般人在任何时候购买的商品组合,还是工匠、工人或任何其他人购买的商品组合,它们都会包含各种不同的商品,其价格变化的总体特征也不同。好的样本组合应包括不同性质的、具有代表性的各类商品,这些商品是国民所得的一部分,或者是我们试图测量的那部分国民所得的一部分。 [75] 然而,令人遗憾的是,由于一些实际原因,无法满足这一要求,甚至必须求助于普通人不购买的商品,例如像小麦和大麦那样的商品原料。因为价格能被观察到的、且能进入我们的样本组合的商品的范围,在两方面是有限的。
首先,除了某些大量消费的物品外,向消费者索取的价格是难以弄清的。吉芬甚至曾说:“实际上我发现,只有能在大批发市场上交易的主要商品的价格能够被利用”。鉴于商务部和新近设立的食品部对食品零售价格作了一些研究,这种说法现在必须加以修正,但在很大范围内仍然是正确的。然而,即便能够克服弄清零售价格的困难,这些价格也不适合于在若干年之间进行比较,因为标明价格的物品往往包含零售商和运输商不同比例的服务,因而在不同的时期往往是不同的物品。“在新鲜的海鱼只能在海边买到时,其平均价格很低。有了铁路内地也有海鱼卖后,其平均零售价格中要比从前包含高得多的分销费用。对付这种困难最简单的方法,通常是采用某种物品的产地批发价,充分考虑商品的运输、人员和广告,把它们视为非常重要的单独项目。” [76]
其次,甚至制造品的批发价格也很难估量,因为,虽说仍叫同样的名称,制造品在特性和质量上却不断变化。斯蒂尔顿乳酪,曾是双层奶油乳酪,现在则是单层奶油乳酪。用不同收获期的葡萄酿造的红葡萄酒是不相同的。现在铁路客车上的三等座位也与40年前的不同。“现在有十个房间的普通房子或许要比以前的大,而且其大部分费用花在旧式房屋所没有的水、煤气和其他家庭用具上。” [77] 在过去的十二年,由于冷冻和溶解的方法越来越科学,我国销售的外国羊肉的质量稳步提高;另一方面,外国牛肉的质量却下降了,因为来自北美的供应实际上已经停止,而被来自阿根廷的质量较差的牛肉取代了。 [78] 试图估价许多直接服务时,也会遇到同样的困难——例如医生的服务,正如帕累托尖锐指出的,就比棉纺织业吸收了更多的支出 [79] ——因为这些服务虽然名称一仍其旧,可性质却常常改变。
因此,可以观察到的主要物品——不过必须承认,加拿大的官方指数和美国采用的若干种指数,试图作更广泛的调查——似乎是批发市场上尤其是大型国际市场上的原料。这些东西——当然,战争时期除外——相对于运费一般较小的次要物品而言,近年来价格可能下降了;相对于个人服务而言,它们的价格确实下降了;相对于制造品而言,它们的价格却可能上升了,因为实际的制造方法一直在改进。我们的样本省略了各个项目的价格变化,但这些变化可能会相互抵消,因而我们的省略或许不会造成过于严重的后果。当然,想要获得真正测量尺度的努力,会因此而受到影响;几乎可以肯定,因为原料的价值常常只占成品价值的很小一部分,因而原料50%的变化,可能只引起成品5%的变化,从而会夸大所发生的价格波动。
以上所述并未完全列出我们的无能为力之处。因为想用以代表各种“组合”的样本,不仅是价格的清单,而且还是价格乘以购买量的清单,而我们对购买量的了解甚至比对价格的了解还有限。有关国内年产量的记录少之又少——关于年购买量的记录就更少了。进口数量确是有记录的,可很多重要商品并非完全来自于进口。当然,对于某些目的来说,求助于典型的支出预算,可以克服这个困难。支出预算可以使我们大致了解特定阶层的人购买某些主要物品的数量。但这种方法只能提供粗略的平均数字,使我们几乎不能区分包含在相距很近的不同年份的商品组合中的各种物品的数量。
第17节
接下来让我们假设,以上困难都被克服了,在所有相关的时期都可以获得既包含价格、又包含数量的样本。接下来的问题便是确定应如何给价格“加权”。乍看起来,似乎权数自然应该与包含在抽出样本的商品组合中的各种商品的数量成比例。但至少在理论上,有时可以改进这一安排。因为我们所了解的一些商品可能与排除掉的一些商品有密切关联,以至它们的价格通常在同样的意义上变化。因此,从理论上说,如果我们有几种商品的统计数字,每种商品都取自具有相同特征的不同商品大组,那么就可以不按照其自身重要性的比例,而按照其所代表的大组的重要性的比例,给各种样本商品“加权”。然而,这实际上几乎是行不通的。可能某些商品,其典型特征非常明显,可以正确地赋予它们以修正过的权数,但我们很少有足够的知识能实行这种差别待遇。一般说来,可行的最好方法,就是照原样使用我们的样本。 [80] 因此,C1组合价格变化的数据充分的测量尺度是
(x1a2+y1+b2+z1c2+…)/(x1a2+y1+b1+z1c1+…),
可以得到的这一测量尺度的最佳近似值是
(x1a2+y1b2+…)/(x1a1+y1b1+…),
式中项数以样本中包含的物品的数目为限。由此可推论出,第13节末尾列出的国民所得变化的数据充分的测量尺度的最佳近似值是
I2/I1(x1a1+y1b1+…)/(x1a2+y1b2+…)×(x2a1+y2b1+…)/(x2a2+y2b2+…) .
第18节
实际上,正如上文所暗示的,我们通常无法找到一合理的物品样本,在我们比较的两个时期(或地方)的每一时期(或地方)知道人们所购买的这些物品的数量。在这种情况下,我们也许不得不满足于这样一个样本,此样本在我们比较的年份中只有一年的数量为已知。在此情形下,我们不得不截短我们的公式而采用以下形式
I2/I1·(x1a1+y1b1+…)/(x1a2+y1b2+…) .
这就是英国商务部在生活费用指数方面所采用的(颠倒的)公式。显然,这种截短的样本不如完全的样本。但费雪教授的考察表明,截短的样本得到的结果,通常与完全的样本得到的结果并没有太大的差别。因而我们无需研究这样一个很难找到答案的问题,即是不是另外一种公式,它建立在与上面相同的数据之上,却能获得与完全样本更接近的近似值。
第19节
然而,在此需要说明上述公式与所谓“未加权”指数(例如索耶贝克编制的指数)之间的确切关系。这种指数把某一年或平均若干年当做基期,把这一基年或基期所有商品的价格定为100,把其他年份的价格表示为100的适当分数。如果a1,b1,c1是基年的实际价格,a2,b2,c2是另一年的实际价格,那么这另一年英镑的购买力就是
100+100+100…/(100a2/a1+100b2/b1+100c2/c1…)
这一公式等于上一节给出的公式,当且仅当那个公式中x1,y1,z1的数值与100/a1,100/b1,100/c1…成比例时。也就是说,索耶贝克的公式可以度量某一商品组合的总价格发生的变化,该商品组合由各种商品的数量构成,这些数量是在基年或基期以100英镑的相等乘数售出的数量。其实,这些数量不大可能是在基年或基期售出的数量。因此,只是由于极其偶然的巧合,由索耶贝克的方法建立的公式才会与用上一节的方法建立的公式相一致;前者以任何年份或时期为基期,后者则旨在显示出基年或基期实际售出的商品组合的总价格发生的变化。
第20节
由以上所述,可以得到一个明显的推论。我们已看到,用索耶贝克方法编制的指数,以任何一年或时期R为基期;它测度这样一个商品组合的总价格的变化,该商品组合由各种商品在年度R以100英镑售出的数量构成。因此,当基期由年度R1变为年度R2时,我们所考察的那个商品组合(我们要测度其总的价格变化),一般说来也会发生变化。于是,既然测度的是不同的东西,得到的结果当然也就不同;而且所得到的结果没有理由不如此不同,以至以R1为基期的指数显示货币购买力上升,而以R2为基期的(索耶贝克式的)类似指数却显示货币购买力下降。因而,假如我们只需对付两种商品,一种商品价格上涨一倍,另一种商品价格下跌一半,那么,若以第一年为基期,则这种指数将显示这两种商品的价格合计上涨25%,若以第二年为基期,则显示下跌20%。关于这种差异,商务部有关英德两国城市生活费用的出版物中的某些图表提供了一个极好的实例。在有关英国的蓝皮书中,伦敦、英格兰中部地区和爱尔兰的实际工资,是用指数方法计算的,这种指数以伦敦(相当于我们时间指数中的比如说1890年)为基数,那里的消费品价格和租金都用100表示。按照这种方法,消费品价格和租金被分别赋予权数4和1。商务部发现,伦敦的实际工资等于英格兰中部的实际工资,而高于爱尔兰3%。然而,若以爱尔兰为基数,则实际工资的指数,伦敦将为98,英格兰中部为104,爱尔兰为100。在有关德国城市的蓝皮书中也出现了类似的困难。商务部以柏林为基数,发现除一个地方外,柏林的实际工资比任何其他地方都高。 [81] “倘若不以柏林而以北海各港口为基数,柏林将排在第四位而不是第二位,其他地区的名次也将被改变;若以德国中部地区为基数,会使名次发生更大的变化。” [82] 毫无疑问,除非被赋予很大权数的商品在价格上差距巨大或在不同时期价格发生巨大波动,否则不会出现这种巨大差异。这个事实虽然令人很感兴趣,却与我们目前讨论的问题无关。
第21节
在某些情况下,我们可能不了解,也没有资料可据以推测我们所要比较的任何一年的购买数量,因而我们的测量尺度所涉及的指数就不得不退而求其次,依赖于仅有价比而没有任何权数的样本。在这种情况下,前面的讨论会清楚地告诉我们,绝不要像索耶贝克那样,通过把价比归并成一个简单的算术平均数来编制指数。若采用简单几何平均数——如果任何一种商品的价格时常趋近于零,则无法采用几何平均数——或价比的中位数,则可以避免那种方法导致的自相矛盾。费雪教授曾饶有兴味地讨论了这两种指数的相对优点。 [83] 这两者显然都不如第18节中的加权公式,如果能得到该公式所需的数据的话。
第22节
最后,我们必须考虑各种可行的测量尺度的可靠性,这种测量尺度作为数据充分的测量尺度的典型是存在的。首先,让我们假设,我们可以获得这样一个样本,其一般形态与数据充分的测量尺度相同,而且对于想加以比较的两个(或全部)时期,既可以得到价格又可以得到数量。于是可以得出以下五个一般性的结论。第一,当样本取自数据充分的商品组合所包含的大多数主要商品组,而这些商品组具有独特的价格变化时,我们的测量尺度可能出现的误差会比抽取的样本的代表性较小时小。第二,当样本较大时,即当样本中各项的支出构成我们花在整个商品组合上的总支出的很大一部分时,可能出现的误差会比样本较小时小。若是进行严格意义上的随机抽样,可靠性会随着样本中所包含的项数的平方根的增大而增加。第三,当构成数据充分的商品组合的每一项分别吸收花在该商品组合上的总支出的很小一部分时,可能出现的误差会比每一项分别吸收总支出的很大一部分时小。第四,当样本中的各项所显示出来的“散布”程度较小,而且各种价格在我们比较的年份之间以非常相似的程度变化时,可能出现的误差会比各项所显示出来的散布程度较大时小。由此可推论出,我们的测量尺度可能出现的误差,在相距遥远的年份之间要比在紧挨着的年份之间大,此处完全不考虑第14节提及的“新商品”造成的困难。正如米切尔教授根据一项范围广泛的调查指出的,原因是,批发价格在任何一年与下一年之间变化的分布,是高度集中的(比常态误差律特有的分布还要集中),但批发价格在任何一年与相距较遥远的另一年之间变化的分布却是高度分散的。“就一些商品而言,其若干年连续的价格变化趋势显然是向上的;就另一些商品而言,则呈现不变的向下趋势;还有一些商品,则没有确定的长期趋势可言。” [84] 最后,如果我们无法得到与数据充分的测量尺度具有相同一般形态的样本,而不得不满足于第18节描述的那种截短的样本,那么,我们的测量尺度当然就没有如果能获得较好的样本时那么可靠。如果我们完全没有购买数量方面的资料可资利用,而必须使用简单几何平均数或价比的中位数,我们的测量尺度就更不可靠了。但是应该指出,使用较差的指数公式而给可靠性造成的损害,例如使用小样本造成的损害,当价格变化的散布在我们比较的年份之间较小或中等时,不会很大,但当价格变化的散布较大时,却会很大。
[1] 《经济学原理》,第131~132页注释。
[2] 考虑到以下事实,这句话是很有必要的:如果这一团体的总的货币收入发生了变化,那么,第二时期的钱和第一时期的钱就不是一码事儿了。
[3] 或许对以前用文字叙述过的东西,在这里用符号来重复一下更好一些,即若任何商品的需求曲线方程式是p= (x),则对h单位增量的货币需求是∫x+h0 (x)-∫x0(x),而不是{(x+h)(x+h)-x(x)}.
[4] 欧文·费雪教授在其《指数的编制》一书中所进行的杰出研究中,似乎采取了这样一种观点:有一种绝对正确的方法可以用来建立这种测量尺度,所谓绝对正确,就是该方法建立的测量尺度并非仅仅能满足我们想要达到的特殊目的。考察了许许多多不同种类的指数后他发现,去除掉那些具有明显技术缺陷的指数,剩下的指数虽然是采用迥然不同的方法编制的,但得出的结果却大致相同,他由此得出结论说:“从人的角度说,指数是一种绝对精确的工具”(第229页)。不错,不同的方法所得到的结果极为相近,无疑会使人联想到,某处存在着一个绝对正确的结果,这些方法都在向其逼近。但是,就我所能理解的说来,其实没有理由接受这种形而上学的联想。让我们作个类比,看看这样一个测量尺度,它旨在确定一组树的平均高度。人们可以很容易地发现这组树的算术平均高度、几何平均高度或任何其他平均高度。在许多情况下,所有种类的平均数都会带来与此非常相似的结果。但这并不能算作一个证据,表明天上存储有一个理想的平均高度,它不同于上述那些平均高度,而且在绝对的意义上,比上述任何一个都更为精确或正确。固然,有正确的算术平均数,有正确的几何平均数,有正确的调和平均数;但在我看来,若认为存在着一个绝对正确的平均数原型,那却是一种幻觉。我们要达到某一目的时,可以问:是算术平均数还是几何平均数能最好的服务于我们的目的?如果这两种平均数恰巧相同,则我们很幸运,即使偶然挑选了错的一个,也没有多大关系。但我们必须就此打住,若再说更多的东西,就不合适了。不过,有理由认为,当费雪教授宣称为价格指数挑选公式可以不考虑所要达到的目的时,他是在比我窄的意义上使用目的这个词,因而不会同意我在此处说的话。
[5] 为了与第3章给出的国民所得定义保持一致,必须这么做。倘若我们给国民所得下的定义是,国民所得只包含当年实际消耗的东西,那么机器便不计入国民所得。根据我们的定义,我们应严格地把超出维持资本不变所需的所有新厂房设备包括在内,减去当年生产消费品所消耗的那部分厂房设备的价值。
[6] 这个命题及据此得到的结果取决于这样一个条件,即这群人能按时价想买什么就买什么,想买多少就买多少。倘若规定了官方最高限价,倘若由于实行配给制或由于没有足够多的商品满足需求,人们按时价购买商品的活动受到限制,当然就不能满足这个条件。第一次世界大战期间,法定价格常常偏离实际价格——至少在德国是这样——使情况更加复杂。
[7] (敕令书,4032),第7页和第14页。
[8] 《货币论》,第1卷,第112页。
[9] 《货币论》,第1卷,第113页。
[10] 《指数的编制》,第64页。
[11] 《指数的编制》,第72和74页。
[12] 《指数的编制》,第242页。
[13] 类似的考虑使我们联想到,“新商品”的存在,或确切地说,不同商品的存在,对于比较两个相距遥远的地方要比较两个相邻的地方,是一个更为严重的障碍,因为在两个相距遥远的地方(譬如赤道地区和北极地区)中的一个,要比在两个相邻地方中的一个,更可能买到另一个地方没有见过的商品。在相距遥远的地方之间,从理论上说通过一连串中间地区可以应用即将讨论的环比方法,但实际上这种比较方法很可能是行不通的。
[14] 参看马歇尔,《当代评论》,1887年3月,第371页及以下各页。
[15] 看来费雪教授未充分考虑环比方法的这个方面。假如没有新商品要加以考虑,假如在相距遥远的年份之间新商品并不重要,那我就不会与他所持的见解争论。正如他所认为的,如果是那样的话,在比较1900年和1920年时,我们的指数就应该直接依据这两年的价格和数量,而1910年的价格和数量(如果使用环比方法,会牵涉到它们)则是无关的,若采用它们,会造成误差。譬如,很容易看出,如果1900年的物价和数量状况在1920年完全重现,则用环比方法编制的指数很可能不会像应该的那样,给出与1900年相等的数字(参见《经济统计评论》,1921年5月,第110页)。但是,如果比如说1920年支出的一半花费在1900年没有的商品上,则环比比较法就不再是替代直接比较法的拙劣方法,而是能够采用的惟一比较方法。由于这一原因,我认为,总的说来,在编制一系列指数时,最好是采用环比方法,而不是相对于某一基年为每一年计算出一个指数。在没有新商品的情况下,争论将不分胜负,因为环比法只能在连续的年份之间得出完全正确的结果,而另一种方法——不变权数公式除外,由于其他原因,不能采用这种公式——只能在基年和其他各年之间得出完全正确的结果。但如果有新商品,天平将向环比数列倾斜。当然,如果建立了环比数列后,我们想对环比数列中的两个年份(不是连续的两年)作较为特殊的比较,如果在这两年之间“新商品”碰巧并未带来多大麻烦,那还是为此直接计算一个新指数的好,而不必使用环比数列。
[16] 米切尔教授写道:“制造品特别是消费品的缓慢变化,农产品价格反复无常的大幅变化,木材迅速上涨的价格等等,都是物价水平实际波动的一部分。……此种数据范围所受到的每一限制,都会使所得到的结果的重要性受到限制”(《美国劳工统计局公报》,第173号,第66~67页)。这话很正确,但千万不要以为制成品和这些制成品中所包含的原料都包括在内。
[17] 参见马歇尔,《当代评论》,1887年3月,第374页。
[18] 同上,第375页。并参看马歇尔,《货币、信用和商业》,第33页。
[19] 伍德夫人,《经济学杂志》,1913年,第622~623页。
[20] 《政治经济学教程》,第281页。
[21] 这个命题可以用反概率原理加以证明。如果有两个商品组合,一个的变化程度与所抽取的样本的变化程度相同,另一个的变化程度与所抽取的样本的变化程度不同,那么,从前者抽取样本的方法,就会多于从后者抽取样本的方法。所以,任何一个无偏见地从某一商品组合抽取的样本,其原样都要比其修改后的样子更可能正确地代表该商品组合。然而,必须承认,有个棘手的问题,就是一种商品若其价格变化与我们样本的主要部分很不相同,它是否应包括在我们的样本中。的确,计算实际的测量尺度时,有时应该省略“极端观测值”。在这件事情上应该怎么做,取决于先验的预期,连同我们的样本的一般形式,是否表明,抽取样本的原始分布服从某个已确认的误差规律。常常很难确定先验的预期是否表明了这一点。应该补充说一句,只有当我们的样本中所包含的商品数目很小时,省略极端观测值的实际效果才可能重要;而且正是在商品数目很小的时候,非常难于找到排除某些商品的充分理由。
[22] (敕令书,4032),第34页。
[23] J.M.凯恩斯,《经济学杂志》,1908年,第473页。
[24] 参见《指数的编制》,第211页及以下各页,第260页及以下各页。
[25] 《美国劳工统计局公报》,第173期,第23页。