第6章国民收入大小变化的量度_福利经济学-QQ阅读男生历史网

上QQ阅读APP看本书，新人免费读10天

设备和账号都新为新人

第6章　国民收入大小变化的量度

§1.前一章的讨论为我们提供了一个标准，使我们能够以这一时期或那一时期的观点，确定一个时期的国民收入是大于还是小于另一时期的国民收入。但是，为判断任何物品数量的增加或减少提供标准，并不等于提供了量度这些变化的方法。我们必须研究设计恰当量度方法的问题。

§2.以任一时期的观点判断，收入增加的标准是，根据该时期的偏好和购买力分布，对收入中所增加的物品的货币需求，大于对收入中减少的物品的货币需求，从中自然可以得出，我们应该用来作为增加的某种量度的是，以该时期的观点判断，对该时期的收入所包含的物品的总量的货币需求（即人们为获得这些物品而不是不拥有这些物品所愿意支付的这种意义上的货币量）超过对另一时期的收入所包含的物品的总量的货币需求的比例。这种量度将完全符合我们的标准。我们应该得出两个数据：一个数据给出以第一时期的偏好和分布的观点所判断的变化；而另一个数据给出以第二时期的偏好和分布的观点判断的变化。很明显，根据上一章所确定的标准，如果我们能够做到的话，则这就是我们应该采用的量度。

§3.然而，不幸的是，这种类型的量度完全不切实可行。在探寻的过程中遭遇到的一个事实成为最后的障碍，即对于任何时期收入中所包含的物品的总量的货币需求，根据以上解释的含义，是一个无法操作的概念。它所涉及的某一货币数量，可以通过加总以货币量度的来自于收入中所包含的每种商品的消费者剩余而得到。然而，正如马歇尔曾经说明的那样，用这种方式加总消费者剩余是一项艰巨的任务，部分原因是由于存在着互补商品和竞争商品，即使可以在理论上利用严谨的数学公式解决这些困难，但在实际中这些困难仍然是无法克服的。[1]即或抛开这些细微的复杂性，也仍然无法进行如此精细的量度，使其表述中不涉及收入中所包含的各种元素的需求弹性，或者更确切地说，不涉及相关的各种形式的需求函数。但在任何合理的时期内，我们都无法甚至不可能获得这些数据。需要使用这些数据的任何类型的量度都不得不予以放弃。

§4.循此思路作进一步探讨，我们很快就会得出结论，唯一有希望满足收入变化量度要求的数据，就是各种商品的数量和价格，除此之外别无可用。因此，如果我们的确要构建什么量度的话，那我们必须使用这些数据。我们的问题现在变成：如果有的话，以什么方式可以通过这些数据构建出一种量度，使之与上一章讨论的收入数量变化的定义相符合。为解决这一问题所作出的努力很自然地分为三个方面：第一，一般性的探讨，即确定如果所有与数量和价格相关的信息均可获得，那么哪一种量度与定义最相符合；第二，数学上的探讨，即通过我们实际可获得的有关数量和价格的样本信息，确定出切实可行的量度，使之与上述量度最为接近；第三，综合一般性探讨与数学探讨，以确定实际量度作为上述量度的指数具有多大的可信度。

§5.在着手解决第一个方面的问题，也是最为基础的一个方面的问题时，我们不得不立即承认，获得完全的成功是不可能的。根据上一章的定义，以某一时期的观点判断，在某一种偏好和分布的条件下，国民收入将以一种方式改变；而在另一种偏好和分布的条件下，国民收入将以另一种方式改变。为了符合这一要求，我们关于变化的量度必须是两个：一个数据表示以第一时期的观点判断的结果；如果两个时期的偏好与分布不相同，则第二个数据表示以第二时期的观点判断的结果。仅仅依据数量和价格建立起的量度不可能满足这一要求。因为，尽管我们可以掌握当偏好和分布为A种时，第一时期实际的数量和价格，以及当偏好和分布为B种时，第二时期实际的数量和价格，但我们却既不可能掌握当偏好和分布为B种时，第一时期实际的数量和价格，也不可能掌握当偏好和分布为A种时，第二时期实际的数量和价格。因此，我们能够指望的项多是获得一种不依赖于需要比较的每一时期中的偏好和分布实际状况的量度，只不过要求当收入的内容发生变化以及经济福利（以货币量度）增加时，不论偏好和分布的状况如何，只要两个时期的状况相同，则该量度将总是增加的即可。即使我们能够获得有关数量和价格的所有数据，也不可能仅仅依靠这些数据就构建出一种量度以比上述量度更接近于我们的定义；而且很明显，这种接近的程度是很低的。

§6.对于这一切有所理解之后，我们开始根据所有的数据构建一种量度——今后我们不妨称之为完全数据量度——使之尽可能接近前一段所明确的最新的想法。所需要的量度在以下情况应该表示为收入数量的增加，即不管收入的内容发生什么变化，以每一时期的货币为单位，[2]只要给定人数且偏好和分布不变的群组，对于所增加的项目的货币需求大于对于所减少的项目的货币需求即可；[3]或者换言之，在第二时期该群组所获得的经济满意感（以货币量度）超过其在第一时期所获得的经济满意感。当然不必要求，当超出的经济满意感（以货币量度）是E时，我们的量度表示为增加1％，而当超出的经济满意感（以货币量度）是2E时，则我们的量度应该表示为增加2％。这不仅是不必要的，而且在收入仅由一种商品所构成的特殊情况下，它甚至是不合理的。所要求的是，当超出的经济满意感（以货币量度）是E时，我们的量度应该表示为某种增加，而当超出的经济满意感（以货币量度）是2E时，我们的量度应该表示为比其为E时更大些的增加。这就是我们所构建的必须遵从的基本框架。问题是如何构建才能够最好地满足已经明确的目标。[4]

§7.我们想要比较在任意两个时期中的第一时期，给定人数的群组将其购买能力用于第一种商品组合，而在第二时期用于第二种商品组合的情况。当然，每种组合均不可对同一物品估算两次以上。也就是说，只包括向消费者所提供的直接劳务，例如，医生的劳务，最终消费品，当年生产的耐用机器的一部分，[5]但不包括体现于这些物品中的原材料和劳动，同时当然也不包括“有价证券”。在现阶段，让我们忽略这种可能，即在一种组合中，包括有新发明的商品，而在另一种组合中完全没有的情况。第一种组合，我们称之为C1，包括x1，y1，z1……个单位的各种商品；同时第二种组合C2，包括x2，y2，z2……个单位的相同的商品。这些商品的价格在第一时期设为a1，b1，c1……；而在第二时期，设为a2，b2，c2……。我们的群组的总量货币收入，在第一时期设为I1，在第二时期设为I2，则求证的结果如下：

第一，如果我们的群组在第二时期购买的各种商品与在第一时期的购买呈相同的比例，即是说，如果每一时期购买的商品组合的一般形式为C1，则在第二时期所购买的每种商品等于在第一时期所购买的每种商品乘以分式

第二，如果我们的群组在第一时期购买的各种商品与在第二时期购买的商品呈相同的比例，即是说，如果每一时期购买的商品组合的一般形式为C2，则在第二时期所购买的每种商品等于在第一时期所购买的每种商品乘以分式

以这些求证为基础，在一定的假设条件下，我们的问题可以部分地得到解决。

§8.如果在第二时期，一个购买组合形式C2，由以（x2，y2，z2……）为比例的元素所组成的某个人改变选择购买组合形式C1，则可以肯定地说，他的行为不致引起价格的变化，因此他可以按照价格a2，b2，c2……购买其新组合中的各项。类同的推论对于第一时期选择将组合形式C1转换为组合形式C2的某个人也成立。但是，当群组整体，或者我们更愿意说，当某个代表性人物以这种方式转变其消费时，就不能再假定价格不会受到影响了。如果在第二时期，该群组从组合形式C2转换为组合形式C1，让我们假定它必须支付的价格为a'1，b'1，c'1。同样，如果在第一时期该群组从组合形式C1转换为组合形式C2，则它必须支付的价格为a'2，b'2，c'2。在上一节结束时提出的假设是：{x1a'1+y1b'1+z1c'1+……}等于{x1a1+y1b1+z1c1+……}，以及{x2a'2+y2b'2+z2c'2+……}等于{x2a2+y2b2+z2c2+……}。这表明该群组在第二时期只要愿意，就可以购买组合C1，尽管由于它决定这样做使价格发生了变化，但就像它的决定并未引起价格变化以及它所能做到的一样，对于在第一时期的该群组可作出同样的推断。如果所关注的所有商品是在不变的供给价格的条件下生产出来的，则上述假设将与事实完全符合。在现实生活中，对于为数众多的商品来说，假设因受到消费的影响，其价格向上变动与向下变动大体上相互平衡是合理的，因而一般来说，我们的假设与事实大致相符。然而，必须记住的是，这一假设是以下所有讨论的前提。

§9.让我们首先讨论在§7中得出的两个分数均处于1的同一侧的情况，即二者或者都大于1，或者都小于1。如果二者均大于1，这说明我们的群组在第二时期，不管它购买的是C1还是C2，只要它愿意，就可以购买比第一时期更多的商品。于是，在第二时期它选择形式C2这一事实证明，它购买组合形式为C2的商品所产生的经济福利（以货币为量度），比其在第一时期所购买的组合形式为C1的商品可能提供的经济福利（以货币为量度）更大。[6]因此，可以进一步推断，它必将大于该群组在第一时期所购买的实际组合形式C1所产生的经济满意感（以货币为量度）。但是，由于偏好和分布没有发生变化，所以，在第二时期实际的组合C1所产生的经济满意感（以货币为量度）将等于第一时期实际组合所产生的经济满意感。因此，如果我们的两个分式均大于1，则一定可以得出在第二时期购买的组合C2所产生的经济满意感（以货币为量度）大于在第一时期购买的组合C1所产生的经济满意感。通过类似的分析，可以证明，如果上述两个分式均小于1，则与此相反的结论成立。因此，在这种情况下：

两个分式中的任何一个，或者处于二者之间的任何一数值，都将满足在§6中所建立的条件，即我们的量度满足了作为国民收入大小变化的一种标准的要求。

§10.因而，在以上情况下，我们设定的条件并未确定一种量度的选择，而只不过确定了这种选择必然所处的区间。此区间的宽度取决于两个分式之差的大小。在某些条件下，它们之间存在着几乎相等的关系。因此，在19世纪晚期，在英国人所增加的获得几乎所有重要的商品的能力中，主要的因素只有一个而且是同一个，即改进的运输；在制造业方面实现的主要的改进均是使运输工具更为廉价。在其他条件下，两个分数之差相当大。直接适用的例证也许可以找到。然而，我们必须对自己找到的一个例证表示满意，它并非来自于同一群组不同时期两种状况的比较，而是来自于两个群组同一时期状况的比较。这一例证仅在并非真实的假设条件下与当前的目的相关，即假定英国与德国工人的偏好相同，他们的购买仅仅由于他们的收入以及他们必须支付的价格之间的差异而有所不同。此例证取自于商务部关于德国城镇生活成本的报告。该报告指出，在报告形成时期，英国工人在德国的消费成本比在英国的通常高出大约1/5；同时，德国工人在德国的消费成本比在英国的通常高出大约1/10。[7]因此，如果以字母下脚标1代表英国的消费量和价格，而以字母下脚标2代表德国的消费量和价格，则

§11.虽然我们的条件在目前所考虑的问题的类型中，仅仅确定了收入变化的量度应该分布的两个区间，但是为方便起见，在此甚至可以考虑从可能的量度的无限多个的数据中明智地选出一个，虽然这样做有些武断。当我们从这种问题转向另外较为困难的问题时，需要在更为狭小的范围内作出武断的选择。有些时候，偶然会出现上述两个分式中其中一个大于1而另一个小于1的情况。很明显，它们都不能指出该群组所获得的经济满意感（以货币量度）业已变化的方向。让我们假设在第二时期，该群组后期收入所能支配的形式如C2的组合，比其前期收入所能支配的为大；而后期收入所能支配的形式如C1的组合比其前期收入所能支配的为小。在这种情况下，通常可以认定，如果分式

以很大的比例小于1，同时分式

仅以很小的比例大于1，则该群组所获得的经济满意感（以货币为量度）很可能已经减小；同时，如果实际的条件刚好相反，则其很可能已经增大。当一个分式与1之差仅以微小之比例大于另一个分式与1之差时，似乎可以得一个相似的推断，虽然不能完全确定。如果是这样，我们的群组所获得的经济满意感——均将理解为我们所说的以货币为量度的满意感——在第二时期可能减小或增大，将依据下述表达式

或者这一表达式的任一次方，或者依据其略有变形的其他公式是大于还是小于1而定。因此，基于这些限定条件所构建的任何分式，都可以满足我们量度所要求的条件。

§12.在本书的前几版中，通过直接分析对上述常识性的看法作出如下证明。如果

以一个很大的分数小于1，则表明如果我们的群组在第二年购买形式如C1的组合，其购买的每一项目均以一个很大的百分数小于在第一年中的购买，而且，因此——在偏好与分布没有改变的条件下——我们的群组所获得的满意感水平从一个很大的标准单位上来看将可能小于第一年的，设为K1。而事实上，它没有这样做，它在第二年购买形式如C2的组合，证明在第二年这种组合的购买所产生的满意感，与在第一年其他组合的购买所产生的满意感相比，不会小于K1。以相同的方式，如果

仅以一个很小的分数大于1，则说明，如果我们的群组在第一年购买形式如C2的组合，其购买的每一项目均以一个很小的百分数小于在第二年中的购买，而且——在偏好与分布不变的条件下——我们的群组所获得的满意感水平从很小的一个标准单位上来看将可能小于第二年的，设为K2。因此，在第二年实际购买的组合所产生的满意感，与第一年实际购买的组合所产生的满意感相比，不会大于K2。因为认定K1相对于K2更大，所以，产生于第二年的购买的满意感，要大于第一年的购买所产生的满意感；同时，更进一步地讲，因为这些不同方式中的任何一种发生的概率，显然与任何其他方式都同等，所以，产生于第二年的购买的满意感很可能小于产生于第一年的。似乎对我们来说，现在这种推理的过程以一种并不正确的方式取决于先验的概率，因此，有必要更认真地考察这种方式。为此目的，让我们设定：

q1代表第一时期的收入所能获得（并已获得）的C1组合的数量；

q2代表第二时期的收入所能获得的C1组合的数量；

r1代表第一时期的收入所能获得的C2组合的数量；

r2代表第二时期的收入所能获得（并已获得）的C2组合的数量；

同时，Φ（q1），Φ（q2），F（r1），F（r2）代表与这些实际的或潜在的购买相关的满意感的量值。

我们假定

之后，因为在第一时期，C1的q1优于C2的r1，故我们知道，Φ（q1）＞F（r1）。以同样的方式，我们知道，F（r2）＞Φ（q2）。进而从（1）中得出Φ（q1）＞Φ（q2）；并且从（2）中得出F（r2）＞F（r1）。

设定　　　　Φ（q1）=F（r1）+A

　　　　　　F（r2）=Φ（q2）+B

　　　　　　Φ（q1）=Φ（q2）+H

　　　　　　F（r2）=F（r1）+K

于是，A，B，H，K均为正值，再根据简单的转换，可以得到Φ （q1）－F（r2）=1/2（A－B+H－K）。在所有场合，如果q1/q2比r2/ r1大很多，则不等式（3）允许我们判定很可能H＞K。不过，我们无法知道A与B之值。所谓的非充分理由法则，并不能使我们从这种未知中引申出可能（B－A）＜（H－K）的结论。然而，只能借助于某些这类命题的帮助，使我们推断出很可能Φ（q1）＞F（r2）。对于我们常识性的观点，不可能存在一般性的证明。正确的是，q1/q2超过r2/r1越多，第二时期的满意感小于第一时期的满意感的可能性就越大；但是，我们无法列举有关第二时期的满意感很可能大于而非小于第一时期的满意感的任何相关数值。正如凯恩斯（Keynes）先生所说：“我们面对着一个概率问题，对于这一问题的任何一种具体情况，我们可能有相关的数据，但是在缺少这些数据时，这一问题则是无法确定的。”[8]

§13.如果这一结论是正确的，则可推出，当表达式

中，一个大于1而另一个小于1时，则二者之间不存在某一表达式，根据该表达式大于或者小于1，我们能够在一般的意义上说明我们的群组在第二时期所获得的经济满意感可能增大了或者减小了。然而，只要当我们的限定表达式都处于1的同一侧时，则可明确地判断出两个时期之间的经济满意感是增加了还是减少了。在这两个限定表达式之间，确定某一个而不是两个表达式实际上更为便捷。存在着无数个适用的中间表达式，在它们中间作出我们的选择，由于不存在更深层次的偏好，我们则可能像凯恩斯所说的那样，“合乎逻辑地受到出于对代数的优雅，算术的简洁，劳动的节省，以及在不同场合使用同一特定速记方法的内在一致性的考虑的影响”。[9]因此，我们建议使用价格指数中有关技术有效性的两项基本检验指标——当然因为我们寻求的量度乃是价格指数的倒数乘以货币收入变化的比例——欧文·费希尔教授已经使其引人注目。首先，选择的公式应该具有如下特点：“不论选择哪一点为基础，在对其中的一点与另一点进行比较时，它都给出同一比率。”[10]如果向前计算，它给出1910年的价格是1900年的2倍，则不应像所谓的索尔伯克（Sauerbeck）类型的非加权算术指数那样，当向后计算时，1900年的价格并非是1910年的1/2。其次，选择的公式应该满足费希尔教授所说的因素颠倒检验。“不论何时，存在着的任何交换物品的价格，都包含有其交换的，或生产的，或消费的，或其他形式参与的数量的意义，因此，一个价格指数的问题也包含有一个孪生的数量指数的问题……没有理由认为对于两个因素中的一个采用的某一公式，无法应用于另一个因素”。[11]因此，所选择的公式应该是，假设我们研究的所有商品总的货币价值在两年间从E变为（E+e），则应用于价格时该公式给出价格向上的变动，从P变为（P+p），而应用于数量时该公式给出数量向上的变动，从Q变为（Q+q），即

除了要与这些检验相一致以外，我们还可能适当地要求我们的量度在结构上是简洁的，在处理上是方便的。这些不同的考虑归结为一点，整体上看，公式

作为变化的量度最能满足我们的目标。这一表达式中I2/I1右侧的部分是价格指数形式的倒数，费希尔教授将其归为对一般性美德的第一份奖赏，并建议称之为“理想指数”。[12]

§14.到目前为止所讨论的公式，像限定公式以及区间公式，均建立于潜在的假设之上，即没有考虑仅包含于组合C1或C2中，而又不同时包含于这两种组合之中的商品。因此，如果一种商品适用于在任何两年中的一年所购买，而不适用于另一年所购买，则这种商品在它被购买的那一年所产生的满意感将被这些量度完全忽略掉。因此，到目前为止，如果在相互比较的两个时期之间引进新商品，则这些量度是不完善的。这一点很重要。因为新的商品，从与此相关的意义上讲，不仅仅体现在商品的新的物质方面，而且也体现在作为原有的商品在新的时间或空间上的可获得性方面。例如，十二月中旬的草莓，或者由于铁路向印度部分地区的延伸所引入的该地区以前从未见到过的小麦。很明显，我们不应该将十二月中旬的草莓与普通草莓同样计量，并因此对草莓进行虚构，迫使草莓价格上升，而必须认识到，十二月中旬的草莓是一种新的不同的商品。但是因为新的商品在初次引进之后的相当长的时间里，很少在任何群组的消费中占有重要地位，所以在对较为接近的两年时间进行比较时，由此所产生的不完善性就不可能非常严重。忽略新商品的存在，将我们的计算集中于老的商品，使我们的结果失效的风险并不是很大。但是，当相互比较的两年相隔很远时，在前一年中根本不存在的许多商品都需要在后一年中予以考虑，作为国民收入变化大小的一种量度（根据上一章的定义），忽略新的商品，将变得几乎毫无价值。[13]因此，除非找到把这些问题都考虑进去的某些方法，否则对于相隔较远的两个时期进行比较的想法，很可能不得不放弃。不过，由马歇尔设计的链式法成为摆脱这种困境的适用的方法。[14]根据这种方法，以两年中均适用的商品为基础，在对1900年和1901年的价格水平进行比较时，忽略在1901年引入的新商品以及退出的老商品，然后再比较1901年与1902年的价格水平时，将计算1901年引入的新商品，但忽略1902年的商品，依此类推。于是，我们不妨假设1901年的商品价格相当于1900年的商品价格的95％，1902年的商品相当于1901年的87％，1903年的相当于1902年的103％，等等。以此为基础，我们构建出一个链条，并将1900年的商品价格设定为100，根据上述数字，相应的链条为：

当把这些价格指数的倒数，显然它们构成了1英镑的购买力指数，引入我们关于国民收入的量度时，我们获得了对于相隔较远的年份进行一系列阶段的链条式的比较的一种工具，它比任何直接进行的比较都有效。假如我们无法构建出任何一种量度的标杆，且能够把它携带至100英里之外而保持形状不变，则就无法对于1 000英里之外的树的高度进行直接测量。可是，将第1英里处的树高与第100英里处的树高相比较，再将第100英里处的树高与第199英里处的树高相比较，并不断进行下去，就有可能完成间接的比较。[15]的确，必须承认的是，如果在链式法的一系列的单个的比较中，每一个都确定地包含有一项小误差，而且在大多数情况下，这些误差具有相同的方向，则相隔较远的年份之间，累积误差将会很大。如果人们忘记如何制造目前正在使用的物品的可能性，与发明新物品的可能性的程度相当的话，则不大会出现大的累积误差。但是我们知道，事实上，创新扩展的伟大历程并非以这种方式得到补偿。由于通过链式法引入的误差可能先验地具有确定的一个方向，这样，如果对于相隔较远的两个年代之间，这种方法给定英镑的购买力同等，则很可能英镑实际上在后面一年中比在前面一年中，给偏好一定的具有代表性的个人所带来的满意感更大些。于是，如果我们的链式量度得出1900年英镑的购买力指数为90，而得出1920年的指数为100，则尽管同时有大量的新产品被推出和大量的老产品遭淘汰，但我们仍然可以有把握地推断，在§5中所设定的条件下，1920年的1英镑为我们的群组所带来的经济满意感的指数比1900年更大。不过，如果这些指数的顺序颠倒了，则我们就不能以同样的把握作出推断——的确，除非指数减小得非常明显，我们就不能以任何确定性作出推断——1920年的1英镑所带来的经济满意感的指数比1900年的为小。

§15.现在我们转向本章第二个主要的问题。如果我们的选择具有完全的自由度，则我们应该选择§13中的公式。但是，实际上我们却无法采用这一公式。因为要构建它，需要获取实际上从来都无法满足的大量的信息。于是，有必要依据我们可能获取的信息构建出一个模型，或者代表性量度，使之尽可能地接近该公式。我们的充分数据量度，除去其代表收入变化的乘数I2/I1之外，由两部分构成： C1组合价格变化的倒数（包含有等于x1，y1，z1……的不同商品的数量），以及C2组合价格变化的倒数（包含有等于x2，y2，z2……的不同商品的数量）。因此，我们近似的量度也分别由近似地代表C1和C2价格变化的两部分所构成。但是，如何利用样本收集方法才能较为理想地获得这些近似值呢？

§16.不论我们所关注的商品的组合为何，它或者是由常人，或者是由工匠，或者是由劳动者，或者是由任何其他的人群在任何时间所购买的，它最好包含从若干不同的群组中选取出来的商品，它们价格变动的一般特征互不相同。一个好的样本组合，应该包含进入国民收入或者我们正在努力量度的那部分具有不同特点的所有群组的代表性商品。[16]然而，遗憾的是，实际上的考虑使得这些应该予以满足的要求无法实现，而且甚至有必要求助于自身并不进入普通人购买的范围，而是商品的原材料的一类商品，例如小麦和大麦。因为我们能够观察到其价格，并能将其归入到我们的样本组合中的范围之内。

第一，除去一定大量流行消费的商品之外，很难掌握对消费者索取的零售价格。吉芬（Giffen）曾经对此深有体验，他说道：“事实上，发现只有在大型批发市场上交易的那些主要商品的价格可以使用。”根据商务部以及前食品部关于食品零售价格的研究，现在有必要对这种说法进行修正，不过，它仍然在相当大的范围内是正确的。因此，尽管获取零售价格的困难可以克服，但这些价格依然不适用于连续年份的比较。因为在被定价的商品中往往包含着不同比例的零售商与运输商的劳务，所以，一个时期内的该种商品与另一个时期内的该种商品不同。“在海鱼只有在海边才可以买到时，它的平均价格是低的。现在火车使其可以销往到内地，它的零售价格中就包含着比以前高得多的运输费用。作为一项规则，应付这种困难的最简单的方法是采用其产地的批发价格，并允许充分考虑商品运输、人员、信息传播以及最重要的事项所分摊的费用”。[17]

第二，即使采用制成品的批发价格也存在很大的问题。因为虽然它们的名称未变，但是其特点和质量一直处于不断地变化之中。斯第尔顿干酪曾经是双层奶油的，但现在为单层奶油干酪。不同酿造年份的红葡萄酒并不等价。火车车厢的三等坐席现在与四十年前大不一样。“一座平均有十居室的房屋很可能比以前的空间大了一倍，而且很大一部分成本缘于较早的房屋所不具有的水、煤气以及其他家用设施”。[18]“在最近十二年间，得益于更为科学的解冻与冷冻的方法，在英国销售的外国羊肉的质量稳步提高；另一方面，外国牛肉的质量却在下滑，因为北美洲的供给实际上已经终止，取而代之的则是来自于阿根廷的质量较差的产品”。[19]在试图评价许多直接劳务时遇到了类似的困难——例如医生的劳务，正如帕累托所明确指出的那样，比棉纺织业吸收了更多的消费开支[20]——因为这些劳务，虽然称谓未变，但其实质已经发生了变化。

于是，适用于观测的主要物品似乎是——虽然必须认同可用于更广泛观测的权威的加拿大指数以及美国所采用的多个指数——批发市场上，尤其是大型的世界市场上的原材料。这些物品——当然战争除外——近年来在价格上相对于运输成本占很少部分的小件物品已经下降，相对于人工劳务部分也已下降，而相对于制成品的部分已经上升，因为实际的制造工艺业已改进。从我们的样本中淘汰出去的项目之间的相互补偿的可能倾向，使这种淘汰因未发生相互补偿所产生的影响得到缓解。当然，相对于真实量度的近似值也在相同程度上出现偏差；同时，几乎可以肯定的是，因为原材料的价值通常在制成品的价值中仅占有很小的比例，所以原材料价值50％的变化，可能只引起制成品价值5％的变化，这将赋予所发生的波动以夸张的表象。

我们刚刚所谈到的并不包括我们无力解决的全部问题。因为用于表示若干“组合”的样本的清单，并非只是单纯的价格，而是乘以购买数量的价格，而我们关于数量的信息甚至比关于价格的信息还要有限。很少有关于家庭生产的商品的年度产量记录——也缺乏年度购买记录。进口数量的确有记录，可是没有多少重要的物品是完全通过进口获得的。当然，出于某种目的可以求助于典型的开支预算进而将这一困难予以转换。这就有可能形成特定人群对于某些主要物品平均购买的粗略概念。但是，这一方法仍然没能比粗略的平均数据提供更多的信息。它不能使我们区分不同物品之间的数量，这些物品包含于代表非常邻近的不同年份的组合之中。

§17.下面，让我们假设到目前为止这些困难均已克服，包含所有相关时期的价格和数量的样本已经建立。下一个问题则是确定价格应该如何予以“加权”。根据初步判断，权重似乎自然应该与提取样本的组合中所包含的若干种商品的数量成比例，但是，至少在理论上，有时可以对这种方案加以改进。因为我们已经掌握信息的某些商品可能与未包括在内的某些商品相互关联，它们的价格通常以相同的规律而变化。这些商品既是其他商品的同时也是它们自身的代表，故可赋予它们适当的大于其自身应得的权重。因此，理想的情况是，如果我们拥有少数几种商品的信息，而每种皆取自商品的不同的群组，各群组中的商品又具有相近的品质，则妥当地赋予我们的样本商品的价格以权重，使之不是与其自身的重要性成比例，而是与其所代表的群组的重要性成比例。然而，这一点在实际上难以操作。可能有一些商品其代表性品质非常明显，可以正确无误地赋予它们已经修正的权数。但是，我们很少拥有足够的知识以实施这种差别对待。就目前的情况来看，使用我们的样本，一般来说就是最好的方案，它在实际上是适用的。[21]因此，C1组合价格变化的充分数据量度应为

对此最佳的适用的近似值应为

这里的项目数限定为样本中包含的物品数。继而可以推断，对于§13结束时建立起来的关于收入变化的充分数据量度最佳的近似值应为

§18.事实上，正如已经暗示过的那样，我们通常无法寻求一个合理的物品的样本，对于这一样本，在我们所要比较的两个时期（或地区）中，每一时期（或地区）所购买的相同物品的数量为已知。在这样的情况下，我们可能不得不使自己满足于这样一个样本，即在样本里我们所比较的年份中只有一年的数量是已知的。为此，我们不得不将我们的公式截短，并采用如下形式

这就是英国商会在生活成本指数中所采用的类型的公式（倒置的）。毋庸置疑，这种截短的样本不如完整的样本。不过，费希尔教授的研究表明，这种样本给出的结果与完整样本给出的结果并无非常大的偏差。因此，我们无须挑战一个非常难以回答的问题，即是否不存在建立于相同数据之上的某些其他公式，可以给出对于完整样本来说更为接近的近似值。

§19.然而，此时有必要说明存在于上述公式与诸如索尔伯克的所谓的“未加权”指数之间的确切关系是什么。在这种类型的指数中，以某一年或平均若干年作为基础，基年或者基期的所有商品的价格都定为100，而其他年份的价格则当做100的适当的分数。如果基年的实际价格为a1，b1，c1，而另一年的实际价格为a2，b2，c2，则对于另一年来说英镑的购买力指数应为

当且仅当上节给出的公式中的x，y，z……之值与，，111……成比例时，此表达式才与上一节的公式等价。即是说，索尔伯克的公式测算某一组合的总价格的变化，而构成该组合的每种商品的数量在基年或基期的销售额均为100英镑的同一倍数。事实上，这些数量恰好就是基年或基期实际的销售数量的可能性非常小。因此，只有在极其偶然的情况下，按索尔伯克方案构建的以任何给定的年份或时期为基础的公式，才能与按上一节的方案构建的、打算表现在基年或基期实际销售的组合总价格方面所发生的变化的公式相互一致。

§20.综上所述，还可得出一个明确的推论。我们已经看到基于索尔伯克方案的指数以任何年份或时期R为基础，它量度某一组合总价格的变化，构成该组合的每种商品的数量，在年份R均值为100英镑。结果是，当基期由年份R1转换为年份R2时，一般来说要量度其总价格变化的该组合将发生变动。由于被量度的物品不同，所以估计将会获得不同的结果；并且目前也没有理由怀疑，为什么结果不应该不同。以R1为基期的某一指数表示货币购买力的升高，而以R2为基期的相似的数字（索尔伯克形式）表示货币购买力的降低。因此，当我们必须面对只有两种商品的情况时，如果一种的价格加倍，而另一种的价格减半，则这种形式的指数如以第一年为基年，则表示两种价格总体升高25％；如以第二年为基年，则将表示总体价格降低20％。在商会有关分别考察英国和德国城镇生活成本的出版物中，许多表格对这种类型的偏差提供了极好的实例。在蓝皮书中，利用指数计算伦敦、米德兰和爱尔兰的实际工资，其中以伦敦为基础（与我们的时间指数相对应，比如说，以1890年为基础），并将那里现行的消费价格和租金价格均定为100。根据这种方案，分别赋予消费及租金价格4与1的权重，商会发现伦敦的实际工资与米德兰的相同，但比爱尔兰的高3％。然而，如果以爱尔兰为基础，则实际工资指数伦敦是98，米德兰为104，爱尔兰为100。同样的困难出现于有关德国城镇的蓝皮书中。以柏林为基础，商会发现除一个城市以外，柏林的实际工资比其他任何地区的都高。[22]“如果不以柏林而以北海港为基础，柏林就会排在第四位而不是第二位，其他地区的排序也将发生变化；同样，以德国中部为基础，排序甚至会受到更大的影响”。[23]当然无须怀疑的是，这种类型的大的偏差可能不大会发生，除非存在着极大的偏差，或者在不同的时期对具有大的偏差的消费价格赋予很大的权重。不过，这种事实虽然实际上很重要，却与我们目前的讨论无关。

§21.很可能在某些情况下，我们对想要比较的年份中的任何一年的数量都所知甚少，而且无数据可供猜测，因此不得不退而求其次，依据根本没有任何权重的价格关系的样本，确定我们量度中所涉及的价格指数。在这些情况下，前面的讨论非常明确地说明了一件事，即我们一定不要用索尔伯克的方法，以简单的算术平均值结合价格关系来构建我们的指数。如果采用简单的几何平均值——如果我们商品中任一价格接近于零，则这种方法不适用；——或者采用价格关系的中位数，则可避开因方法产生的困境。费希尔教授对于这两种方法的比较优势进行过饶有趣味的讨论。[24]当可以得到公式所需要的数据时，这两种方法显然都不如§18中所提出的加权公式。

§22.在结论中，我们还必须考虑各种实际量度的可靠性，这些量度均可以作为充分数据量度的代表。首先，让我们假设我们可以获取像充分数据量度那样的具有相同的一般形式的样本，包括对于我们想要比较的两个（或者所有）时期都适用的数量以及价格。这时，我们可以得出五项一般性的结论。第一，当样本是从充分数据组合中的最重要的商品集中中抽取出来的时候，它体现了典型的价格变动，则我们的量度可能具有的误差将比样本取自于非代表性商品时的为小。第二，当样本很大时，即与样本中所包含的项目相关的开支占我们的群组整个组合的总开支的很大一部分时，则可能的误差比样本小时更为小。第三，如果构成充分数据组合的每个项目均单独地承担了组合总开支中的一小部分，则可能的误差比某些项目单独承担总开支的很大一部分时更为小。第四，当样本中包含的项目离散程度小时，即我们比较的年份之间的各种价格变化程度非常相近，则可能的误差比项目的离散程度大时更为小。依据这种考虑可以得出，在不考虑§14中提及的新商品的困难的条件下，与年代相隔很近时相比，当年代相隔很远时，我们的量度可能发生的误差值将会很大。究其原因，正如米切尔教授在对事实进行广泛观察的基础上所证明的那样，在相邻两年之间批发价格变动的分布是高度趋中的，——比误差的正态分布本身还要趋中，——可是，在相隔很远的两年之间，其变动的分布则是高度离散的。“某些商品连续的价格变动在若干年间每年都显示出明显的持续向上的趋势，其他商品则存在着一直向下变动的趋势；还有一些商品，则无确定的长期趋势可言”。[25]最后，如果我们无法获取与我们的充分数据量度相同的一般形式的样本，而不得不满足于§18中所描述的截短的样本的时候，则我们的量度的可靠性当然比获取较好类型的相同分布的样本时更为差。如果我们必须面对全然没有数量的局面，则只好使用简单的几何平均值或者价格关系中的中位数，这时的量度也具有较差的可靠性。不过，有必要指出的是，当我们所比较的年份之间的价格变动具有很小或者中等的离散程度时，使用某种不良的指数公式对可靠性造成的损害，也像使用小样本所造成的损害一样，是不会非常大的；但是，当这种离散程度很大时，则这种损害会变得更大了。

[1]《经济学原理》，第131～132页，脚注。

[2]对于这些词句尚需考虑的问题是，事实上如果我们群组的总的货币收入改变了，则第二时期的“英镑”将不再等同于第一时期的“英镑”。

[3]也许有必要用符号将先前用语言表述的内容再演示一下，任何商品的需求线的函数设为p=φ（x），则对于所增加的h个单位的货币需求不是（x+h）φ（x+h）－xφ（x），而是。

[4]欧文·费希尔教授在其卓越的研究著作《指数编制》中，也采用该观点编制这种量度，使之在绝对意义上是正确的，而不仅仅要求它给出一种与为我们想要的量度所服务的特定目标相和谐的量度而已。在检验许多不同种类的指数之后，他发现，当那些在技术上具有缺陷的指数被删除之后，剩余的指数，尽管是由多种不同的方案所确定的，却给出了大致相等的结果。于是他总结道：“就人力而言，指数是一种绝对精确的工具。”（第229页）。现在，使用不同的方法得出的结果之间的一致性，说明在什么地方一定存在着绝对正确的结果，使得这些指数都与之相近似。不过，迄今为止就我们所能看到的，还不存在接受这一玄奥观点的实实在在的基础。不妨以确定一组树的平均高度所设计的量度作为类比。很容易确定它们高度的算术平均值、几何平均值或任何其他平均值。在很多条件下，所有常用形式的平均值都将给出十分相近的结果。但是，没有证据可以证明在天堂中隐藏着一个与所有结果均不相同的平均值，而且从绝对意义上说，比任何一个结果都更精确更真实。存在着一个真实的算术平均值，一个真实的几何平均值，一个真实的调和平均值；不过，在绝对意义上正确的原始平均值的概念，在我们看来，有如一种幻觉。当我们想要达到某种特定的目标的时候，最好问：算术平均值或者几何平均值是否可以最好地满足我们的目的？如果这两个平均值恰好非常接近，那我们将十分满意。因为对于我们来说，出于偶然而选择了一个错误的情况，不大可能发生。不过仅此而已，我们并不能再多说些什么。但是有理由相信，当费希尔教授声称对于计算价格指数公式的选择与寻求的目标无关时，他一定比我们更狭义地使用了目标这个词，并且不会不同意我们在此处的言论。

[5]为了与第3章给出的国民收入的定义相吻合，这样做是必要的。我们定义收入只包括当年实际上消费的物品，而机器不包括在内。根据我们的定义，我们应该严格地将所有新机器和厂房超过维持资本完整无损之所需以上的部分，减去当年这些机器和厂房在生产消费商品过程中的损耗，然后将剩余的价值包括进去。

[6]这一推断以及据此得出的结果，取决于下述条件，即我们的群组能够以现行价格购买它在此价格下想要购买的任何商品的数量。当官方制定最高限价时，人们的购买或者由于配给过程，或者由于在这些价格下没有足够的商品满足需求将会受到限制，这一条件当然是无法满足的。在大战期间，由于法定价格经常偏离实际价格——至少在德国是如此，使得情况变得更为复杂。

[7]《白皮书4032》，第7页和第14页。

[8]《货币论》，第一卷，第112页。

[9]同上，第118页。

[10]《指数的编制》，第64页。

[11]《指数的编制》，第72～74页。

[12]同上，第242页。

[13]同样的考虑认为，“新的商品”，或在这种情况下，不如说不同的商品的存在，在对相距遥远的两个区域进行比较的过程中，比对邻近的两个区域进行比较，将变成更为严重的问题。因为相距遥远的两个区域中（例如赤道与极地）的一个区域所购买的一些商品，在另一个区域不被了解的可能性要远远大于相邻的两个区域。在相距遥远的区域之间，理论上可以运用将要介绍的以中间区域作为链条的链式法，不过，这种比较方法实际上很可能是无法使用的。

[14]参看马歇尔的论文，《当代评论》，1887年3月刊，第371页等等。

[15]在我们看来，似乎费希尔教授对于链式法的这一方面并未给予充分的考虑。如果相隔较长的年份之间没有新商品需要考虑，或者新商品并不重要，则我们不应该再质疑他的立场。正如他所说的，在比较1900年和1920年时，我们的指数应该直接根据1900年和1920年的实际价格和数量进行计算，而与1910年的实际价格和数量是不相关的，如果采用链式法，则将包括1910年的数据，并因此成为出现错误的一个根源。例如，很容易看出，如果1920年完全重现了1900年有关数量和价格的状况，采用链式法得出的指数，很可能不符合1920年的指数应该等于1900年的指数的情况（参看《经济统计学评论》，1921年3月，第110 页）。不过，假设在1920年用于商品的开支中有一半在1900年的开支中并不存在，则链式法就不再是直接比较法的拙劣的替代品了，它乃是有可能完成比较的唯一的方法。出于这一理由，我们认为在创建一系列指数时，从整体上最好采用链式法，而不采用相对于某一（相同的）基年，计算每一年指数的方法。当不存在新商品的情况时，这个问题可以得到平衡，因为链式法只能在连续各年之间给出完全正确的结果，其他方法——不变权重公式除外，它因其他原因而未被采纳——只能在基年与其他各年之间给出完全正确的结果。不过，有关新商品的争论，使得天平向链式系列倾斜。当然，如果已经构建出了一个链式系列，则我们希望对它所包括的两年之间（而不是连续各年之间）进行更为具体的比较，而且如果在这些年之间，新商品的问题恰好又不很突出，则为此目的直接计算出新的数据，以不采用链式法将会更好些（有关费希尔观点的比较，见《指数的编制》，第308页等等）。

[16]米切尔（Mitchell）教授写道：“特别地，制成品与消费品价格的呆滞，农产品价格的波动多变，木材价格的急剧升高，等等，都成为对于一般价格水平变动所产生的影响的重要组成部分……对于数据范围设定的每种限制，都将转化为在结果显著性方面的某种局限。”（《美国劳工统计局公报》，173号，第66～67页）这是相当正确的观点，但是一定不要将其理解为制成品以及转化为样本制成品中的原材料都应包括在内。

[17]参看马歇尔：《现代评论》，1987年3月，第374页。

[18]参看马歇尔：《现代评论》，1987年3月，第375页；以及马歇尔：《货币、信用和商业》，第33页。

[19]伍德女士：《经济期刊》，1913年，第622～623页。

[20]库尔斯德：《经济政治学》，第281页。

[21]这种推断可以利用逆概率法则予以证实。将以一定程度变化的样本，从以相同程度变化的完整的组合中抽取出来的方法，多于将该样本从以不同程度变化的组合中抽取出来的方法。因此，任何无偏差地取自于任一组合的给定的样本，到目前为止，均比经过任何修正过的样本，似乎更能正确地代表该组合。但是，必须承认的是，价格变动与我们的样本主体非常不同的商品是否应该包括在内的问题，是一个棘手的问题。删除“奇异的观测值”，有时在实际测量的计算中被认为是理想的。如何处理这种问题，取决于与我们的样本相关的事先的期望值是否表明抽取该样本的初始分布遵从某种特定的误差规律。当然常常很难确定这一点。还应该说明的是，只有当我们的样本中的商品数量很少时，删除奇异的观测值的实际作用才可能是重要的；而正是由于商品数量很少，供确定进行删除的充分的背景条件也最难以获得。

[22]《白皮书4032》，第34页。

[23]凯恩斯：《经济学季刊》，1908年，第473页。

[24]参看《指数的编制》，第211页等，以及第260页等。

[25]美国《劳工期刊》，第173号，第23页。

第6章 国民收入大小变化的量度

第6章　国民收入大小变化的量度