1.1 统计是什么
统计作为一门科学是从17世纪开始,起源于国情调查,有政治算数学派、国势学派以及古典概率学派,近代统计学演进到社会统计学派和数理统计学派。现在,统计应用在各个领域:管理、工程、医学、农业、经济、社会、生物、气象、军事等各学科。
统计一词,包括:统计工作、统计数据和统计学。本书的重点是统计学。
■ 统计工作:统计的实践,应用统计问题,统计设计、搜集、整理、分析。
■ 统计数据:统计工作获得的各种相关数据和信息,没有数据,就没有统计。
■ 统计学:统计理论、分析数据、选择分析模型、了解计算结果、获取信息价值。
应用统计最多的领域是管理,但是文、理、工、商、医、农、政、经、社、法、军等各学科,都是广义的管理。
管理大师杜拉克和质量大师戴明说:“如果你不能测量,你就不能管理”(If you can’t measure it, you can’t manage it.)。因为没有测量产生数据(data),就没有管理。有测量过的,才能管理。
上一句话反过来说:“你管理过的,一定要衡量”。管理过的衡量是评估绩效,例如:营销广告的绩效、信息系统的绩效、研究发展的绩效、投资的绩效等等。
所以,管理要根据数据进行绩效衡量:是否达到目的?是否产生价值?
人们对于“统计”有好几种看法。有人认为统计是平均数、成数、表格和图形。有人认为统计是处理信息的程序和方法。有人说统计是以部分(样本)推论全体(总体)。还有人认为统计是对付与思考那些不规律发生的样本数据和不确定性的概率事件。也有人称统计是有关决策的科学。这些说法都对。
根据系统理论,一般系统有投入、处理、产出以及目标。因此,可以从统计的投入(input:不规律发生的样本数据和不确定性的概率事件),处理(process:推论、程序和方法),产出(output:平均数、成数、图表),以及目标(objective:决策的科学)的观点来看统计。
数据或资料(data)是投入,信息(information)是比较有意义或增加决策价值的产出。
统计学最主要的用途是:叙述已知(抽丝剥茧)与推论未知,以做出决策。统计学包括:(1)收集数据(定义变量、实验或调查);(2)表达数据(表格、图形、可视化);(3)将数据处理为信息(百分比、平均数);(4)思考概率问题;(5)获得结论、预测或决策(以样本推论总体之估计、检验、因果、关系)。
统计学的目的有四个:
■ 了解现象:描述统计是了解数据的呈现与性质,如集中趋势的代表值或变异程度的离差值;时间序列和指数是了解变化因素和幅度。
■ 推测总体:统计检验和估计是推测总体。
■ 知道因果:两总体检验、方差分析、回归分析是知道因果。
■ 预测未来:时间序列是预测未来。
例题1.1 是否新的可口可乐味道比较好?(了解现象,推测总体)
在1985年,可口可乐公司宣布,更改他们从1886年以来制造可乐的秘密配方。当新的可口可乐上市,《消费者报导》希望解答下列问题:是否新的可口可乐味道比较受欢迎?它跟对手百事可乐的味道比较又如何?消费者报导的研究人员找来95位同仁,分别尝试三种可乐,而杯子未注明品牌,让他们说出哪一杯味道比较好。结果是:研究人员的百事可乐和新可口可乐的偏好差不多;研究人员对前两者比对旧可口可乐的偏好多出一倍(2比1)。以上结果和新可口可乐刚上市的市场反映不同,市场反而不大能接受新可口可乐,旧可口可乐在很多地区销售量还远大于新可口可乐。
例题1.2 每周工作超时,中风风险大增?(知道因果)
2015年8月20日,英国权威医学期刊《刺胳针》(The Lancet)刊登伦敦大学流行病学专业的基维马吉教授根据17份研究调查得出的结论,该研究涵盖528名男性和908名女性、样本追踪平均时长达7.2年,考虑吸烟、饮酒和身体活动程度等因素,研究工作时数与中风风险增加概率的关系。
研究发现,比起每周标准工时(每周工作35到40小时)的人,那些每周工作41到48小时的人中风风险高出10%,每周工作49到54小时的人风险更是大增27%,而每周工作55小时以上的人中风风险增加33%。研究也发现,即使考虑包括年龄、性别和社会地位在内的其他风险因子,长工时也提高罹患冠状动脉心脏疾病的风险达13%。
例题1.3 二手烟是否对不吸烟者有害?(知道因果)
1980年,美国加州大学圣地亚哥分校做了一个肺功能试验。这个试验分别检查了200位不吸烟的中年人,他们通常处于不吸烟的环境;以及另外200位不吸烟的中年人,但是20年来,他们经常在吸烟的环境下工作。将这两组人的肺功能同时和吸烟者的肺功能比较。试验结果是:吸二手烟和不吸二手烟的不吸烟者,在肺活量与吐气率两方面无显著差异;但是在肺部的细微呼吸方面,吸二手烟者比不吸二手烟者,肺部有显著的损害。这个研究建议:长期暴露在二手烟的环境,对健康是有害的,会显著降低肺部的细部呼吸的功能。
例题1.4 民意调查可靠吗?(推测总体、预测未来)
1936年,美国总统大选,共和党的蓝登(Landon)对上民主党的罗斯福(Roosevelt)。文学文摘(Literary Digest)根据其读者名册、电话号码簿(当时只有1/4家庭有电话)、汽车注册名单、杂志读者名册和俱乐部会员名单,寄出1000万份问卷,回收230万份,预测蓝登以57:43胜罗斯福。同时一个叫盖洛普(George Gallup)的年轻人只抽样了5万人,预测罗斯福会赢,盖洛普被嘲笑太天真,因为样本量太少。结果,罗斯福赢了,得票率62%!(文学文摘不久因此破产了,盖洛普则成为专业的民调专家。)时至今日,民意调查的样本量,只要一两千个样本量,就可以推测千万人的总体参数,数万样本可以增加的准确度很少。
1948年,美国总统大选,共和党杜威(Dewey)与民主党杜鲁门(Truman)竞选总统。选举前,盖洛普民意调查(Gallup Pool)显示,共和党的杜威领先。1948年11月3日芝加哥论坛报刊登出一个惊人的标题“杜威击败杜鲁门”。杜鲁门反而拿该报纸造势,争取同情票,结果扭转乾坤,杜鲁门赢得选举,当选总统。但是在1948年11月3日,是否真的是:杜威领先杜鲁门,也无从查证(这就是未知的参数)。