1.3 统计学的分类
统计学的内容,分成两大类:描述统计(descriptive statistics)与推断统计(inference statistics)。描述统计是探讨总体数据的性质或样本数据的性质,是将数据加以组织分析,并且用图形或数值(指标)表达一些现象,描述某些关心的主题,例如:集中代表值、离散程度或分布形态。指数和时间序列归类在描述统计中,主要是将历史数据整理成一个信息(变动比率、趋势值、季节值等指标)。至于时间序列的回归预测,应该属于推断统计的范围。
探讨总体与样本之间性质的另一方向是推断统计:利用样本数据,加上推论或归纳,得到总体未知参数的估计或检验。推断统计是利用概率分布的理论以及估计、检验、预测等方法,利用抽样的有限数据,来归纳或推断总体的一般性质。在工程、医学、管理等领域,或在日常生活,我们都无法掌握完整的信息,来知道事实的全部真相。我们都是利用有限和不完全的信息在做决策与推论。所以推断统计是,以有限的信息,来了解与处理,周遭的不确定事件,或者是已经存在但未知的事实(总体参数)。
在描述统计和推断统计之间,表演串场的角色的是概率理论。概率理论是:总体参数已知,利用演绎或仿真,得出样本或事件(总体的部分集合)的概率,再利用随机变量,定义概率分布函数,于是有抽样统计量的概率分布,然后再应用到推断统计。
统计学分类的关系说明如下:(第6,7章的统计量对应第2章的指标公式。)
■ 总体标志、变量数据、尺度指标、参数、表格、图形(第2,15章描述统计)。
■ 总体+已知参数概率、随机变量、概率分布、抽样统计量(第3~6章概率理论)。
■ 样本数据统计量估计、检验总体参数或因果关系(第7~13章推断统计)。
另外,统计学又分类为理论统计和应用统计。理论统计是概率理论和数理统计,数理统计学则是讨论应用统计背后的理论基础的学科。应用统计有描述统计和推断统计,是应用在各学科的统计学,例如商业统计、生物统计、农业统计、社会统计等。
图1.3是统计学的内容分类和《中文统计》菜单。
图1.3 统计学的内容分类和《中文统计》菜单