第1章 导 论
1.1 知识要点总结
一、统计学
1.统计学
统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
数据收集也就是取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。
2.数据分析所用的方法
(1)描述统计:研究数据收集、处理、汇总、图表描述、概括与分析的统计方法;
(2)推断统计:研究如何利用样本数据来推断总体特征的统计方法。
二、统计数据的类型
1.分类数据、顺序数据、数值型数据(按计量尺度不同分类)
(1)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的;
(2)顺序数据:只能归于某一有序类别的非数字型数据,用文字来表述。顺序数据虽然也表现为类别,但这些类别是有序的;
(3)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。
关系:分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因而也可统称为定性数据或称品质数据;数值型数据说明的是现象的数量特征,通常是用数值来表现的,因此也可称为定量数据或数量数据。
2.观测数据和实验数据(按收集方法分类)
(1)观测数据:通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的;
(2)实验数据:通过在实验中控制实验对象而收集到的数据。
3.截面数据和时间序列数据(按被描述的现象与时间的关系分类)
(1)截面数据:在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述不同主体的现象在某一时刻的变化情况;
(2)时间序列数据:在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于描述一个主体的现象随时间变化的情况。
三、统计中的几个基本概念
1.总体和样本
(1)总体
①总体、个体
总体是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。组成总体的每一个元素称为个体。
②总体的分类
根据总体所包含的单位数目是否可数可以分为:
a.有限总体:指总体的范围能够明确确定,而且元素的数目是有限可数的;
b.无限总体:指总体所包括的元素是无限的、不可数的。
(2)样本、样本量
①样本:从总体中抽取的一部分元素的集合;
②样本量:构成样本的元素的数目。
2.参数和统计量
(1)参数
参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。研究者所关心的参数通常有总体平均数、总体标准差、总体比例等。
(2)统计量
统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。研究者所关心的统计量主要有样本平均数、样本标准差、样本比例等。
3.变量
(1)变量、变量值
①变量:说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化。
②变量值:变量的具体取值。
(2)变量的类型
①分类变量
是说明事物类别的一个名称,其取值是分类数据。
②顺序变量
是说明事物有序类别的一个名称,其取值是顺序数据。
③数值型变量
是说明事物数字特征的一个名称,其取值是数值型数据。根据其取值的不同,又可以分为:
a.离散型变量:只能取有限个或可数个值的变量,而且其取值都以整位数断开,可以一一列举;
b.连续型变量:可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举。