1.7 数据的类型
数据以不同的性质分类,有下列分类方法:
1.7.1 连续数据与离散数据
连续数据(continuous data):数据是可以有小数或分数的,定比尺度和定距尺度通常是连续数据。计量值数据相当于连续数据。
离散数据(discrete data):数据是整数,没有小数或分数,定序尺度和定类尺度通常是离散数据;定比尺度也可能是离散数据,例如:生产的个数。计数值数据相当于离散数据。
1.7.2 定量数据与定性数据
定量(数量)数据(quantitative data):利用客观标准衡量而得到的数据。例如:产品寿命数据、长度数据。有的书将定量数据定义为数字数据,以数量表示的数据。
定性(质量)数据(qualitative data):利用主观判断而得到的数据,例如:考试成绩等级数据、同意的程度。有的书将定性数据定义为文字数据,描述特性或性质的数据。
1.7.3 初级数据与次级数据
初级数据(primary data):数据是由直接观察、调查或实验而得到的原始数据,未经他人的整理或分析,这种数据一定符合搜集数据者的研究目的。初级数据通常是内部数据(internal data)。
次级数据或称二手数据(secondary data):数据经过他人的整理或分析,变成频数分布表或某种统计结果。次级数据通常取自政府机构、数据公司、广告公司等。引用次级数据要注意与研究目的是否相符、来源是否可靠以及时效性。描述统计中的分组数据,可以说是次级数据。次级数据通常是外部数据(external data)。例题1.2可以说是次级数据的研究。
1.7.4 横断数据与纵向数据
数据来源依据是否与时间相关,通常可分成横截面数据(cross-sectional data)及纵向数据或追踪调查数据(longitudinal data or panel data)。横截面数据是静态数据,收集一个时间点的数据,在“同一时间”的单总体、多总体或多变量的数据。纵向数据是动态数据,是经过一段时间,收集的“不同时间点”的数据,指数的数据和时间序列数据是纵向数据。只做一次的调查,是横截面数据,实验虽然要经过一段时间,但是如果只记录最后结果的数据,也是横截面数据。
1.7.5 数据集合
记录或个案是个体单位的变量集合,记录和变量可以用一个电子表格(worksheet或spreadsheet)的形式来显示,如Excel。所以,本书所用的《中文统计》是建立在Excel上的一个加载项。数据电子表格相当于一个矩阵,行(row)代表记录,列(column)代表变量。