1.6 定义数据的子集
1.6.1 定义数据的子集概述
在很多情况下,现有的Stata数据达不到分析要求,我们需要截取出数据的一部分进行分析,或者删除不需要进入分析范围的数据,这时我们就需要用到Stata的定义数据子集功能。在本节中,我们将通过实例的方式讲述定义数据子集的基本操作。
1.6.2 相关数据来源
【例1.5】试通过操作案例1.5.dta完成以下工作。
(1)列出第3条数据。
(2)列出第1~3条数据。
(3)列出变量值“shangjiao”最小的两条数据。
(4)列出变量值“year”大于2005的数据。
(5)列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
(6)删除第3条数据。
(7)删除变量值“year”等于2005的数据。
(8)删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.3 Stata分析过程
分析步骤如下:
进入Stata 14.0,打开相关数据文件,弹出如图1.30所示的主界面。
图1.30 主界面
在主界面的“Command”文本框中输入操作命令并按键盘上的回车键进行确认。对应的命令如下。
●list in 3:本命令的含义是列出第3条数据。
●list in 1/3:本命令的含义是列出第1~3条数据。
●sort shangjiao list year shangjiao shenjiao in 1/2:本命令的含义是列出变量值“shangjiao”最小的两条数据。
●list if year>2005:本命令的含义是列出变量值“year”大于2005的数据。
●list if year>2007 & shangjiao>865:本命令的含义是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
●drop in 3:本命令的含义是删除第3条数据。
●drop if year==2005:本命令的含义是删除变量值“year”等于2005的数据。
●drop if year>2005 & shangjiao>865:本命令的含义是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.4 结果分析
图1.31是列出第3条数据的结果。
图1.31 分析结果1
图1.32是列出第1~3条数据的结果。
图1.32 分析结果2
图1.33是列出变量值“shangjiao”最小的两条数据结果。
图1.33 分析结果3
图1.34是列出变量值“year”大于2005的数据结果。
图1.34 分析结果4
图1.35是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据结果。
图1.35 分析结果5
图1.36是删除第3条数据的结果。
图1.36 分析结果6
图1.37是删除变量值“year”等于2005的数据结果。
图1.37 分析结果7
图1.38是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据结果。
图1.38 分析结果8
1.6.5 案例延伸
我们在上述的Stata命令中用到了Stata中的关系运算符和逻辑运算符。Stata 14.0中共支持6种关系运算符和3种逻辑运算符,如表1.7和表1.8所示。
表1.7 关系运算符
表1.8 逻辑运算符