![Stata统计分析与行业应用案例详解(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/500/26943500/b_26943500.jpg)
1.6 定义数据的子集
1.6.1 定义数据的子集概述
在很多情况下,现有的Stata数据达不到分析要求,我们需要截取出数据的一部分进行分析,或者删除不需要进入分析范围的数据,这时我们就需要用到Stata的定义数据子集功能。在本节中,我们将通过实例的方式讲述定义数据子集的基本操作。
1.6.2 相关数据来源
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0032_0001.jpg?sign=1734416294-nUpigacHSTzVkFDCbXNM58dvWUrwmQTE-0-e9868024b3b663ed73ba9cbe29bfce4d)
【例1.5】试通过操作案例1.5.dta完成以下工作。
(1)列出第3条数据。
(2)列出第1~3条数据。
(3)列出变量值“shangjiao”最小的两条数据。
(4)列出变量值“year”大于2005的数据。
(5)列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
(6)删除第3条数据。
(7)删除变量值“year”等于2005的数据。
(8)删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.3 Stata分析过程
分析步骤如下:
进入Stata 14.0,打开相关数据文件,弹出如图1.30所示的主界面。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0032_0003.jpg?sign=1734416294-zdm4VSYbA6rfYhfYGNHTjhG8KWYZ4oHQ-0-d3843d51c8afebdac41c9aa3a74c3aed)
图1.30 主界面
在主界面的“Command”文本框中输入操作命令并按键盘上的回车键进行确认。对应的命令如下。
●list in 3:本命令的含义是列出第3条数据。
●list in 1/3:本命令的含义是列出第1~3条数据。
●sort shangjiao list year shangjiao shenjiao in 1/2:本命令的含义是列出变量值“shangjiao”最小的两条数据。
●list if year>2005:本命令的含义是列出变量值“year”大于2005的数据。
●list if year>2007 & shangjiao>865:本命令的含义是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
●drop in 3:本命令的含义是删除第3条数据。
●drop if year==2005:本命令的含义是删除变量值“year”等于2005的数据。
●drop if year>2005 & shangjiao>865:本命令的含义是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.4 结果分析
图1.31是列出第3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0001.jpg?sign=1734416294-fLSmK5UbOVSOdOIk84sC9ZM9ediuZS9G-0-f4c39db53b567acfadf02c918234a645)
图1.31 分析结果1
图1.32是列出第1~3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0002.jpg?sign=1734416294-xCBJrSjSie0TIf5CyEq23npmPVJ2fr7f-0-a7d849d3f3124526cbb69c8998e82521)
图1.32 分析结果2
图1.33是列出变量值“shangjiao”最小的两条数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0003.jpg?sign=1734416294-TPA4KtIJB00nNVQj4sqFl3YRIVBNAydC-0-8cf32a53c571416559adcd23fbdb0836)
图1.33 分析结果3
图1.34是列出变量值“year”大于2005的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0004.jpg?sign=1734416294-GULSX36WSpapqLrIgLvcgVYhDtdohyzB-0-cf913e0edf39114452c57fb1b99b9fb2)
图1.34 分析结果4
图1.35是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0005.jpg?sign=1734416294-tCuEXP3ARMvtyJVJOE2UxHn7ag6zzed3-0-03756d6055cf87ec8121a0a921121c58)
图1.35 分析结果5
图1.36是删除第3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0006.jpg?sign=1734416294-np6yHBFam5dO4aq3RAVyAkcc6b2v4oUo-0-5e7623d0cd2b71e54426b00308c92d3d)
图1.36 分析结果6
图1.37是删除变量值“year”等于2005的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0001.jpg?sign=1734416294-y6Nbqsrar8y3B4dWbBWqvfHhXhmRn8Mc-0-8d26f77f1c20ad642412f4253b29921b)
图1.37 分析结果7
图1.38是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0002.jpg?sign=1734416294-4cTYq4a0gnhekX1EogGoF0uRDzWM2B3F-0-08c0c8c0cbeaf06ef3fcac9d2ad673df)
图1.38 分析结果8
1.6.5 案例延伸
我们在上述的Stata命令中用到了Stata中的关系运算符和逻辑运算符。Stata 14.0中共支持6种关系运算符和3种逻辑运算符,如表1.7和表1.8所示。
表1.7 关系运算符
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0003.jpg?sign=1734416294-mnGGoiMiVJ1abM2yrTwSfJxde1aUZokQ-0-e320afc6de8400301e7d992341cf3161)
表1.8 逻辑运算符
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0004.jpg?sign=1734416294-lOsRT1CvEAjVev62EqxvGwnNt426828s-0-87784f95576910542854e502ece5e79c)