5.2 实例二——两独立样本检验
5.2.1 两独立样本检验的功能与意义
跟前面的检验方法一样,Stata的两独立样本检验(Two-Independent samples Test)也是非参数检验方法的一种,其基本功能是可以判断两个独立样本是否来自相同分布的总体。这种检验过程是通过分析两个独立样本的均数、中位数、离散趋势、偏度等描述性统计量之间的差异来实现的。
5.2.2 相关数据来源
【例5.2】表5.2给出了广东省东北部和西北部主要年份的年降雨量。试用两独立样本检验方法判断两个地区的年降雨量是否存在显著差异。
表5.2 广东省东北部和西北部主要年份年降雨量(单位:mm)
5.2.3 Stata分析过程
在用Stata进行分析之前,我们要把数据录入到Stata中。本例中有3个变量,分别是年份、地区和降雨量。我们把年份变量设定为year,把地区变量设定为group并且把粤东北定义为1,把粤西北定义为2,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作我们在第1章中已有详细讲述。录入完成后数据如图5.5所示。
图5.5 案例5.2数据
先做一下数据保存,然后开始展开分析,步骤如下:
进入Stata 14.0,打开相关数据文件,弹出主界面。
在主界面的“Command”文本框中输入如下命令(旨在用两独立样本检验方法判断两个地区的年降雨量是否存在显著差异):
ranksum sum, by( group)
设置完毕后,按键盘上的回车键,等待输出结果。
5.2.4 结果分析
在Stata 14.0主界面的结果窗口我们可以看到如图5.6所示的分析结果。
图5.6 分析结果图
通过观察分析结果,我们可以看出共有24个有效样本参与了假设检验,Prob > |z| =0.3556,远大于0.05,所以需要接受原假设,也就是说,两个地区的年降雨量存在显著差异。
5.2.5 案例延伸
上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。但是Stata 14.0的强大之处在于,它同样提供了更加复杂的命令格式以满足用户更加个性化的需求。
例如,我们只针对year变量大于1990的观测样本进行两独立样本检验,那么操作命令即为:
ranksum sum if year>1990, by( group)
在命令窗口输入命令并按回车键进行确认,结果如图5.7所示。
图5.7 分析结果图
通过观察分析结果,我们可以看出共有18个有效样本参与了假设检验,Prob > |z| =0.3099,远大于0.05,所以需要接受原假设,也就是说,两个地区的年降雨量存在显著差异。