5.1 实例一——单样本正态分布检验
5.1.1 单样本正态分布检验的功能与意义
单样本正态分布检验本质上属于一种拟合优度检验,基本功能是通过检验样本特征来探索总体是否服从正态分布。Stata的单样本正态分布检验有很多种,常用的包括偏度-峰度检验、Wilks-Shapiro两种。
5.1.2 相关数据来源
【例5.1】表5.1给出了山东财经大学某专业60名男生的百米速度。试用单样本正态分布检验方法研究其是否服从正态分布。
表5.1 百米速度
5.1.3 Stata分析过程
在用Stata进行分析之前,我们要把数据录入到Stata中。本例中有一个变量,即速度。我们把速度变量设定为speed,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作我们在第1章中已有详细讲述。录入完成后数据如图5.1所示。
图5.1 案例5.1数据
先做一下数据保存,然后开始展开分析,步骤如下:
进入Stata 14.0,打开相关数据文件,弹出主界面。
Wilks-Shapiro、偏度-峰度检验两种检验方式在主界面的“Command”文本框中输入的命令格式分别如下。
●swilk speed:本命令的含义是对speed变量使用Wilks-Shapiro检验方式进行单样本正态分布检验。
●sktest speed:本命令的含义是对speed变量使用偏度-峰度检验方式进行单样本正态分布检验。
设置完毕后,按键盘上的回车键,等待输出结果。
5.1.4 结果分析
在Stata 14.0主界面的结果窗口我们可以看到如图5.2和图5.3所示的分析结果。
图5.2 分析结果图
图5.3 分析结果图
通过观察分析结果,我们可以看出两种检验方法的检验结果是一致的,共有60个有效样本参与了假设检验,P值均远小于0.05,所以需要拒绝原假设,也就是说,百米速度数据不服从正态分布。
5.1.5 案例延伸
上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。但是Stata 14.0的强大之处在于,它同样提供了更加复杂的命令格式以满足用户更加个性化的需求。
例如,我们只针对speed变量大于12.5的观测样本进行单样本正态分布检验,那么操作命令即为:
swilk speed if speed>12.5
在命令窗口输入命令并按回车键进行确认,结果如图5.4所示。
图5.4 分析结果图
通过观察分析结果,我们可以看出共有23个有效样本参与了假设检验,P值均远小于0.05,所以需要拒绝原假设,也就是说,百米速度数据不服从正态分布。