Stata统计分析与行业应用案例详解(第2版)
上QQ阅读APP看书,第一时间看更新

5.1 实例一——单样本正态分布检验

5.1.1 单样本正态分布检验的功能与意义

单样本正态分布检验本质上属于一种拟合优度检验,基本功能是通过检验样本特征来探索总体是否服从正态分布。Stata的单样本正态分布检验有很多种,常用的包括偏度-峰度检验、Wilks-Shapiro两种。

5.1.2 相关数据来源

【例5.1】表5.1给出了山东财经大学某专业60名男生的百米速度。试用单样本正态分布检验方法研究其是否服从正态分布。

表5.1 百米速度

5.1.3 Stata分析过程

在用Stata进行分析之前,我们要把数据录入到Stata中。本例中有一个变量,即速度。我们把速度变量设定为speed,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作我们在第1章中已有详细讲述。录入完成后数据如图5.1所示。

图5.1 案例5.1数据

先做一下数据保存,然后开始展开分析,步骤如下:

进入Stata 14.0,打开相关数据文件,弹出主界面。

Wilks-Shapiro、偏度-峰度检验两种检验方式在主界面的“Command”文本框中输入的命令格式分别如下。


●swilk speed:本命令的含义是对speed变量使用Wilks-Shapiro检验方式进行单样本正态分布检验。

●sktest speed:本命令的含义是对speed变量使用偏度-峰度检验方式进行单样本正态分布检验。

设置完毕后,按键盘上的回车键,等待输出结果。

5.1.4 结果分析

在Stata 14.0主界面的结果窗口我们可以看到如图5.2和图5.3所示的分析结果。

图5.2 分析结果图

图5.3 分析结果图

通过观察分析结果,我们可以看出两种检验方法的检验结果是一致的,共有60个有效样本参与了假设检验,P值均远小于0.05,所以需要拒绝原假设,也就是说,百米速度数据不服从正态分布。

5.1.5 案例延伸

上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。但是Stata 14.0的强大之处在于,它同样提供了更加复杂的命令格式以满足用户更加个性化的需求。

例如,我们只针对speed变量大于12.5的观测样本进行单样本正态分布检验,那么操作命令即为:

    swilk     speed   if   speed>12.5

在命令窗口输入命令并按回车键进行确认,结果如图5.4所示。

图5.4 分析结果图

通过观察分析结果,我们可以看出共有23个有效样本参与了假设检验,P值均远小于0.05,所以需要拒绝原假设,也就是说,百米速度数据不服从正态分布。