4.5 克鲁斯卡尔-沃利斯检验
如果从总体1中随机抽取了一组样本,又从总体2中随机抽取了一组样本;威尔科克森秩和检验就可以用来分析这两个样本所代表的总体1和总体2是否具有相同的分布。现在如果有来自三个或更多独立总体的样本数据,能否用一种方法来分析它们所代表的总体是否具有相同的分布呢?这时所采用的方法就是克鲁斯卡尔-沃利斯(Kruskal-Wallis)检验,又称H检验。本书后面还会介绍到单向方差分析(ANOVA),该方法可以用来检验一些样本均值之间的差别是否显著,但方差分析要求所有有关的总体都是正态分布的。如同其他非参数检验一样,克鲁斯卡尔-沃利斯检验并不要求总体服从正态分布或者任意其他的特殊分布。
克鲁斯卡尔-沃利斯检验的原假设和备择假设一般如下:
H0:样本来自于具有相同分布的总体。
H1:样本来自于具有不同分布的总体。
克鲁斯卡尔-沃利斯检验的统计量定义为
其中ni是样本i的观察值数量,i=1,2,…,k,k是样本的个数,nT是混合后的总样本容量,即
另外,Ti是样本i在总的样本观察值中的秩和。对于给定的显著水平α,如果统计量H超过自由度为k-1的χ2的临界值,则拒绝原假设。
通常要求每个样本中至少有5个观察值,这样检验统计量H的分布才能用χ2分布来近似。这个检验统计量H其实就是本书后面将要讨论的方差分析中检验统计量F的秩形式。当对秩进行处理,而非对原始值进行处理时,许多量是已经预先知道的。例如,所有秩的和可以表示为nT(nT+1)/2。表达式
其中
合并了秩的加权方差,以得到这里的给出的检验统计量H。这个H的表达式与前面给出的表达式在代数上是相等的。但前面H的形式处理起来更加简便。尽管克鲁斯卡尔-沃利斯检验计算起来非常容易,但它并没有F检验那样有效,因此它可能会需要更加明显的差别来拒绝零假设。
当样本观察值的秩有大量相等时,用
来进行修正,其中tj是第j个相等秩组中的观察值数量。
下面结合一个例子来演示使用克鲁斯卡尔-沃利斯检验的基本方法。为研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到X、Y和Z三个组,每组6只,分别在地面办公楼、煤炭仓库和矿井下,12周后测量大鼠全肺湿重(单位:g),数据见表4-21,问不同环境下大鼠全肺湿重有无差别?
表4-21 大鼠全肺湿重数据/g
首先,根据描述提出下列原假设和备择假设:
H0:三组没有差异(即它们来自同一总体)。
H1:三组中至少有一个和其他组不同。
在计算统计量H之前,首先从低到高排列18个样本数据,并编秩。中间数据的处理结果如表4-22所示。其中处理相等数据时的方法前面已经多次讲到,这里不再赘述。
表4-22 中间数据处理结果
计算三组秩和的结果如下
TX=1.5+1.5+5+6+8+10=32
TY=3+8+8+11+12.5+14=56.5
TZ=4+12.5+15+16+17+18=82.5
根据三组秩的和可以对统计量H进行计算
因为含有相同大小的数据,所以使用H′,对H进行修正。其中
将该值代入到H′,于是可得
可见,尽管涉及相等的秩几乎占到总数的一半,H′的值和H仍然非常相近。由于自由度为k-1=2,所以可在R中使用下面的代码来计算P值。
由于P值小于0.05,所以拒绝原假设,认为三个组的测试结果之间存在有显著的差异。
上述计算结果在R中可以使用非常简单的代码来得到,下面的代码同样得出了7.5055的H′统计量以及0.023 45的P值。
本章向读者介绍了几种常用的非参数检验方法。与参数检验方法相比,非参数检验方法不受总体分布的限制,适用范围更广,使用起来也更简便。但还需指出,当测量的数据能够满足参数统计的所有假设时,非参数检验方法虽然也可以使用,但效果远不如参数检验方法。当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。所以对于参数检验方法而言,应该注意把握它们适用的条件,在具有应用时,更应审慎检查这些条件是否满足。针对具体问题,要注意分析问题本身所提供的信息,审慎选择检验方法。