首页 > 留学资讯 > 美国留学辅导 > Mann-Whitney U 检验 统计学课程指南

Mann-Whitney U 检验 统计学课程指南

作者:海马 发布时间:2023-08-18 15:27

假设检验模块介绍了检验两个独立样本均值是否相等的技术。适当使用所述检验的一个基本假设是,连续结果近似正态分布,或样本足够大(通常 n1> 30 和 n2> 30),以便根据中心极限定理使用这些检验。在比较两个独立样本时,如果结果不呈正态分布且样本较小,则宜采用非参数检验。假设检验

曼-惠特尼 U 检验是比较两个独立群体结果的常用非参数检验。曼-惠特尼 U 检验有时也称为曼-惠特尼-威尔库克森检验或威尔库克森秩和检验,用于检验两个样本是否可能来自同一人群(即两个人群具有相同的形状)。一些研究者将该检验解释为比较两个群体的中位数。回想一下,参数检验比较的是独立组间的均值(H0:μ1=μ2)。

相反,非参数检验的零假设和双侧研究假设表述如下:

H0:两个群体相等与

H1:两个种群不相等。

这种检验通常作为双侧检验进行,因此,研究假设表明两个种群不相等,而不是说明方向性。如果想检测一个群体与另一个群体相比的正负变化,则使用单侧研究假设。检验程序包括将两个样本中的观测值汇集成一个综合样本,记录每个观测值来自哪个样本,然后从 1 到 n1+n2 分别按从低到高排列。

例如

考虑一项二期临床试验,旨在研究一种新药对减轻儿童哮喘症状的效果。共有 n=10 名参与者被随机分配接受新药或安慰剂治疗。参与者被要求记录接受指定治疗后一周内气喘发作的次数。数据如下。

 

Placebo

7

5

6

4

12

New Drug

3

6

4

2

1

 

与服用安慰剂的参与者相比,服用新药的参与者在 1 周内发生气短的次数是否存在差异?通过观察,似乎服用安慰剂的参与者呼吸急促的次数更多,但这在统计学上有意义吗?

在这个例子中,结果是一个计数,在这个样本中,数据不服从正态分布。

呼吸急促发作次数频率直方图

此外,样本量较小(n1=n2=5),因此采用非参数检验是合适的。假设如下,我们在 5%的显著性水平(即 α=0.05)下进行检验。

H0:相对于

H1:两个种群不相等。

请注意,如果零假设成立(即两组人群相等),我们预计两个治疗组中每个组的呼吸急促发作次数相似,我们预计每个组中都会有一些参与者报告发作次数较少,一些参与者报告发作次数较多。观察到的数据似乎并非如此。需要进行假设检验,以确定观察到的数据是否证明人群之间存在统计学意义上的显著差异。

第一步是分配等级,为此我们将数据从小到大排序。这是在合并样本或总样本(即汇集两个治疗组(n=10)的数据)上进行的,并分配从 1 到 10 的等级,如下所示。我们还需要跟踪总样本中的分组分配。

请注意,较低的等级(如 1、2 和 3)分配给新药组的反应,而较高的等级(如 9、10)分配给安慰剂组的反应。同样,检验的目的是确定观察到的数据是否支持反应人群的差异。回想一下,在参数检验中(在假设检验模块中讨论过),当比较两组间的均值时,我们分析样本均值相对于其变异性的差异,并在检验统计量中总结样本信息。这里也采用了类似的方法。具体来说,我们根据等级得出检验统计量。

首先,我们对各组的等级进行求和。安慰剂组的等级总和为 37;新药组的等级总和为 18。回想一下,等级总和总是等于 n(n+1)/2。作为对等级分配的检验,我们有 n(n+1)/2 = 10(11)/2=55,等于 37+18 = 55。

在试验中,我们把安慰剂组称为 1,新药组称为 2(1 和 2 的分配是任意的)。我们用 R1 表示第 1 组的等级总和(即 R1=37),R2 表示第 2 组的等级总和(即 R2=18)。如果零假设成立(即两个种群相等),我们预期 R1 和 R2 相似。在本例中,较低值(较低等级)集中在新药组(第 2 组),而较高值(较高等级)集中在安慰剂组(第 1 组)。这很有说服力,但观察到的等级总和的差异是否仅仅是偶然造成的呢?为了回答这个问题,我们将计算一个检验统计量来总结样本信息,并在概率分布中查找相应的值。

相关热词搜索:

阅读原文:https://www.highmarktutor.com/news/14660_60.html

版权作品,未经海马课堂 highmarktutor.com 书面授权,严禁转载,违者将被追究法律责任。

热门课程推荐

欢迎咨询

hmkt088