大约 3 分钟
秩和检验概述
秩和检验(Rank Sum Test),通常指的是曼-惠特尼U检验(Mann-Whitney U Test),是一种用于检验两个独立样本是否来自同一总体的非参数统计方法。在统计学中,非参数方法不依赖于数据的具体分布形式,适用于样本数据不满足正态分布的情况。
工作原理
秩和检验的基本思想是将两组数据合并后进行排序,每个数据点在排序中的位置称为“秩”(Rank)。检验的目的是比较两组数据在秩次上的差异是否显著,以此判断两个独立样本的分布是否有显著差异。
实施步骤
- 合并与排序:将两个样本合并为一个数据集,按照数值大小进行排序。
- 计算秩和:分别为两个样本中的每个数据分配秩次,然后计算每个样本的秩和。
- 统计量计算:利用秩和计算统计量,如Mann-Whitney U统计量。
- 显著性检验:通过查表或计算P值,判断统计量的显著性,从而判断两组数据是否有显著差异。
应用场景
秩和检验广泛应用于医学、生物学和社会科学等领域,尤其适用于样本量较小或数据不符合正态分布的情况。它是比较两个独立样本差异的一种常用方法。
我们可以通过一个简单的例子来演示如何进行秩和检验,即曼-惠特尼U检验。假设我们有两组人员,一组接受了某种训练,另一组没有接受训练,我们要检验这两组人在某项技能上是否存在显著差异。
示例数据
- 组A(受过训练):$$18, 20, 22, 20, 25$$
- 组B(未受训练):$$15, 17, 19, 16, 18$$
步骤1:合并与排序
首先将两组数据合并,并进行排序(同时保留原始组别标签):
原始数据 | 组别 |
---|---|
15 | B |
16 | B |
17 | B |
18 | A |
18 | B |
19 | B |
20 | A |
20 | A |
22 | A |
25 | A |
步骤2:分配秩次
接着给每个数据分配一个秩次。如果存在相同的数值(如18出现两次),则将这些数值的秩次取平均:
原始数据 | 组别 | 秩次 |
---|---|---|
15 | B | 1 |
16 | B | 2 |
17 | B | 3 |
18 | A | 4.5 |
18 | B | 4.5 |
19 | B | 6 |
20 | A | 7.5 |
20 | A | 7.5 |
22 | A | 9 |
25 | A | 10 |
步骤3:计算秩和
- 秩和A :
- 秩和B :
步骤4:使用统计量和显著性检验
使用秩和计算曼-惠特尼U统计量。公式为:
其中, 和 分别是两个样本的大小(这里都是5)。
我们需要查表或计算P值来决定是否拒绝原假设。一般情况下,如果U值小于临界U值,或者P值小于显著性水平(通常是0.05),则拒绝原假设,认为两组存在显著差异。
以上步骤给出了两组数据进行秩和检验的完整计算过程。如果需要进一步计算P值或其他统计细节,可以使用统计软件或编程工具进行。