跳至主要內容

PKM-er大约 3 分钟

秩和检验概述

秩和检验(Rank Sum Test),通常指的是曼-惠特尼U检验(Mann-Whitney U Test),是一种用于检验两个独立样本是否来自同一总体的非参数统计方法。在统计学中,非参数方法不依赖于数据的具体分布形式,适用于样本数据不满足正态分布的情况。

工作原理

秩和检验的基本思想是将两组数据合并后进行排序,每个数据点在排序中的位置称为“秩”(Rank)。检验的目的是比较两组数据在秩次上的差异是否显著,以此判断两个独立样本的分布是否有显著差异。

实施步骤

  1. 合并与排序:将两个样本合并为一个数据集,按照数值大小进行排序。
  2. 计算秩和:分别为两个样本中的每个数据分配秩次,然后计算每个样本的秩和。
  3. 统计量计算:利用秩和计算统计量,如Mann-Whitney U统计量。
  4. 显著性检验:通过查表或计算P值,判断统计量的显著性,从而判断两组数据是否有显著差异。

应用场景

秩和检验广泛应用于医学、生物学和社会科学等领域,尤其适用于样本量较小或数据不符合正态分布的情况。它是比较两个独立样本差异的一种常用方法。


我们可以通过一个简单的例子来演示如何进行秩和检验,即曼-惠特尼U检验。假设我们有两组人员,一组接受了某种训练,另一组没有接受训练,我们要检验这两组人在某项技能上是否存在显著差异。

示例数据

  • 组A(受过训练):$$18, 20, 22, 20, 25$$
  • 组B(未受训练):$$15, 17, 19, 16, 18$$

步骤1:合并与排序

首先将两组数据合并,并进行排序(同时保留原始组别标签):

原始数据组别
15B
16B
17B
18A
18B
19B
20A
20A
22A
25A

步骤2:分配秩次

接着给每个数据分配一个秩次。如果存在相同的数值(如18出现两次),则将这些数值的秩次取平均:

原始数据组别秩次
15B1
16B2
17B3
18A4.5
18B4.5
19B6
20A7.5
20A7.5
22A9
25A10

步骤3:计算秩和

  • 秩和A WAW_A4.5+7.5+7.5+9+10=38.54.5 + 7.5 + 7.5 + 9 + 10 = 38.5
  • 秩和B WBW_B1+2+3+4.5+6=16.51 + 2 + 3 + 4.5 + 6 = 16.5

步骤4:使用统计量和显著性检验

使用秩和计算曼-惠特尼U统计量。公式为:

U=n1×n2+n1(n1+1)2WA U = n_1 \times n_2 + \frac{n_1(n_1+1)}{2} - W_A

其中,n1n_1n2n_2 分别是两个样本的大小(这里都是5)。

U=5×5+5×6238.5=25+1538.5=1.5 U = 5 \times 5 + \frac{5 \times 6}{2} - 38.5 = 25 + 15 - 38.5 = 1.5

我们需要查表或计算P值来决定是否拒绝原假设。一般情况下,如果U值小于临界U值,或者P值小于显著性水平(通常是0.05),则拒绝原假设,认为两组存在显著差异。

以上步骤给出了两组数据进行秩和检验的完整计算过程。如果需要进一步计算P值或其他统计细节,可以使用统计软件或编程工具进行。