假设检验是一种统计方法,用于确定一个假设关于总体的陈述是否成立。
步骤
提出假设
- 原假设():通常表示没有显著差异或效果。比如,某药物对疾病没有影响。
- 备择假设():表示存在显著差异或效果。比如,某药物对疾病有影响。
选择显著性水平()
这是一个预定的阈值,用于决定是否拒绝原假设。常用的显著性水平有0.05、0.01等。
选择适当的检验统计量
根据数据类型和假设,选择合适的统计量,如 检验、 检验、 检验等。
计算检验统计量和p值
从样本数据中计算检验统计量,然后计算该统计量对应的p值。
做出决策
- 比较p值与显著性水平。
- 如果 ,拒绝原假设。
- 如果 ,不拒绝原假设。
假设如何选择
在统计检验中,假设的选择遵循以下逻辑:
零假设(H₀)
零假设通常表示“没有效果”或“没有差异”的情况,是一个待检验的基本假设。我们假设这个假设为真,然后通过统计检验来验证这个假设是否可以被拒绝。零假设作为默认假设,提供了一个标准来衡量数据是否显示出显著的变化。如果数据未能提供足够证据拒绝零假设,我们便保留零假设。
备择假设(H₁)
备择假设表示与零假设相反的假设,通常是我们希望证明的假设。它表示存在某种效应或差异。备择假设只有在零假设被拒绝时才会被接受。它代表了我们通过数据所希望验证的研究命题。如果测量值与期望结果显著不同,则拒绝零假设。
如何判断使用何种分布?
样本量大小
- 当样本量小于30且总体标准差未知时,使用t分布。
- 当样本量大且总体标准差已知时,使用标准正态分布。
检验类型
- 如果是均值的检验,用t分布或正态分布。
- 如果是方差检验或频数检验,用分布。
已知信息
- 若已知总体参数(如总体标准差),则用正态分布。
- 未知总体参数且估计样本参数时,用t分布。
使用t分布的条件
- 样本来自正态分布
- 样本量较小(通常n < 30)。
- 总体标准差未知且样本标准差用作估计。
使用分布的条件
- 检验数据的方差或标准差。
- 检验数据的独立性或适合度(例如,卡方检验)。
- 样本数据的频数分析。
如果问题涉及的是方差的检验,或者是类别数据的独立性检验,我们会使用分布。
p值
定义
p值(p-value) 是在假设检验中用于衡量数据与零假设相符程度的一个指标。它表示在假设零假设为真时,得到观测结果或更极端结果的概率。具体来说:
- p值是一个概率值,范围在0到1之间。
- 小p值(通常小于或等于显著性水平)表明观测数据与零假设相矛盾,因此有理由拒绝零假设。
- 大p值表明观测数据与零假设一致,因此没有足够理由拒绝零假设。
计算
p值的计算涉及以下步骤:
- 选择适当的统计检验:根据样本数据类型和假设,选择合适的统计检验方法(如t检验、z检验或检验)。
- 计算检验统计量:根据样本数据计算出对应的检验统计量(如t值、z值或值)。
- 查找p值:使用统计分布表或统计软件查找检验统计量对应的p值。
解释
- 如果p值 ≤ :
- 数据提供了足够的证据拒绝零假设。
- 结论:观测结果在零假设下发生的概率非常低,因此认为备择假设可能为真。
- 如果p值 > :
- 数据没有提供足够的证据拒绝零假设。
- 结论:没有理由认为零假设不成立,因此保留零假设。
关键点总结
- p值衡量的是观测数据与零假设相符的概率。
- 小p值(≤ )表明数据显著偏离零假设,从而有理由拒绝零假设。
- 大p值(> )表明数据与零假设一致,从而没有理由拒绝零假设。
通过理解和计算p值,我们可以进行科学的假设检验,判断某个假设是否成立。
示例
假设我们想检验某新药是否能降低血压,提出以下假设:
原假设()
新药对血压没有影响(即平均变化为零)。
备择假设()
新药对血压有影响(即平均变化不为零)。
假设我们使用0.05的显著性水平,收集了一些使用新药的病人的数据。然后进行t检验,计算出检验统计量和相应的p值。若p值为0.03,由于0.03 < 0.05,我们拒绝原假设,认为新药对血压有显著影响。
关键点
双侧检验与单侧检验
根据假设的方向性选择双侧或单侧检验。双侧检验适用于不确定方向的假设,单侧检验适用于确定方向的假设。
类型错误
- I类错误:错误地拒绝了原假设,即假阳性。
- II类错误:错误地接受了原假设,即假阴性。
功效(Power)
检验的功效是指正确拒绝原假设的概率,功效越高,检验越有效。