跳至主要內容

Cyletix大约 1 分钟

简介

tt 分布广泛应用于小样本数据分析中的假设检验和置信区间的建立。

定义

tt 分布的概率密度函数:

f(t)=Γ(ν+12)νπΓ(ν2)(1+t2ν)ν+12 f(t) = \frac{\Gamma(\frac{\nu+1}{2})}{\sqrt{\nu\pi}\Gamma(\frac{\nu}{2})} \left(1+\frac{t^2}{\nu}\right)^{-\frac{\nu+1}{2}}

其中,ν\nu 是自由度,Γ\Gamma 是伽玛函数。

构造

tt 分布可以通过标准正态分布卡方分布构造。当 XN(0,1)X \sim N(0,1)Yχ2(k)Y \sim \chi^2(k) 时,Z=XY/kZ = \dfrac{X}{\sqrt{Y/k}} 服从自由度为 kktt 分布。 这里 Yk\sqrt{\dfrac{Y}{k}}YY 标准化的结果,使得 ZZ 分布的方差不依赖于 YY 的尺度,而只依赖于其自由度 kk。 ![[file-udxeUcFDMIFzlZhrDskJeizD.webp]]

性质

  1. 对称性tt 分布是关于 0 对称的。
  2. 形态:随着自由度的增加,tt 分布越来越接近正态分布。当自由度趋向于无穷大时,tt 分布理论上会收敛到标准正态分布。
  3. 厚尾性:相比于正态分布,tt 分布有更厚的尾部,这意味着它更能容纳极端值的出现。

应用

  1. 置信区间:在样本量较小且总体标准差未知时,tt 分布被用于构建均值的置信区间。
  2. 假设检验tt 检验是基于 tt 分布的,用于比较两个平均数是否存在显著差异,或者一个样本平均数与总体平均数之间的比较。

tt 分布是处理小样本统计推断中不可或缺的工具,尤其在数据量不足以准确估计标准差时,它提供了一个有效的解决方案。