跳至主要內容

Cyletix大约 2 分钟

中心极限定理 (Central Limit Theorem, CLT) 是概率论中的一个基本定理。它描述了在一定条件下,大量独立随机变量的和的分布趋近于正态分布。该定理为统计学中的许多重要结果提供了理论基础,特别是在进行抽样和推断时。

定理内容

假设我们有一组独立同分布的随机变量 X1,X2,,XnX_1, X_2, \ldots, X_n,每个随机变量具有相同的数学期望 E(Xi)=μE(X_i) = \mu 和方差 Var(Xi)=σ2Var(X_i) = \sigma^2。定义这组随机变量的和为 SnS_n

Sn=i=1nXi S_n = \sum_{i=1}^{n} X_i

我们可以将 SnS_n 标准化,得到标准化变量:

Zn=Snnμnσ Z_n = \frac{S_n - n\mu}{\sqrt{n}\sigma}

中心极限定理指出,当 nn 足够大时,标准化变量 ZnZ_n 的分布将趋近于标准正态分布 N(0,1)N(0, 1)。即:

Zn=SnnμnσdN(0,1) Z_n = \frac{S_n - n\mu}{\sqrt{n}\sigma} \xrightarrow{d} N(0, 1)

这里,d\xrightarrow{d} 表示收敛于分布。

换句话说,对于大样本量 nn,即使每个随机变量 XiX_i 的分布不是正态分布,样本均值的分布仍然会近似于正态分布。这一结果在统计学中非常重要,因为它允许我们在很多情况下使用正态分布来进行近似和推断,即使原始数据不符合正态分布。

应用

  1. 抽样分布:在实际统计工作中,中心极限定理保证了样本均值的分布可以被近似为正态分布,这使得我们能够对总体参数进行估计和假设检验。
  2. 误差分析:在测量和实验中,由于多种独立因素的影响,误差的总和往往近似服从正态分布,因此中心极限定理为误差分析提供了理论支持。

注意事项

  1. 独立性:中心极限定理要求随机变量必须是相互独立的。
  2. 相同分布:随机变量应具有相同的分布,或至少满足某些弱条件,如有限的期望和方差。
  3. 样本量:样本量 nn 必须足够大。尽管在许多实际情况中 n>30n > 30 已经足够,但更大的样本量会提供更好的近似。

中心极限定理是概率论和统计学中的一个核心工具,为理解和处理大量随机变量提供了重要的理论支持。