跳至主要內容

区间估计

CyletixGPT-4大约 2 分钟

区间估计

区间估计是统计推断中用于估计总体参数的一种方法,它提供了一个范围(区间)而不是单一的点估计值。区间估计不仅提供了参数估计值,还给出了估计值的不确定性信息。区间估计的结果通常表现为一个包含总体参数的置信区间

公式

对于总体均值 μ\mu 的置信区间,假设样本均值为 Xˉ\bar{X},样本标准误为 SESE,则置信区间可以表示为:

Xˉ±Zα/2SE \bar{X} \pm Z_{\alpha/2} \cdot SE

其中,Zα/2Z_{\alpha/2} 是标准正态分布下对应置信水平的临界值。

当样本量较小且总体方差未知时,使用 t 分布:

Xˉ±tα/2,n1SE \bar{X} \pm t_{\alpha/2, n-1} \cdot SE

其中,tα/2,n1t_{\alpha/2, n-1} 是自由度为 n1n-1 的 t 分布的临界值。

推导

(n1)S2σ2=[(X1Xˉ)2+(X2Xˉ)2++(XnXˉ)2]σ2χ2(n1) \dfrac{(n-1)S^2}{\sigma^2}=\dfrac{[(X_{1}-\bar{X})^2+(X_{2}-\bar{X})^2+\dots+(X_{n}-\bar{X})^2]}{\sigma^2}\sim \chi^2(n-1)

则有

XˉμS2nt(n1) \dfrac{\bar{X}-\mu}{\sqrt{ \dfrac{S^2}{n} }}\sim t(n-1)

示例

+

估计某镇收获的苹果重量的母平均数𝝁的范围 已知

  • 总体方差为50250^2
  • 随机抽取 100 个样本, 平均值为 350

求此时 𝝁 的 95% 置信区间

使用区间估计来求出总体均值 μ\mu 的95%置信区间 已知总体方差 σ2=502\sigma^2 = 50^2,样本大小 n=100n = 100,样本均值 xˉ=350\bar{x} = 350

  1. 枢轴量: 由于已知总体方差 σ2\sigma^2,我们可以使用正态分布的枢轴量。

Z=xˉμσ/n Z = \frac{\bar{x} - \mu}{\sigma / \sqrt{n}}

该枢轴量 ZZ 服从标准正态分布 N(0,1)N(0, 1)

  1. 置信区间: 对于95%的置信水平,对应的标准正态分布的临界值 zα/2=1.96z_{\alpha/2} = 1.96。 解以下不等式来求 μ\mu 的95%置信区间:

1.96xˉμσ/n1.96 -1.96 \leq \frac{\bar{x} - \mu}{\sigma / \sqrt{n}} \leq 1.96

1.96350μ50/1001.96 -1.96 \leq \frac{350 - \mu}{50 / \sqrt{100}} \leq 1.96

3509.8μ350+9.8 350 - 9.8 \leq \mu \leq 350 + 9.8

  1. 结论: 母平均数 μ\mu 的95%置信区间为:

[340.2,359.8] [340.2, 359.8]

区间估计的优点

  1. 提供不确定性信息:相比点估计,区间估计提供了估计值的不确定性信息,更为全面。
  2. 增强解释性:区间估计通过置信区间描述估计的可靠性,使得统计推断结果更具解释性。
  3. 适应不同置信水平:可以根据需要选择不同的置信水平,灵活性高。