区间估计是统计推断中用于估计总体参数的一种方法,它提供了一个范围(区间)而不是单一的点估计值。区间估计不仅提供了参数估计值,还给出了估计值的不确定性信息。区间估计的结果通常表现为一个包含总体参数的置信区间。
对于总体均值 μ 的置信区间,假设样本均值为 Xˉ,样本标准误为 SE,则置信区间可以表示为:
Xˉ±Zα/2⋅SE
其中,Zα/2 是标准正态分布下对应置信水平的临界值。
当样本量较小且总体方差未知时,使用 t 分布:
Xˉ±tα/2,n−1⋅SE
其中,tα/2,n−1 是自由度为 n−1 的 t 分布的临界值。
σ2(n−1)S2=σ2[(X1−Xˉ)2+(X2−Xˉ)2+⋯+(Xn−Xˉ)2]∼χ2(n−1)
则有
nS2Xˉ−μ∼t(n−1)
估计某镇收获的苹果重量的母平均数𝝁的范围 已知
- 总体方差为502
- 随机抽取 100 个样本, 平均值为 350
求此时 𝝁 的 95% 置信区间
使用区间估计来求出总体均值 μ 的95%置信区间 已知总体方差 σ2=502,样本大小 n=100,样本均值 xˉ=350
- 枢轴量: 由于已知总体方差 σ2,我们可以使用正态分布的枢轴量。
Z=σ/nxˉ−μ
该枢轴量 Z 服从标准正态分布 N(0,1)。
- 置信区间: 对于95%的置信水平,对应的标准正态分布的临界值 zα/2=1.96。 解以下不等式来求 μ 的95%置信区间:
−1.96≤σ/nxˉ−μ≤1.96
−1.96≤50/100350−μ≤1.96
350−9.8≤μ≤350+9.8
- 结论: 母平均数 μ 的95%置信区间为:
[340.2,359.8]
- 提供不确定性信息:相比点估计,区间估计提供了估计值的不确定性信息,更为全面。
- 增强解释性:区间估计通过置信区间描述估计的可靠性,使得统计推断结果更具解释性。
- 适应不同置信水平:可以根据需要选择不同的置信水平,灵活性高。