跳至主要內容

CyletixGPT-4大约 2 分钟

总体和样本的期望与方差

在统计学中,总体(population)和样本(sample)的期望(均值)和方差是描述数据集中趋势和离散程度的重要指标。以下是总体和样本的期望与方差的定义和计算公式。

总体期望和方差

总体期望(均值):总体的期望值是总体中所有个体数值的平均值。设总体中有 NN 个数据点 X1,X2,,XNX_1, X_2, \ldots, X_N,则总体期望 μ\mu 定义为:

μ=1Ni=1NXi \mu = \frac{1}{N} \sum_{i=1}^{N} X_i

总体方差:总体的方差是总体中各个数据点与总体均值之间的平方差的平均值。设总体期望为 μ\mu,则总体方差 σ2\sigma^2 定义为:

σ2=1Ni=1N(Xiμ)2 \sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (X_i - \mu)^2

样本期望和方差

样本期望(均值):样本的期望值是从总体中抽取的样本的所有个体数值的平均值。设样本中有 nn 个数据点 x1,x2,,xnx_1, x_2, \ldots, x_n,则样本期望 xˉ\bar{x} 定义为:

xˉ=1ni=1nxi \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i

样本方差:样本的方差是样本中各个数据点与样本均值之间的平方差的平均值,但为了使样本方差更好地估计总体方差,计算样本方差时需除以 n1n-1 而不是 nn。设样本期望为 xˉ\bar{x},则样本方差 s2s^2 定义为:

s2=1n1i=1n(xixˉ)2 s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2

示例

假设我们有以下样本数据:2, 4, 6, 8, 10

  1. 计算样本均值

    xˉ=15(2+4+6+8+10)=305=6 \bar{x} = \frac{1}{5} (2 + 4 + 6 + 8 + 10) = \frac{30}{5} = 6

  2. 计算样本方差

    s2=151i=15(xixˉ)2=14[(26)2+(46)2+(66)2+(86)2+(106)2] s^2 = \frac{1}{5-1} \sum_{i=1}^{5} (x_i - \bar{x})^2 = \frac{1}{4} [(2-6)^2 + (4-6)^2 + (6-6)^2 + (8-6)^2 + (10-6)^2]

    =14[16+4+0+4+16]=404=10 = \frac{1}{4} [16 + 4 + 0 + 4 + 16] = \frac{40}{4} = 10

结论

  • 总体期望(均值)μ=1Ni=1NXi\mu = \frac{1}{N} \sum_{i=1}^{N} X_i
  • 总体方差σ2=1Ni=1N(Xiμ)2\sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (X_i - \mu)^2
  • 样本期望(均值)xˉ=1ni=1nxi\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i
  • 样本方差s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 总体期望和方差描述了总体的集中趋势和离散程度,而样本期望和方差则用于估计总体的这些特征。计算样本方差时需除以 n1n-1 而不是 nn,以减少估计的偏差。