跳至主要內容

CyletixGPT-4大约 2 分钟

标准正态分布是正态分布的一种特殊形式,其均值为0,标准差为1。在统计学和概率论中,标准正态分布通常用 ZZ 表示。以下是标准正态分布的详细介绍:

定义

标准正态分布是一个均值为0,标准差为1的正态分布,其概率密度函数(PDF)为:

f(z)=12πez22 f(z) = \frac{1}{\sqrt{2\pi}} e^{-\frac{z^2}{2}}

其中, zz 是标准化后的变量。

特性

  1. 对称性:标准正态分布关于均值 z=0z = 0 对称。
  2. 总面积:标准正态分布曲线下的总面积等于1。
  3. 68-95-99.7 规则:在标准正态分布中,
    • 约68%的数据位于 z=0z = 0 的 ±1个标准差内(即在区间 [-1, 1] 内)。
    • 约95%的数据位于 z=0z = 0 的 ±2个标准差内(即在区间 [-2, 2] 内)。
    • 约99.7%的数据位于 z=0z = 0 的 ±3个标准差内(即在区间 [-3, 3] 内)。

标准化

将任意正态分布 N(μ,σ2)N(\mu, \sigma^2) 的变量 XX 转换为标准正态分布 ZZ 的过程称为标准化。标准化公式为:

Z=Xμσ Z = \frac{X - \mu}{\sigma}

其中,μ\mu 是均值,σ\sigma 是标准差。标准化后的变量 ZZ 遵循标准正态分布 N(0,1)N(0, 1)

累积分布函数(CDF)

标准正态分布的累积分布函数(CDF)表示随机变量 ZZ 小于或等于某一值 zz 的概率,记为 Φ(z)\Phi(z)

Φ(z)=P(Zz)=z12πet22dt \Phi(z) = P(Z \leq z) = \int_{-\infty}^{z} \frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} \, dt

当z取无穷时, 这是高斯积分, 可以计算; 但当z不是无穷时, 这个积分没有解析解,通常使用数值方法或查表来计算。

Z表

标准正态分布表(Z表)列出了不同 zz 值对应的累积分布函数值 Φ(z)\Phi(z)。Z表通常用于计算各种概率,如:

  • P(Zz)P(Z \leq z)
  • P(Zz)=1Φ(z)P(Z \geq z) = 1 - \Phi(z)
  • P(aZb)=Φ(b)Φ(a)P(a \leq Z \leq b) = \Phi(b) - \Phi(a)

应用

标准正态分布在统计学中有广泛的应用,主要包括:

  1. 假设检验:用于计算p值和确定临界值。
  2. 置信区间:用于构建参数估计的置信区间。
  3. 概率计算:用于计算在不同范围内数据的概率。

示例

假设我们有一个随机变量 XX 服从正态分布 N(100,152)N(100, 15^2)。我们想知道 XX 小于115的概率。首先,我们将 XX 标准化:

Z=11510015=1 Z = \frac{115 - 100}{15} = 1

然后查找标准正态分布表得到:

P(Z1)=Φ(1)0.8413 P(Z \leq 1) = \Phi(1) \approx 0.8413

因此,P(X115)0.8413P(X \leq 115) \approx 0.8413,即约84.13%的概率 XX 小于115。

标准正态分布是理解和应用正态分布的重要基础工具,通过标准化,许多复杂的概率和统计问题都能得到简化和解决。