大约 2 分钟
标准正态分布是正态分布的一种特殊形式,其均值为0,标准差为1。在统计学和概率论中,标准正态分布通常用 表示。以下是标准正态分布的详细介绍:
定义
标准正态分布是一个均值为0,标准差为1的正态分布,其概率密度函数(PDF)为:
其中, 是标准化后的变量。
特性
- 对称性:标准正态分布关于均值 对称。
- 总面积:标准正态分布曲线下的总面积等于1。
- 68-95-99.7 规则:在标准正态分布中,
- 约68%的数据位于 的 ±1个标准差内(即在区间 [-1, 1] 内)。
- 约95%的数据位于 的 ±2个标准差内(即在区间 [-2, 2] 内)。
- 约99.7%的数据位于 的 ±3个标准差内(即在区间 [-3, 3] 内)。
标准化
将任意正态分布 的变量 转换为标准正态分布 的过程称为标准化。标准化公式为:
其中, 是均值, 是标准差。标准化后的变量 遵循标准正态分布 。
累积分布函数(CDF)
标准正态分布的累积分布函数(CDF)表示随机变量 小于或等于某一值 的概率,记为 :
当z取无穷时, 这是高斯积分, 可以计算; 但当z不是无穷时, 这个积分没有解析解,通常使用数值方法或查表来计算。
Z表
标准正态分布表(Z表)列出了不同 值对应的累积分布函数值 。Z表通常用于计算各种概率,如:
应用
标准正态分布在统计学中有广泛的应用,主要包括:
- 假设检验:用于计算p值和确定临界值。
- 置信区间:用于构建参数估计的置信区间。
- 概率计算:用于计算在不同范围内数据的概率。
示例
假设我们有一个随机变量 服从正态分布 。我们想知道 小于115的概率。首先,我们将 标准化:
然后查找标准正态分布表得到:
因此,,即约84.13%的概率 小于115。
标准正态分布是理解和应用正态分布的重要基础工具,通过标准化,许多复杂的概率和统计问题都能得到简化和解决。