跳至主要內容

定义

Cyletix大约 4 分钟

定义

正定矩阵有时会简称为正定阵, 是对称矩阵或者更一般的厄米矩阵的一种特殊形式, 满足:

  1. 对称性:矩阵 AA 是对称的,即 A=ATA = A^T
  2. 所有特征值均为正:矩阵 AA 的所有特征值 λi\lambda_i 都大于零。

二次型

所有特征值均为正这一性质使得正定矩阵在优化问题中特别重要,因为它对应于严格凸的二次型。一个 n×nn \times n 的实对称矩阵 AA 被称为正定矩阵,如果对于所有非零向量 xRnx \in \mathbb{R}^n,都有:

xTAx>0 x^T A x > 0

如果二次型同时包含了等于零的情况, 这时A称为[[半正定矩阵]].

在线性代数中,正定矩阵的性质类似复数中的正实数。与正定矩阵相对应的线性算子是对称正定双线性形式(复域中则对应埃尔米特正定双线性形式)。

性质

正定矩阵有以下性质:

  1. 所有特征值都为正。
  2. 所有正定矩阵都是对称矩阵 A=ATA = A^T
  3. 正定二次型:对于任意非零向量xxxTAx>0x^T A x > 0
  4. 行列式大于零,det(A)>0\text{det}(A) > 0
  5. 正定矩阵都可逆,并且其逆矩阵也是正定矩阵。
  6. Cholesky分解: 任意正定矩阵AA可以进行Cholesky分解,即存在一个下三角矩阵LL,使得A=LLTA = LL^T,其中LL是唯一的并且所有对角线元素均为正。
  7. 正定性保持: 如果AA是正定矩阵,且BB是非零矩阵,则BTABB^T A B也是正定矩阵。
  8. Schur补性: 若AA是正定矩阵,可以通过Schur补来证明部分子矩阵也具有正定性。
  9. 最小特征值界限: 正定矩阵的最小特征值提供了其矩阵范数的下界,即Aλmin(A)\|A\| \geq \lambda_{\min}(A),其中λmin(A)\lambda_{\min}(A)是矩阵AA的最小特征值。

判断

判断一个矩阵是否为正定矩阵,可以通过以下几种方法:

  1. 特征值法: 如果矩阵AA的所有特征值都为正,则AA是正定矩阵。特征值可以通过求解矩阵的特征多项式得到。

  2. 主子矩阵法(Leading Principal Minors): 如果矩阵AA的所有主子矩阵(即从左上角开始的所有子矩阵)的行列式都大于零,则AA是正定矩阵。具体步骤如下:

    • 对于1×11 \times 1的主子矩阵,其行列式必须大于零。
    • 对于2×22 \times 2的主子矩阵,其行列式必须大于零。
    • 对于3×33 \times 3的主子矩阵,其行列式必须大于零。
    • 以此类推,直到n×nn \times n的主子矩阵。
  3. 矩阵形式法: 对于任意非零向量zz,若zTAz>0z^T A z > 0,则矩阵AA是正定的。

示例

让我们应用这些方法判断矩阵A=[3113]A = \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix}是否为正定矩阵:

特征值法

求矩阵AA的特征值:

det(AλI)=3λ113λ=(3λ)(3λ)11=λ26λ+8=0 \text{det}(A - \lambda I) = \begin{vmatrix} 3 - \lambda & 1 \\ 1 & 3 - \lambda \end{vmatrix} = (3 - \lambda)(3 - \lambda) - 1 \cdot 1 = \lambda^2 - 6\lambda + 8 = 0

解特征方程:

λ26λ+8=0 \lambda^2 - 6\lambda + 8 = 0

λ=6±36322=6±22=4 or 2 \lambda = \frac{6 \pm \sqrt{36 - 32}}{2} = \frac{6 \pm 2}{2} = 4 \text{ or } 2

由于特征值4422都大于零,所以矩阵AA是正定矩阵。

主子矩阵法

考虑矩阵AA的主子矩阵:

  • 1×11 \times 1的主子矩阵:[3]\begin{bmatrix} 3 \end{bmatrix},行列式为3>03 > 0
  • 2×22 \times 2的主子矩阵:[3113]\begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix},行列式为3311=91=8>03 \cdot 3 - 1 \cdot 1 = 9 - 1 = 8 > 0

由于所有主子矩阵的行列式都大于零,所以矩阵AA是正定矩阵。

矩阵形式法

对于任意非零向量z=[z1z2]z = \begin{bmatrix} z_1 \\ z_2 \end{bmatrix},我们计算zTAzz^T A z

zTAz=[z1z2][3113][z1z2]=3z12+2z1z2+3z22 z^T A z = \begin{bmatrix} z_1 & z_2 \end{bmatrix} \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix} \begin{bmatrix} z_1 \\ z_2 \end{bmatrix} = 3z_1^2 + 2z_1 z_2 + 3z_2^2

这是一个严格的二次形式,因为对任意非零向量zz3z12+2z1z2+3z22>03z_1^2 + 2z_1 z_2 + 3z_2^2 > 0

综上所述,矩阵A=[3113]A = \begin{bmatrix} 3 & 1 \\ 1 & 3 \end{bmatrix}是正定矩阵。