《linear algebra done wrong》上正交投影矩阵的公式是怎么推导出来的?

2023-06-13 阅读 47

《Linear Algebra Done Wrong》一书中第七章讨论了正交投影矩阵。该矩阵可以将向量投影到一个子空间上,同时保持向量在该子空间上的长度不变。下面是该书中对于正交投影矩阵的推导过程:

假设W是一个n维向量空间的子空间,P是一个线性变换,将向量v投影到W上。那么,P的矩阵表示应该满足以下条件:

  1. 对于任意向量v\in WPv=v,即vW上的投影等于自身。

  2. 对于任意向量u\in W^\perpPu=0,即uW上的投影为零。

考虑一个基于W的正交基\{w_1,\cdots,w_k\}W^\perp的正交基\{w_{k+1},\cdots,w_n\}。那么,P的矩阵表示应该满足以下条件:

  1. 对于任意向量v\in WPv=\sum_{i=1}^k\langle v,w_i\rangle w_i,即vW上的投影是基向量的线性组合。

  2. 对于任意向量u\in W^\perpPu=\sum_{i=k+1}^n\langle u,w_i\rangle w_i,即uW的正交补上的投影是基向量的线性组合。

我们可以将P的矩阵表示写成P=[w_1,\cdots,w_k|w_{k+1},\cdots,w_n]M的形式,其中[w_1,\cdots,w_k|w_{k+1},\cdots,w_n]是由WW^\perp的基向量组成的矩阵,M是一个n\times n的矩阵。根据上面的条件,我们可以得到以下等式:

\begin{aligned} Pw_i &= w_i, \quad i=1,\cdots,k \\ Pw_i &= 0, \quad i=k+1,\cdots,n \end{aligned}

P=[w_1,\cdots,w_k|w_{k+1},\cdots,w_n]M代入上述等式,我们可以得到以下等式:

\begin{aligned} [w_1,\cdots,w_k|w_{k+1},\cdots,w_n]Mw_i &= w_i, \quad i=1,\cdots,k \\ [w_1,\cdots,w_k|w_{k+1},\cdots,w_n]Mw_i &= 0, \quad i=k+1,\cdots,n \end{aligned}

根据正交基的性质,我们可以得到以下等式:

\begin{aligned} Mw_i &= w_i, \quad i=1,\cdots,k \\ Mw_i &= 0, \quad i=k+1,\cdots,n \end{aligned}

也就是说,M的第一部分是一个单位矩阵,第二部分是一个零矩阵。因此,M的矩阵表示为:

M=\begin{bmatrix} I_k & 0 \\ 0 & 0 \end{bmatrix}

其中I_kk\times k的单位矩阵。将M代入P=[w_1,\cdots,w_k|w_{k+1},\cdots,w_n]M,我们可以得到:

P=[w_1,\cdots,w_k]\begin{bmatrix} I_k \\ 0 \end{bmatrix}=[w_1,\cdots,w_k][w_1,\cdots,w_k]^T

这就是正交投影矩阵的公式。

更新于 2023年06月14日