矩阵代数(一):行列式与矩阵求逆

矩阵代数(一):行列式与矩阵求逆

矩阵基本概念

矩阵(Matrix)是线性代数中主要的研究对象,在此,我会给出在本博客中使用的所有矩阵基本符号及定义,后面所有关于线性代数的讨论都将以此作为基础。

用 m×nm\times nm×n 个数排成 mmm 行的数表

[a11a12⋯a1na21a22⋯a2n⋮⋮⋮am1am2⋯amn]\begin{bmatrix}

a_{11}&a_{12}&\cdots&a_{1n}\\

a_{21}&a_{22}&\cdots&a_{2n}\\

\vdots&\vdots&&\vdots\\

a_{m1}&a_{m2}&\cdots&a_{mn}

\end{bmatrix}​a11​a21​⋮am1​​a12​a22​⋮am2​​⋯⋯⋯​a1n​a2n​⋮amn​​​

称作 m×nm\times nm×n 矩阵,记作 A=(aij)m×n\bm A=(a_{ij})_{m\times n}A=(aij​)m×n​ ,其中 aija_{ij}aij​ 是矩阵第 iii 行第 jjj 列的元素,称作 (i,j)(i,j)(i,j) 元,元素为实数的矩阵称作实矩阵,元素为复数的矩阵称作复矩阵,两个矩阵行数列数相同则称为同型矩阵,同型矩阵对应元素相同则称作相等矩阵。

m×nm\times nm×n 个元素全为零的矩阵称作零矩阵,记作 O\bm OO 。

主对角线元素全为1的矩阵称作单位矩阵,记作 I\bm II 或 E\bm EE :

I=[10⋯001⋯0⋮⋮⋮00⋯1]\bm I=\begin{bmatrix}

1&0&\cdots&0\\

0&1&\cdots&0\\

\vdots&\vdots&&\vdots\\

0&0&\cdots&1

\end{bmatrix}I=​10⋮0​01⋮0​⋯⋯⋯​00⋮1​​

当 m=1m=1m=1 时,称 Am×n\bm A_{m\times n}Am×n​ 为行矩阵或行向量;

当 n=1n=1n=1 时,称 Am×n\bm A_{m\times n}Am×n​ 为列矩阵或列向量;

当 m=nm=nm=n 时,称 A\bm AA 为 nnn 阶方阵,简记为 An\bm A_nAn​ 。

矩阵基本运算

矩阵加法(仅限于同型矩阵):

A+B=(aij+bij)\bm A+\bm B=(a_{ij}+b_{ij})

A+B=(aij​+bij​)

负矩阵: A+(−A)=O\bm A+(-\bm A)=\bm OA+(−A)=O

矩阵加法满足交换律和结合律。

数乘矩阵:

λ(μA)=(λμ)A\lambda(\mu\bm A)=(\lambda\mu)\bm Aλ(μA)=(λμ)A

(μ+λ)A=μA+λA(\mu+\lambda)\bm A=\mu\bm A+\lambda\bm A(μ+λ)A=μA+λA

λ(A+B)=λA+λB\lambda(\bm A+\bm B)=\lambda\bm A+\lambda\bm Bλ(A+B)=λA+λB

(−1)A=−A(-1)\bm A=-\bm A(−1)A=−A

矩阵乘法:

C=AB\bm C=\bm A\bm B

C=AB

只有当左乘矩阵 A\bm AA 的列数等于右乘矩阵 B\bm BB 的行数时,矩阵才能相乘,所得矩阵 C\bm CC 的行数与 A\bm AA 的行数一致,列数与 B\bm BB 的列数一致。

对乘加法则: C\bm CC 的任一元素就等于这个元素所在行对应于 A\bm AA 的行向量和这个元素所在列对应于 B\bm BB 的列向量的点乘:

cij=∑k=1naikbkj(i=1,2,⋯ ,m;j=1,2,⋯ ,p)c_{ij}=\sum_{k=1}^na_{ik}b_{kj}\quad(i=1,2,\cdots,m;j=1,2,\cdots,p)

cij​=k=1∑n​aik​bkj​(i=1,2,⋯,m;j=1,2,⋯,p)

矩阵乘法满足结合律和分配律,但不满足交换律。

任何矩阵和单位矩阵相乘都等于其本身。

矩阵的幂:

AkAl=Ak+l\bm A^k\bm A^l=\bm A^{k+l}AkAl=Ak+l

(Ak)l=Akl(\bm A^k)^l=\bm A^{kl}(Ak)l=Akl

(AB)k=AkBk(\bm{AB})^k=\bm A^k\bm B^k(AB)k=AkBk 不一定成立。

矩阵转置:

矩阵转置就是将矩阵每一元素的行列位置互换:

(aij)T=(aji)(a_{ij})^T=(a_{ji})

(aij​)T=(aji​)

(AT)T=A(\bm A^T)^T=\bm A(AT)T=A

(A+B)T=AT+BT(\bm A+\bm B)^T=\bm A^T+\bm B^T(A+B)T=AT+BT

(λA)T=λAT(\lambda\bm A)^T=\lambda\bm A^T(λA)T=λAT

(AB)T=BTAT(\bm A\bm B)^T=\bm B^T\bm A^T(AB)T=BTAT

矩阵的分块运算

A=[A11A12⋯A1tA21A22⋯A2t⋮⋮⋮As1As2⋯Ast]\bm A=\begin{bmatrix}

\bm A_{11}&\bm A_{12}&\cdots&\bm A_{1t}\\

\bm A_{21}&\bm A_{22}&\cdots&\bm A_{2t}\\

\vdots&\vdots&&\vdots\\

\bm A_{s1}&\bm A_{s2}&\cdots&\bm A_{st}

\end{bmatrix}A=​A11​A21​⋮As1​​A12​A22​⋮As2​​⋯⋯⋯​A1t​A2t​⋮Ast​​​

分块加法运算(仅限于分块方法相同的矩阵):

A+B=[A11+B11A12+B12⋯A1t+B1tA21+B21A22+B22⋯A2t+B2t⋮⋮⋮As1+Bs1As2+Bs2⋯Ast+Bst]\bm A+\bm B=\begin{bmatrix}

\bm A_{11}+\bm B_{11}&\bm A_{12}+\bm B_{12}&\cdots&\bm A_{1t}+\bm B_{1t}\\

\bm A_{21}+\bm B_{21}&\bm A_{22}+\bm B_{22}&\cdots&\bm A_{2t}+\bm B_{2t}\\

\vdots&\vdots&&\vdots\\

\bm A_{s1}+\bm B_{s1}&\bm A_{s2}+\bm B_{s2}&\cdots&\bm A_{st}+\bm B_{st}

\end{bmatrix}A+B=​A11​+B11​A21​+B21​⋮As1​+Bs1​​A12​+B12​A22​+B22​⋮As2​+Bs2​​⋯⋯⋯​A1t​+B1t​A2t​+B2t​⋮Ast​+Bst​​​

分块数乘运算:

λA=[λA11λA12⋯λA1tλA21λA22⋯λA2t⋮⋮⋮λAs1λAs2⋯λAst]\lambda\bm A=\begin{bmatrix}

\lambda\bm A_{11}&\lambda\bm A_{12}&\cdots&\lambda\bm A_{1t}\\

\lambda\bm A_{21}&\lambda\bm A_{22}&\cdots&\lambda\bm A_{2t}\\

\vdots&\vdots&&\vdots\\

\lambda\bm A_{s1}&\lambda\bm A_{s2}&\cdots&\lambda\bm A_{st}

\end{bmatrix}λA=​λA11​λA21​⋮λAs1​​λA12​λA22​⋮λAs2​​⋯⋯⋯​λA1t​λA2t​⋮λAst​​​

分块乘法运算(对 A\bm AA 列的分法和对 B\bm BB 行的分法一致):

AB=[C11C12⋯C1rC21C22⋯C2r⋮⋮⋮Cs1Cs2⋯Csr]\bm A\bm B=\begin{bmatrix}

\bm C_{11}&\bm C_{12}&\cdots&\bm C_{1r}\\

\bm C_{21}&\bm C_{22}&\cdots&\bm C_{2r}\\

\vdots&\vdots&&\vdots\\

\bm C_{s1}&\bm C_{s2}&\cdots&\bm C_{sr}

\end{bmatrix}AB=​C11​C21​⋮Cs1​​C12​C22​⋮Cs2​​⋯⋯⋯​C1r​C2r​⋮Csr​​​

Cij=∑k=1tAikBkj(i=1,2,⋯ ,s;j=1,2,⋯ ,r)\bm C_{ij}=\sum_{k=1}^t\bm A_{ik}\bm B_{kj}\quad(i=1,2,\cdots,s;j=1,2,\cdots,r)

Cij​=k=1∑t​Aik​Bkj​(i=1,2,⋯,s;j=1,2,⋯,r)

分块矩阵转置:

AT=[A11TA21T⋯As1TA12TA22T⋯As2T⋮⋮⋮A1tTA2tT⋯AstT]\bm A^T=\begin{bmatrix}

\bm A_{11}^T&\bm A_{21}^T&\cdots&\bm A_{s1}^T\\

\bm A_{12}^T&\bm A_{22}^T&\cdots&\bm A_{s2}^T\\

\vdots&\vdots&&\vdots\\

\bm A_{1t}^T&\bm A_{2t}^T&\cdots&\bm A_{st}^T

\end{bmatrix}AT=​A11T​A12T​⋮A1tT​​A21T​A22T​⋮A2tT​​⋯⋯⋯​As1T​As2T​⋮AstT​​​

特殊矩阵

以下讨论的特殊矩阵均为方阵。

对角矩阵:

Λ=[λ1λ2⋱λn]\bm\Lambda=\begin{bmatrix}\lambda_1\\&\lambda_2\\&&\ddots&\\&&&\lambda_n\end{bmatrix}

Λ=​λ1​​λ2​​⋱​λn​​​

简记为 Λ=diag(λ1,λ2,⋯ ,λn)\bm\Lambda={\rm diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)Λ=diag(λ1​,λ2​,⋯,λn​)

对角矩阵的乘积和幂比较特殊:

AB=BA=[a1b1a2b2⋱anbn]\bm{AB}=\bm{BA}=\begin{bmatrix}a_1b_1\\&a_2b_2\\&&\ddots&\\&&&a_nb_n\end{bmatrix}

AB=BA=​a1​b1​​a2​b2​​⋱​an​bn​​​

Λk=[λ1kλ2k⋱λnk]\bm\Lambda^k=\begin{bmatrix}\lambda_1^k\\&\lambda_2^k\\&&\ddots&\\&&&\lambda_n^k\end{bmatrix}

Λk=​λ1k​​λ2k​​⋱​λnk​​​

标量矩阵(对角矩阵的特殊情况):

A=[aa⋱a]\bm A=\begin{bmatrix}a\\&a\\&&\ddots&\\&&&a\end{bmatrix}

A=​a​a​⋱​a​​

上三角形矩阵:

[a11a12⋯a1n0a22⋯a2n⋮⋮⋮00⋯amn]\begin{bmatrix}

a_{11}&a_{12}&\cdots&a_{1n}\\

0&a_{22}&\cdots&a_{2n}\\

\vdots&\vdots&&\vdots\\

0&0&\cdots&a_{mn}

\end{bmatrix}​a11​0⋮0​a12​a22​⋮0​⋯⋯⋯​a1n​a2n​⋮amn​​​

下三角形矩阵:

[a110⋯0a21a22⋯0⋮⋮⋮am1am2⋯amn]\begin{bmatrix}

a_{11}&0&\cdots&0\\

a_{21}&a_{22}&\cdots&0\\

\vdots&\vdots&&\vdots\\

a_{m1}&a_{m2}&\cdots&a_{mn}

\end{bmatrix}​a11​a21​⋮am1​​0a22​⋮am2​​⋯⋯⋯​00⋮amn​​​

上三角矩阵和下三角矩阵可以通过转置互相转换。

对于 nnn 阶上(下)三角形矩阵 A,B\bm A,\bm BA,B ,矩阵乘积 AB\bm{AB}AB (或 BA\bm{BA}BA )的主对角线元素刚好就是 A,B\bm A,\bm BA,B 相应主对角线元素的乘积:

AB=[a1b1????a2b2??⋮⋮⋱⋮???anbn]\bm{AB}=\begin{bmatrix}a_1b_1&?&?&?\\?&a_2b_2&?&?\\\vdots&\vdots&\ddots&\vdots\\?&?&?&a_nb_n\end{bmatrix}

AB=​a1​b1​?⋮?​?a2​b2​⋮?​??⋱?​??⋮an​bn​​​

对称矩阵:

对阵矩阵中关于主对角线对称的两个元素相等:

aij=ajia_{ij}=a_{ji}

aij​=aji​

对称矩阵转置,矩阵不发生改变: AT=A\bm A^T=\bm AAT=A

反称矩阵:

反称矩阵中关于主对角线对称的两个元素相反,并且主对角线上的元素均为零:

aij=−ajia_{ij}=-a_{ji}

aij​=−aji​

反称矩阵转置,矩阵中的元素取其相反数: AT=−A\bm A^T=-\bm AAT=−A

任何方阵均可以表示为一个对称矩阵和一个反称矩阵之和。

分块对角矩阵:

一个分块矩阵,其主对角线上的子块全是方阵(阶数可以不同),其余子块均为零矩阵。

分块对角矩阵的性质和对角矩阵的性质类似。

初等变换和初等矩阵

为了解释矩阵的初等变换,我们需要引入同解方程组的概念。考虑一个线性方程组,以下三种操作不会影响方程组最后的解:

用一个不等于零的数去乘某个方程。

用一个数去乘某个方程后加到另一个方程上去。

交换两个方程的位置。

这些操作就被称为线性方程组的初等变换(Elementary transformation),经过初等变换后得到的新方程组和原来的方程组互为同解方程组。

同样的,对于矩阵而言,我们有以下三种初等行变换:

倍法变换:用一个非零的数乘矩阵的某行。

消法变换:用一个数乘矩阵的某行后再加到另一行上去,

换法变换:交换矩阵的两行。

矩阵的初等行变换和初等列变换,统称为矩阵的初等变换。

如果矩阵 A\bm AA 经过有限次初等变换变成矩阵 B\bm BB ,则称矩阵 A,B\bm A,\bm BA,B 等价,记作 A≅B\bm A\cong\bm BA≅B 。

矩阵之间的等价关系具有如下性质:

自反性: A≅A\bm A\cong\bm AA≅A

对称性: 若 A≅B\bm A\cong\bm BA≅B ,则 B≅A\bm B\cong\bm AB≅A

传递性: 若 A≅B,B≅C\bm A\cong\bm B,\bm B\cong\bm CA≅B,B≅C ,则 A≅C\bm A\cong\bm CA≅C

初等矩阵:

对单位矩阵 I\bm II 施加一次初等变换得到的矩阵称为初等矩阵。

用初等矩阵左乘 A\bm AA ,相当于对 A\bm AA 进行对应的初等行变换;用初等矩阵右乘 A\bm AA ,相当于对 A\bm AA 进行对应的初等列变换。

初等倍法矩阵:

P(i[k])=[1⋱1k1⋱1]\bm P(i[k])=\begin{bmatrix}1\\&\ddots\\&&1\\&&&k\\&&&&1\\&&&&&\ddots\\&&&&&&1\end{bmatrix}

P(i[k])=​1​⋱​1​k​1​⋱​1​​

初等消法矩阵:

P(i,j[k])=[1⋱1⋯k⋱⋮1⋱1]\bm P(i,j[k])=\begin{bmatrix}1\\&\ddots\\&&1&\cdots&k\\&&&\ddots&\vdots\\&&&&1\\&&&&&\ddots\\&&&&&&1\end{bmatrix}

P(i,j[k])=​1​⋱​1​⋯⋱​k⋮1​⋱​1​​

初等换法矩阵:

P(i,j)=[1⋱0⋯1⋮⋮1⋯0⋱1]\bm P(i,j)=\begin{bmatrix}1\\&\ddots\\&&0&\cdots&1\\&&\vdots&&\vdots\\&&1&\cdots&0\\&&&&&\ddots\\&&&&&&1\end{bmatrix}

P(i,j)=​1​⋱​0⋮1​⋯⋯​1⋮0​⋱​1​​

标准形矩阵:

任何一个矩阵 Am×n\bm A_{m\times n}Am×n​ 必能经过有限次初等变换化为如下形式:

G=[IrOOO]=[1⋱10⋯0⋮⋮0⋯0]\bm G=\begin{bmatrix}\bm I_r&\bm O\\\bm O&\bm O\end{bmatrix}=\begin{bmatrix}1\\&\ddots\\&&1\\&&&0&\cdots&0\\&&&\vdots&&\vdots\\&&&0&\cdots&0\end{bmatrix}

G=[Ir​O​OO​]=​1​⋱​1​0⋮0​⋯⋯​0⋮0​​

其中 Ir\bm I_rIr​ 的行数为 rrr ,则 0≤r≤min⁡{m,n}0\leq r\leq\min\{m,n\}0≤r≤min{m,n} , G\bm GG 称为矩阵 A\bm AA 在初等变换下的标准形,简称标准形矩阵。

在将矩阵变换为标准形的时候,我们会同时用到初等行变换和初等列变换,但大多数时候我们只会使用初等行变换,将矩阵变换为行阶梯形矩阵,它的特点是:

矩阵的所有元素全为0的行(如果存在的话)都集中在矩阵的最下面;

每行左起第一个非零元素(称为首非零元)的下方元素全为0。

形如:

[c11c12⋯c1rc1r+1⋯c1n0c22⋯c2rc2r+1⋯c2n⋮⋮⋮⋮⋮00⋯crrcrr+1⋯crn00⋯00⋯0⋮⋮⋮⋮⋮00⋯00⋯0]\begin{bmatrix}

c_{11}&c_{12}&\cdots&c_{1r}&c_{1r+1}&\cdots&c_{1n}\\

0&c_{22}&\cdots&c_{2r}&c_{2r+1}&\cdots&c_{2n}\\

\vdots&\vdots&&\vdots&\vdots&&\vdots\\

0&0&\cdots&c_{rr}&c_{rr+1}&\cdots&c_{rn}\\

0&0&\cdots&0&0&\cdots&0\\

\vdots&\vdots&&\vdots&\vdots&&\vdots\\

0&0&\cdots&0&0&\cdots&0\\

\end{bmatrix}​c11​0⋮00⋮0​c12​c22​⋮00⋮0​⋯⋯⋯⋯⋯​c1r​c2r​⋮crr​0⋮0​c1r+1​c2r+1​⋮crr+1​0⋮0​⋯⋯⋯⋯⋯​c1n​c2n​⋮crn​0⋮0​​

行阶梯形任能继续化简为行最简形矩阵:

[1⋯0c11⋯c1n⋮⋮⋮⋮0⋯1cr1⋯crn0⋯00⋯0⋮⋮⋮⋮0⋯00⋯0]\begin{bmatrix}

1&\cdots&0&c_{11}&\cdots&c_{1n}\\

\vdots&&\vdots&\vdots&&\vdots\\

0&\cdots&1&c_{r1}&\cdots&c_{rn}\\

0&\cdots&0&0&\cdots&0\\

\vdots&&\vdots&\vdots&&\vdots\\

0&\cdots&0&0&\cdots&0\\

\end{bmatrix}​1⋮00⋮0​⋯⋯⋯⋯​0⋮10⋮0​c11​⋮cr1​0⋮0​⋯⋯⋯⋯​c1n​⋮crn​0⋮0​​

显然,行最简形矩阵只要再作适当的初等列变换,就能化为标准形矩阵。

行列式(Determinant)

行列式是一种对于方阵的运算,其运算结果是一个数,设 nnn 阶方阵 A=(aij)\bm A=(a_{ij})A=(aij​) ,称

∣a11a12⋯a1na21a22⋯a2n⋮⋮⋮an1an2⋯ann∣\begin{vmatrix}

a_{11}&a_{12}&\cdots&a_{1n}\\

a_{21}&a_{22}&\cdots&a_{2n}\\

\vdots&\vdots&&\vdots\\

a_{n1}&a_{n2}&\cdots&a_{nn}

\end{vmatrix}​a11​a21​⋮an1​​a12​a22​⋮an2​​⋯⋯⋯​a1n​a2n​⋮ann​​​

为方阵 A\bm AA 的行列式,记作 ∣A∣|\bm A|∣A∣ 或 det⁡A\det AdetA 。

下面,我们主要研究行列式的计算方式及相关性质。

对角线计算法则:

对角线法则适合于计算二阶或三阶这些低阶的行列式:

对于二阶行列式:

∣a11a12a21a22∣=a11a22−a12a21\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}=a_{11}a_{22}-a_{12}a_{21}

​a11​a21​​a12​a22​​​=a11​a22​−a12​a21​

对于三阶行列式:

∣a11a12a13a21a22a23a31a32a33∣= a11a22a33+a12a23a31+a13a21a32− a13a22a31−a12a21a33−a11a23a32\begin{vmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{vmatrix}=\begin{matrix}\ \\\quad a_{11}a_{22}a_{33}+a_{12}a_{23}a_{31}+a_{13}a_{21}a_{32}\\-\ a_{13}a_{22}a_{31}-a_{12}a_{21}a_{33}-a_{11}a_{23}a_{32}\end{matrix}

​a11​a21​a31​​a12​a22​a32​​a13​a23​a33​​​= a11​a22​a33​+a12​a23​a31​+a13​a21​a32​− a13​a22​a31​−a12​a21​a33​−a11​a23​a32​​

对于高阶行列式而言,我们需要寻找更加通用的解法,这就引出了接下来的内容。

全排列与逆序数

nnn 个自然数 1,2,⋯ ,n1,2,\cdots,n1,2,⋯,n 按照任何一种次序排成的有序数组 j1j2⋯jnj_1j_2\cdots j_nj1​j2​⋯jn​ 称为一个 nnn 级排列(Permutation),显然,不重复的 nnn 级排列共有 n!n!n! 个。

若规定从小到大为自然数的标准顺序,则当两个数之间不满足这个顺序时,就称作逆序,一个 nnn 级排列所有逆序的总和称为逆序数(Inversion number),记作 τ(j1j2⋯jn)\tau(j_1j_2\cdots j_n)τ(j1​j2​⋯jn​) 。

逆序数的计算方式:对于排列 j1j2⋯jnj_1j_2\cdots j_nj1​j2​⋯jn​ ,自 j1j_1j1​ 开始直到 jn−1j_{n-1}jn−1​ ,逐个计算每个元素的右边比它大的元素的个数 k1,k2,⋯ ,kn−1k_1,k_2,\cdots,k_{n-1}k1​,k2​,⋯,kn−1​ ,则该排列的逆序数为:

τ(j1j2⋯jn)=k1+k2+⋯+kn−1\tau(j_1j_2\cdots j_n)=k_1+k_2+\cdots+k_{n-1}

τ(j1​j2​⋯jn​)=k1​+k2​+⋯+kn−1​

我们称逆序数为奇数的排列为奇排列,逆序数为偶数的排列为偶排列,排列中任何两个数的位置对换必然会改变排列的奇偶性。

借助排列的概念,可以定义 nnn 行列式 ∣A∣|\bm A|∣A∣ 的通式:

D=∣A∣=∑j1j2⋯jn(−1)τ(j1j2⋯jn)a1j1a2j2⋯anjnD=|\bm A|=\sum_{j_1j_2\cdots j_n}(-1)^{\tau(j_1j_2\cdots j_n)}a_{1j_1}a_{2j_2}\cdots a_{nj_n}

D=∣A∣=j1​j2​⋯jn​∑​(−1)τ(j1​j2​⋯jn​)a1j1​​a2j2​​⋯anjn​​

D=∣A∣=∑i1i2⋯in(−1)τ(i1i2⋯in)ai11ai22⋯ainnD=|\bm A|=\sum_{i_1i_2\cdots i_n}(-1)^{\tau(i_1i_2\cdots i_n)}a_{i_11}a_{i_22}\cdots a_{i_nn}

D=∣A∣=i1​i2​⋯in​∑​(−1)τ(i1​i2​⋯in​)ai1​1​ai2​2​⋯ain​n​

此处的 ∑j1j2⋯jn\sum\limits_{j_1j_2\cdots j_n}j1​j2​⋯jn​∑​ 表示对所有不同的 nnn 阶排列求和,一共是 n!n!n! 项。

乘积项 a1j1a2j2⋯anjna_{1j_1}a_{2j_2}\cdots a_{nj_n}a1j1​​a2j2​​⋯anjn​​ 称为行列式的一个均匀分布项,简称均布项;

(−1)τ(j1j2⋯jn)(-1)^{\tau(j_1j_2\cdots j_n)}(−1)τ(j1​j2​⋯jn​) 称为该均布项的符号因子,其正负性取决于排列的奇偶性。

现在我们已经可以计算高阶行列式的值了,但排列法还是过于复杂,之后我们会了解一个更加常用且更易于理解的方法。

方阵行列式的性质

分行/列可加性:

∣a11a12⋯a1n⋮⋮⋮b1+c1b2+c2⋯bn+cn⋮⋮⋮an1an2⋯ann∣=∣a11a12⋯a1n⋮⋮⋮b1b2⋯bn⋮⋮⋮an1an2⋯ann∣+∣a11a12⋯a1n⋮⋮⋮c1c2⋯cn⋮⋮⋮an1an2⋯ann∣\begin{vmatrix}

a_{11}&a_{12}&\cdots&a_{1n}\\

\vdots&\vdots&&\vdots\\

b_1+c_1&b_2+c_2&\cdots&b_n+c_n\\

\vdots&\vdots&&\vdots\\

a_{n1}&a_{n2}&\cdots&a_{nn}

\end{vmatrix}\\

=\begin{vmatrix}

a_{11}&a_{12}&\cdots&a_{1n}\\

\vdots&\vdots&&\vdots\\

b_1&b_2&\cdots&b_n\\

\vdots&\vdots&&\vdots\\

a_{n1}&a_{n2}&\cdots&a_{nn}

\end{vmatrix}+\begin{vmatrix}

a_{11}&a_{12}&\cdots&a_{1n}\\

\vdots&\vdots&&\vdots\\

c_1&c_2&\cdots&c_n\\

\vdots&\vdots&&\vdots\\

a_{n1}&a_{n2}&\cdots&a_{nn}

\end{vmatrix}​a11​⋮b1​+c1​⋮an1​​a12​⋮b2​+c2​⋮an2​​⋯⋯⋯​a1n​⋮bn​+cn​⋮ann​​​=​a11​⋮b1​⋮an1​​a12​⋮b2​⋮an2​​⋯⋯⋯​a1n​⋮bn​⋮ann​​​+​a11​⋮c1​⋮an1​​a12​⋮c2​⋮an2​​⋯⋯⋯​a1n​⋮cn​⋮ann​​​

转置不变:∣A∣=∣AT∣|\bm A|=|\bm A^T|∣A∣=∣AT∣

若方阵 A\bm AA 的第 iii 行(第 jjj 列)乘 kkk 倍所得得矩阵为 B\bm BB ,则 ∣B∣=k∣A∣|\bm B|=k|\bm A|∣B∣=k∣A∣ :

∣a11a12⋯a1n⋮⋮⋮kb1kb2⋯kbn⋮⋮⋮an1an2⋯ann∣=k∣a11a12⋯a1n⋮⋮⋮b1b2⋯bn⋮⋮⋮an1an2⋯ann∣\begin{vmatrix}

a_{11}&a_{12}&\cdots&a_{1n}\\

\vdots&\vdots&&\vdots\\

kb_1&kb_2&\cdots&kb_n\\

\vdots&\vdots&&\vdots\\

a_{n1}&a_{n2}&\cdots&a_{nn}

\end{vmatrix}=k\begin{vmatrix}

a_{11}&a_{12}&\cdots&a_{1n}\\

\vdots&\vdots&&\vdots\\

b_1&b_2&\cdots&b_n\\

\vdots&\vdots&&\vdots\\

a_{n1}&a_{n2}&\cdots&a_{nn}

\end{vmatrix}​a11​⋮kb1​⋮an1​​a12​⋮kb2​⋮an2​​⋯⋯⋯​a1n​⋮kbn​⋮ann​​​=k​a11​⋮b1​⋮an1​​a12​⋮b2​⋮an2​​⋯⋯⋯​a1n​⋮bn​⋮ann​​​

若方阵 A\bm AA 经过一次换法变换化为 B\bm BB ,则 ∣B∣=−∣A∣|\bm B|=-|\bm A|∣B∣=−∣A∣ 。

推论:若行列式任意两行/列相同,则行列式为0。

推论:若行列式任意两行/列对应元素成比例,则行列式为0。

消法变换不改变行列式的值,即行列式的任意行/列可以乘一个数加到另外一行/列上。

方阵行列式运算规律:

设 A,B\bm A,\bm BA,B 为 nnn 阶方阵, λ\lambdaλ 为常数, mmm 为正整数。

∣λA∣=λ∣A∣|\lambda\bm A|=\lambda|\bm A|∣λA∣=λ∣A∣

∣AB∣=∣A∣∣B∣|\bm{AB}|=|\bm A||\bm B|∣AB∣=∣A∣∣B∣

∣Am∣=∣A∣m|\bm A^m|=|\bm A|^m∣Am∣=∣A∣m

∣I∣=1|\bm I|=1∣I∣=1

拉普拉斯展开(Laplace expansion)

子式: 在 nnn 阶方阵行列式 ∣A∣|\bm A|∣A∣ 中,取部分行列相交形成的阶数

余子式(Minor): 把元素 aija_{ij}aij​ 所在的行列删除后,留下来的 n−1n-1n−1 阶行列式叫做元素 aija_{ij}aij​ 的余子式,记作 MijM_{ij}Mij​ ;把 kkk 阶子式 NNN 所在的行列删除后,留下来的 n−kn-kn−k 阶行列式叫做子式 NNN 的余子式,记作 MMM 。

代数余子式(Cofactor):

Aij=(−1)i+jMijA_{ij}=(-1)^{i+j}M_{ij}

Aij​=(−1)i+jMij​

叫做元素 aija_{ij}aij​ 的代数余子式;

A=(−1)i1+⋯+ik+j1+⋯+jkMA=(-1)^{i_1+\cdots+i_k+j_1+\cdots+j_k}M

A=(−1)i1​+⋯+ik​+j1​+⋯+jk​M

叫做子式 NNN 的代数余子式。(其中 iii 和 jjj 代表子式所处的行和列的序数)

定理: 对于 ∣A∣|\bm A|∣A∣ ,其任意一行/列的所有元素与另一行/列对应元素的代数余子式乘积之和等于零,即当 i≠ji\neq ji=j 时,有:

ai1Aj1+ai2Aj2+⋯+ainAjn=0a1iA1j+a2iA2j+⋯+aniAnj=0a_{i1}A_{j1}+a_{i2}A_{j2}+\cdots+a_{in}A_{jn}=0\\

a_{1i}A_{1j}+a_{2i}A_{2j}+\cdots+a_{ni}A_{nj}=0ai1​Aj1​+ai2​Aj2​+⋯+ain​Ajn​=0a1i​A1j​+a2i​A2j​+⋯+ani​Anj​=0

拉普拉斯定理: 设 DDD 是 nnn 阶行列式,在 DDD 中取定某 kkk 行 (1≤k≤n−1)(1\leq k\leq n-1)(1≤k≤n−1) ,则含与此 kkk 行中的所有 kkk 阶子式与其代数余子式的乘积之和等于 DDD 。

运用拉普拉斯定理,可以将行列式按任意行展开:

∣A∣=ai1Ai1+ai2Ai2+⋯+ainAini=1,2,⋯ ,n|\bm A|=a_{i1}A_{i1}+a_{i2}A_{i2}+\cdots+a_{in}A_{in}\qquad i=1,2,\cdots,n

∣A∣=ai1​Ai1​+ai2​Ai2​+⋯+ain​Ain​i=1,2,⋯,n

同理,也可以按任意列展开:

∣A∣=a1jA1j+a2jA2j+⋯+anjAnjj=1,2,⋯ ,n|\bm A|=a_{1j}A_{1j}+a_{2j}A_{2j}+\cdots+a_{nj}A_{nj}\qquad j=1,2,\cdots,n

∣A∣=a1j​A1j​+a2j​A2j​+⋯+anj​Anj​j=1,2,⋯,n

例: 计算如下行列式

D2n=∣abab⋱⋰abcd⋰⋱cdcd∣D_{2n}=\begin{vmatrix}a&&&&&&&b\\&a&&&&&b\\&&\ddots&&&⋰\\&&&a&b\\&&&c&d\\&&⋰&&&\ddots\\&c&&&&&d\\c&&&&&&&d\end{vmatrix}

D2n​=​ac​ac​⋱⋰​ac​bd​⋰⋱​bd​bd​​

解:按第一行展开,可以得:

D2n=a∣ab0⋱⋰⋮ab⋮cd⋮⋰⋱⋮cd00⋯⋯⋯⋯0d∣+b(−1)1+2n∣0ab⋮⋱⋰⋮ab⋮cd⋮⋰⋱0cdc0⋯⋯⋯⋯0∣D_{2n}=a\begin{vmatrix}a&&&&&b&0\\&\ddots&&&⋰&&\vdots\\&&a&b&&&\vdots\\&&c&d&&&\vdots\\&⋰&&&\ddots&&\vdots\\c&&&&&d&0\\0&\cdots&\cdots&\cdots&\cdots&0&d\end{vmatrix}+b(-1)^{1+2n}\begin{vmatrix}0&a&&&&&b\\\vdots&&\ddots&&&⋰&\\\vdots&&&a&b&&\\\vdots&&&c&d&&\\\vdots&&⋰&&&\ddots&\\0&c&&&&&d\\c

&0&\cdots&\cdots&\cdots&\cdots&0\end{vmatrix}D2n​=a​ac0​⋱⋰⋯​ac⋯​bd⋯​⋰⋱⋯​bd0​0⋮⋮⋮⋮0d​​+b(−1)1+2n​0⋮⋮⋮⋮0c​ac0​⋱⋰⋯​ac⋯​bd⋯​⋰⋱⋯​bd0​​

D2n=adD2(n−1)+(−1)1+2n(−1)2n−1+1bcD2(n−1)=(ad−bc)D2(n−1)\begin{aligned}D_{2n}&=adD_{2(n-1)}+(-1)^{1+2n}(-1)^{2n-1+1}bcD_{2(n-1)}\\&=(ad-bc)D_{2(n-1)}\end{aligned}

D2n​​=adD2(n−1)​+(−1)1+2n(−1)2n−1+1bcD2(n−1)​=(ad−bc)D2(n−1)​​

以此作为递推公式,可得:

D2n=(ad−bc)D2(n−1)=(ad−bc)2D2(n−2)=(ad−bc)n−1D2=(ad−bc)n−1∣abcd∣=(ad−bc)n\begin{aligned}D_{2n}&=(ad-bc)D_{2(n-1)}\\

&=(ad-bc)^2D_{2(n-2)}\\

&=(ad-bc)^{n-1}D_2\\

&=(ad-bc)^{n-1}\begin{vmatrix}a&b\\c&d\end{vmatrix}\\

&=(ad-bc)^n\end{aligned}D2n​​=(ad−bc)D2(n−1)​=(ad−bc)2D2(n−2)​=(ad−bc)n−1D2​=(ad−bc)n−1​ac​bd​​=(ad−bc)n​

范德蒙(Vandermonde)行列式:

Dn=∣11⋯1x1x2⋯xnx12x22⋯xn2⋮⋮⋮x1n−1x2n−1⋯xnn−1∣=∏1≤i

Dn​=​1x1​x12​⋮x1n−1​​1x2​x22​⋮x2n−1​​⋯⋯⋯⋯​1xn​xn2​⋮xnn−1​​​=1≤i

其中 ∏\prod∏ 表示满足 1≤i

归纳法证明:当 n=2n=2n=2 时

D2=∣11x1x2∣=x2−x1=∏1≤i

D2​=​1x1​​1x2​​​=x2​−x1​=1≤i

满足该结论。假设该结论对 n−1n-1n−1 阶范德蒙行列式成立,即

Dn−1=∣11⋯1x2x3⋯xnx22x32⋯xn2⋮⋮⋮x2n−2x3n−2⋯xnn−2∣=∏2≤i

Dn−1​=​1x2​x22​⋮x2n−2​​1x3​x32​⋮x3n−2​​⋯⋯⋯⋯​1xn​xn2​⋮xnn−2​​​=2≤i

在 Dn−1D_{n-1}Dn−1​ 中, i=1i=1i=1 的情况被去除了。

证该结论对 nnn 阶行列式成立,将 DnD_nDn​ 的第 n−1n-1n−1 行的 −x1-x_1−x1​ 倍加到第 nnn 行,将第 n−2n-2n−2 行的 −x1-x_1−x1​ 倍加到第 n−1n-1n−1 行,如此作下去,直到第1行的 −x1-x_1−x1​ 倍加到第2行,得:

Dn=∣01⋯10x2−x1⋯xn−x10x2(x2−x1)⋯xn(xn−x1)⋮⋮⋮0x2n−2(x2−x1)⋯xnn−2(xn−x1)∣D_n=\begin{vmatrix}0&1&\cdots&1\\0&x_2-x_1&\cdots&x_n-x_1\\0&x_2(x_2-x_1)&\cdots&x_n(x_n-x_1)\\\vdots&\vdots&&\vdots\\0&x_2^{n-2}(x_2-x_1)&\cdots&x_n^{n-2}(x_n-x_1)\end{vmatrix}

Dn​=​000⋮0​1x2​−x1​x2​(x2​−x1​)⋮x2n−2​(x2​−x1​)​⋯⋯⋯⋯​1xn​−x1​xn​(xn​−x1​)⋮xnn−2​(xn​−x1​)​​

按第一列展开得:

Dn=∣x2−x1⋯xn−x1x2(x2−x1)⋯xn(xn−x1)⋮⋮x2n−2(x2−x1)⋯xnn−2(xn−x1)∣D_n=\begin{vmatrix}x_2-x_1&\cdots&x_n-x_1\\x_2(x_2-x_1)&\cdots&x_n(x_n-x_1)\\\vdots&&\vdots\\x_2^{n-2}(x_2-x_1)&\cdots&x_n^{n-2}(x_n-x_1)\end{vmatrix}

Dn​=​x2​−x1​x2​(x2​−x1​)⋮x2n−2​(x2​−x1​)​⋯⋯⋯​xn​−x1​xn​(xn​−x1​)⋮xnn−2​(xn​−x1​)​​

由行列式的性质可得:

Dn=(x2−x1)(x3−x1)⋯(xn−x1)∣11⋯1x2x3⋯xn⋮⋮⋮x2n−2x3n−2⋯xnn−2∣=(x2−x1)(x3−x1)⋯(xn−x1)∏2≤i

&=(x_2-x_1)(x_3-x_1)\cdots(x_n-x_1)\prod_{2\leq i

&=\prod_{1\leq i

此处用 (x2−x1)(x3−x1)⋯(xn−x1)(x_2-x_1)(x_3-x_1)\cdots(x_n-x_1)(x2​−x1​)(x3​−x1​)⋯(xn​−x1​) 连乘补全了 i=1i=1i=1 的情况。

根据数学归纳法,可证得范德蒙行列式结论在 n≥2n\geq 2n≥2 时成立。

AB型行列式:

除了对角线是 bbb 其余全是 aaa 的行列式:

∣ba⋯aab⋯a⋮⋮⋮aa⋯b∣\begin{vmatrix}

b&a&\cdots&a\\

a&b&\cdots&a\\

\vdots&\vdots&&\vdots\\

a&a&\cdots&b

\end{vmatrix}​ba⋮a​ab⋮a​⋯⋯⋯​aa⋮b​​

将除第1行以外每一行都加到第1行上,得:

∣b+(n−1)ab+(n−1)a⋯b+(n−1)aab⋯a⋮⋮⋮aa⋯b∣\begin{vmatrix}

b+(n-1)a&b+(n-1)a&\cdots&b+(n-1)a\\

a&b&\cdots&a\\

\vdots&\vdots&&\vdots\\

a&a&\cdots&b

\end{vmatrix}​b+(n−1)aa⋮a​b+(n−1)ab⋮a​⋯⋯⋯​b+(n−1)aa⋮b​​

由行列式性质可转化为:

[b+(n−1)a]∣11⋯1ab⋯a⋮⋮⋮aa⋯b∣[b+(n-1)a]\begin{vmatrix}

1&1&\cdots&1\\

a&b&\cdots&a\\

\vdots&\vdots&&\vdots\\

a&a&\cdots&b

\end{vmatrix}[b+(n−1)a]​1a⋮a​1b⋮a​⋯⋯⋯​1a⋮b​​

将第1行乘 (−a)(-a)(−a) 加到下面各行上,得:

[b+(n−1)a]∣11⋯10b−a⋯0⋮⋮⋮00⋯b−a∣=[b+(n−1)a]∣b−a⋯0⋮⋮0⋯b−a∣[b+(n-1)a]\begin{vmatrix}

1&1&\cdots&1\\

0&b-a&\cdots&0\\

\vdots&\vdots&&\vdots\\

0&0&\cdots&b-a

\end{vmatrix}=[b+(n-1)a]\begin{vmatrix}

b-a&\cdots&0\\

\vdots&&\vdots\\

0&\cdots&b-a

\end{vmatrix}[b+(n−1)a]​10⋮0​1b−a⋮0​⋯⋯⋯​10⋮b−a​​=[b+(n−1)a]​b−a⋮0​⋯⋯​0⋮b−a​​

可得AB型行列式通式:

∣b+(n−1)ab+(n−1)a⋯b+(n−1)aab⋯a⋮⋮⋮aa⋯b∣=[b+(n−1)a](b−a)n−1\begin{vmatrix}

b+(n-1)a&b+(n-1)a&\cdots&b+(n-1)a\\

a&b&\cdots&a\\

\vdots&\vdots&&\vdots\\

a&a&\cdots&b

\end{vmatrix}=[b+(n-1)a](b-a)^{n-1}​b+(n−1)aa⋮a​b+(n−1)ab⋮a​⋯⋯⋯​b+(n−1)aa⋮b​​=[b+(n−1)a](b−a)n−1

加边法:

加边法是对拉普拉斯展开的逆用,用加边法可以求如下行列式:

∣x1a2⋯ana1x2⋯an⋮⋮⋮a1a2⋯xn∣\begin{vmatrix}

x_1&a_2&\cdots&a_n\\

a_1&x_2&\cdots&a_n\\

\vdots&\vdots&&\vdots\\

a_1&a_2&\cdots&x_n

\end{vmatrix}​x1​a1​⋮a1​​a2​x2​⋮a2​​⋯⋯⋯​an​an​⋮xn​​​

在行列式左侧加边,可将原式转化为:

∣1−a1−a2⋯−an0x1a2⋯an0a1x2⋯an⋮⋮⋮⋮0a1a2⋯xn∣\begin{vmatrix}

1&-a_1&-a_2&\cdots&-a_n\\

0&x_1&a_2&\cdots&a_n\\

0&a_1&x_2&\cdots&a_n\\

\vdots&\vdots&\vdots&&\vdots\\

0&a_1&a_2&\cdots&x_n

\end{vmatrix}​100⋮0​−a1​x1​a1​⋮a1​​−a2​a2​x2​⋮a2​​⋯⋯⋯⋯​−an​an​an​⋮xn​​​

将第1行加到下面各行上,得:

∣1−a1−a2⋯−an1x1−a10⋯010x2−a2⋯0⋮⋮⋮⋮100⋯xn−an∣\begin{vmatrix}

1&-a_1&-a_2&\cdots&-a_n\\

1&x_1-a_1&0&\cdots&0\\

1&0&x_2-a_2&\cdots&0\\

\vdots&\vdots&\vdots&&\vdots\\

1&0&0&\cdots&x_n-a_n

\end{vmatrix}​111⋮1​−a1​x1​−a1​0⋮0​−a2​0x2​−a2​⋮0​⋯⋯⋯⋯​−an​00⋮xn​−an​​​

这种形状的行列式被称作“爪型行列式”,求解爪型行列式:

∏i=1n(xi−ai)∣1−a1−a2⋯−an1x1−a110⋯01x2−a201⋯0⋮⋮⋮⋮1xn−an00⋯1∣\prod_{i=1}^n(x_i-a_i)\begin{vmatrix}

1&-a_1&-a_2&\cdots&-a_n\\

\dfrac{1}{x_1-a_1}&1&0&\cdots&0\\

\dfrac{1}{x_2-a_2}&0&1&\cdots&0\\

\vdots&\vdots&\vdots&&\vdots\\

\dfrac{1}{x_n-a_n}&0&0&\cdots&1

\end{vmatrix}i=1∏n​(xi​−ai​)​1x1​−a1​1​x2​−a2​1​⋮xn​−an​1​​−a1​10⋮0​−a2​01⋮0​⋯⋯⋯⋯​−an​00⋮1​​

各行乘 (−ai)(-a_i)(−ai​) 加到第1行:

∏i=1n(xi−ai)∣1+∑i=1naixi−ai00⋯01x1−a110⋯01x2−a201⋯0⋮⋮⋮⋮1xn−an00⋯1∣=∏i=1n(xi−ai)(1+∑i=1naixi−ai)\prod_{i=1}^n(x_i-a_i)\begin{vmatrix}

1+\sum\limits_{i=1}^n\dfrac{a_i}{x_i-a_i}&0&0&\cdots&0\\

\dfrac{1}{x_1-a_1}&1&0&\cdots&0\\

\dfrac{1}{x_2-a_2}&0&1&\cdots&0\\

\vdots&\vdots&\vdots&&\vdots\\

\dfrac{1}{x_n-a_n}&0&0&\cdots&1

\end{vmatrix}=\prod_{i=1}^n(x_i-a_i)\left(1+\sum_{i=1}^n\frac{a_i}{x_i-a_i}\right)i=1∏n​(xi​−ai​)​1+i=1∑n​xi​−ai​ai​​x1​−a1​1​x2​−a2​1​⋮xn​−an​1​​010⋮0​001⋮0​⋯⋯⋯⋯​000⋮1​​=i=1∏n​(xi​−ai​)(1+i=1∑n​xi​−ai​ai​​)

矩阵的逆

设 A\bm AA 为 nnn 阶方阵,若存在 nnn 阶方阵 B\bm BB ,使得

AB=BA=I\bm{AB}=\bm{BA}=\bm I

AB=BA=I

则称 A\bm AA 可逆,且 B\bm BB 是 A\bm AA 的逆矩阵,简称 A\bm AA 的逆(Inverse),记作 B=A−1\bm B=\bm A^{-1}B=A−1 。

一般而言,我们只讨论方阵的逆。

可逆矩阵又称非奇异矩阵(Nonsingular matrix),不可逆矩阵又称奇异矩阵(Singular matrix)。

易证初等矩阵都是可逆矩阵:

P(i[k])−1=P(i[1k])\bm P(i[k])^{-1}=\bm P(i[\frac{1}{k}])P(i[k])−1=P(i[k1​])

P(i,j[k])−1=P(i,j[−k])\bm P(i,j[k])^{-1}=\bm P(i,j[-k])P(i,j[k])−1=P(i,j[−k])

P(i,j)−1=P(i,j)\bm P(i,j)^{-1}=\bm P(i,j)P(i,j)−1=P(i,j)

可逆矩阵基本性质:

可逆矩阵的逆是唯一的。

若 A\bm AA 可逆,则 (A−1)−1=A(\bm A^{-1})^{-1}=\bm A(A−1)−1=A 。

若 A\bm AA 可逆,数 λ≠0\lambda\neq 0λ=0 ,则 λA\lambda\bm AλA 可逆,且 (λA)−1=1λA−1(\lambda\bm A)^{-1}=\frac{1}{\lambda}\bm A^{-1}(λA)−1=λ1​A−1 。

若 A\bm AA 可逆,则 AT\bm A^TAT 可逆,且 (AT)−1=(A−1)T(\bm A^T)^{-1}=(\bm A^{-1})^T(AT)−1=(A−1)T 。

若 nnn 阶方阵 A,B\bm A,\bm BA,B 皆可逆,则 AB\bm{AB}AB 可逆,且 (AB)−1=B−1A−1(\bm{AB})^{-1}=\bm B^{-1}\bm A^{-1}(AB)−1=B−1A−1 。

推广:若 nnn 阶方阵 A1,A2,⋯ ,As\bm A_1,\bm A_2,\cdots,\bm A_sA1​,A2​,⋯,As​ 皆可逆,则它们的乘积 A1A2⋯As\bm A_1\bm A_2\cdots\bm A_sA1​A2​⋯As​ 也可逆,且

(A1A2⋯As)−1=As−1⋯A2−1A1−1(\bm A_1\bm A_2\cdots\bm A_s )^{-1}=\bm A_s^{-1}\cdots\bm A_2^{-1}\bm A_1^{-1}

(A1​A2​⋯As​)−1=As−1​⋯A2−1​A1−1​

规定 A−m=(Am)−1=(A−1)m\bm A^{-m}=(\bm A^m)^{-1}=(\bm A^{-1})^mA−m=(Am)−1=(A−1)m 。

可逆矩阵的行列式 ∣A−1∣=1∣A∣|\bm A^{-1}|=\dfrac{1}{|\bm A|}∣A−1∣=∣A∣1​

伴随矩阵求逆矩阵

对 nnn 阶方阵每一个元素求其代数余子式 AijA_{ij}Aij​ ,填写在原来的位置,然后再进行转置,可以写出如下方阵:

[A11A21⋯An1A12A22⋯An2⋮⋮⋮A1nA2n⋯Ann]\begin{bmatrix}

A_{11}&A_{21}&\cdots&A_{n1}\\

A_{12}&A_{22}&\cdots&A_{n2}\\

\vdots&\vdots&&\vdots\\

A_{1n}&A_{2n}&\cdots&A_{nn}

\end{bmatrix}​A11​A12​⋮A1n​​A21​A22​⋮A2n​​⋯⋯⋯​An1​An2​⋮Ann​​​

这个方阵就被称作 A\bm AA 的伴随矩阵(Adjugate matrix,the adjoint of a matrix),记作 A∗\bm A^*A∗ 或 adj A\text{adj}\ \bm Aadj A。

由代数余子式定理我们可以推出,矩阵与其伴随矩阵乘积的关系:

AA∗=A∗A=∣A∣I\bm{AA}^*=\bm A^*\bm A=|\bm A|\bm I

AA∗=A∗A=∣A∣I

当 A\bm AA 可逆时,存在逆矩阵 A−1\bm A^{-1}A−1 使得 AA−1=I\bm{AA}^{-1}=\bm IAA−1=I ,两边取行列式,得

∣A∣∣A−1∣=1|\bm A||\bm A^{-1}|=1

∣A∣∣A−1∣=1

因此必然有 ∣A∣≠0|\bm A|\neq 0∣A∣=0 。又因为 AA∗=∣A∣I\bm{AA}^*=|\bm A|\bm IAA∗=∣A∣I ,可得

A−1=1∣A∣A∗\bm A^{-1}=\frac{1}{|\bm A|}\bm A^*

A−1=∣A∣1​A∗

综上,我们找到了用伴随矩阵求逆矩阵的方法。

矩阵可逆定理:

方阵 A\bm AA 可逆的充要条件是 ∣A∣≠0|\bm A|\neq 0∣A∣=0 。

对于 nnn 阶矩阵 A,B\bm A,\bm BA,B ,只要有 AB=I\bm{AB}=\bm IAB=I ,则矩阵 A,B\bm A,\bm BA,B 皆可逆且互为逆。

方阵 A\bm AA 可逆的充要条件是 A\bm AA 可以经过有限次初等变换化为单位矩阵。

方阵 A\bm AA 可逆的充要条件是 A\bm AA 可以表示为有限个初等矩阵的乘积。

方阵 A\bm AA 可逆的充要条件是可以只经过初等行变换化为单位矩阵。

借助矩阵的逆和初等变换的关系,可以用初等变换求逆:

[AI]→elementary[IA−1]\begin{bmatrix}\bm A&\bm I\end{bmatrix}\xrightarrow{elementary}\begin{bmatrix}\bm I&\bm A^{-1}\end{bmatrix}

[A​I​]elementary​[I​A−1​]

伴随矩阵基本性质:

∣A∗∣=∣∣A∣A−1∣=∣A∣n∣A∣=∣A∣n−1|\bm A^*|=||\bm A|\bm A^{-1}|=\dfrac{|\bm A|^{n}}{|\bm A|}=|\bm A|^{n-1}∣A∗∣=∣∣A∣A−1∣=∣A∣∣A∣n​=∣A∣n−1

(A∗)−1=(∣A∣A−1)−1=A∣A∣(\bm A^*)^{-1}=(|\bm A|\bm A^{-1})^{-1}=\dfrac{\bm A}{|\bm A|}(A∗)−1=(∣A∣A−1)−1=∣A∣A​

(A∗)T=(∣A∣A−1)T=∣AT∣(AT)−1=(AT)∗(\bm A^*)^T=(|\bm A|\bm A^{-1})^T=|\bm A^T|(A^T)^{-1}=(\bm A^T)^*(A∗)T=(∣A∣A−1)T=∣AT∣(AT)−1=(AT)∗

(kA)∗=∣kA∣(kA)−1=kn∣A∣1kA−1=kn−1A∗(k\bm A)^*=|k\bm A|(k\bm A)^{-1}=k^n|\bm A|\dfrac{1}{k}\bm A^{-1}=k^{n-1}\bm A^*(kA)∗=∣kA∣(kA)−1=kn∣A∣k1​A−1=kn−1A∗

(A∗)∗=∣A∗∣(A∗)−1=∣∣A∣A−1∣(∣A∣A−1)−1=∣A∣n−1A∣A∣=∣A∣n−2A(\bm A^*)^*=|\bm A^*|(\bm A^*)^{-1}=||\bm A|\bm A^{-1}|(|\bm A|\bm A^{-1})^{-1}=|\bm A|^{n-1}\dfrac{\bm A}{|\bm A|}=|\bm A|^{n-2}\bm A(A∗)∗=∣A∗∣(A∗)−1=∣∣A∣A−1∣(∣A∣A−1)−1=∣A∣n−1∣A∣A​=∣A∣n−2A

(AB)∗=∣AB∣AB−1=∣A∣∣B∣B−1A−1=∣B∣B−1∣A∣A−1=B∗A∗(\bm{AB})^*=|\bm{AB}|\bm{AB}^{-1}=|\bm A||\bm B|\bm B^{-1}\bm A^{-1}=|\bm B|\bm B^{-1}|\bm A|\bm A^{-1}=\bm B^*\bm A^*(AB)∗=∣AB∣AB−1=∣A∣∣B∣B−1A−1=∣B∣B−1∣A∣A−1=B∗A∗

广义逆矩阵

左逆和右逆:

以上我们的求逆都是对于方阵而言的,这种逆被称作两侧逆,而非方阵则不拥有两侧逆,只能分情况讨论其左逆和右逆。

对于 m×n(m≠n)m\times n(m\neq n)m×n(m=n) 的矩阵:

当 m>nm>nm>n 时,ATA\bm A^T\bm AATA 是一个 n×nn\times nn×n 的方阵,则可以讨论 ATA\bm A^T\bm AATA 的逆,此时

(ATA)−1ATA=I(\bm A^T\bm A)^{-1}\bm A^T\bm A=\bm I

(ATA)−1ATA=I

令 Aleft−1=(ATA)−1AT\bm A_{left}^{-1}=(\bm A^T\bm A)^{-1}\bm A^TAleft−1​=(ATA)−1AT ,则

Aleft−1A=I\bm A_{left}^{-1}\bm A=\bm I

Aleft−1​A=I

称 Aleft−1\bm A_{left}^{-1}Aleft−1​ 为 A\bm AA 的左逆。

同理,当 m

AAT(AAT)−1=I\bm A\bm A^T(\bm A\bm A^T)^{-1}=\bm I

AAT(AAT)−1=I

令 Aright−1=AT(AAT)−1\bm A_{right}^{-1}=\bm A^T(\bm A\bm A^T)^{-1}Aright−1​=AT(AAT)−1 ,则

AAright−1=I\bm A\bm A_{right}^{-1}=\bm I

AAright−1​=I

称 Aright−1\bm A_{right}^{-1}Aright−1​ 为 A\bm AA 的右逆。

伪逆矩阵:

对于奇异矩阵,我们无法对其进行常规求逆,此时只能对其求伪逆(Pseudo-inverse),记作 A+\bm A^+A+ ,此处不讲解其具体来由和定义,只简单提一下其求法。

A\bm AA 的伪逆是对超定线性方程组 Ax=b\bm Ax=bAx=b 求其最小二乘解,定义为:

A+=lim⁡a→∞(ATA+aI)−1AT\bm A^+=\lim_{a\to\infty}(\bm A^T\bm A+a\bm I)^{-1}\bm A^T

A+=a→∞lim​(ATA+aI)−1AT

对于实矩阵,可以用奇异值分解法(Singular Vector Decomposite,SVD) 求其伪逆:

A=UWVT\bm A=\bm U\bm W\bm V^T

A=UWVT

其中

AAT=U[D000]UT\bm{AA}^T=\bm U\begin{bmatrix}\bm D&0\\0&0\end{bmatrix}\bm U^T

AAT=U[D0​00​]UT

ATA=V[D000]VT\bm A^T\bm A=\bm V\begin{bmatrix}\bm D&0\\0&0\end{bmatrix}\bm V^T\\

ATA=V[D0​00​]VT

用以下公式求伪逆:

A+=VD+UT\bm A^+=\bm V\bm D^+\bm U^T

A+=VD+UT

伪逆矩阵的性质:

AA+A=A\bm A\bm A^+\bm A=\bm AAA+A=A

A+AA+=A+\bm A^+\bm A\bm A^+=\bm A^+A+AA+=A+

AA+=(AA+)T\bm A\bm A^+=(\bm A\bm A^+)^TAA+=(AA+)T

A+A=(A+A)T\bm A^+\bm A=(\bm A^+\bm A)^TA+A=(A+A)T