线性方程组的解法
讨论一般线性方程组的解
⎩⎨⎧a11x1+a12x2+⋯+a1nxna21x1+a22x2+⋯+a2nxnas1x1+as2x2+⋯+asnxn=b1,=b2,⋮=bs.
a11a21⋮as1a12a22⋮as2⋯⋯⋱⋯a1na2n⋮asnx1x2⋮xn=b1b2⋮bs
x1⋅a11a21⋮as1+x2⋅a12a22⋮as2+⋯+xn⋅a1na2n⋮asn=b1b2⋮bs
初等变换与初等矩阵
-
把一个方程的倍数加到另一个方程上
⎩⎨⎧ai1x1+ai2x2+⋯+ainxn(aj1+kai1)x1+(aj2+kai2)x2+⋯+(ajn+kain)xn⋮=bi,⋮=(bj+kbi),⋮
-
互换两个方程的位置
⎩⎨⎧aj1x1+aj2x2+⋯+ajnxnai1x1+ai2x2+⋯+ainxn⋮=bj,⋮=bi,⋮
-
用一个非零数乘以某一个方程
⎩⎨⎧kai1x1+kai2x2+⋯+kainxn⋮=kbi,⋮
上面对线性方程组的三种操作称为 线性方程组的初等变换,经过一系列初等变换得到的方程组与原方程组同解。(证明:分别经过1.2.3.变换前后的方程组同解)
- 把一行的倍数加到另一行上
- 互换两行的位置
- 用一个非零数乘以某一行
阶梯形矩阵
为什么要做初等行变换
- 从方程组的角度,做行变换是在消元,方便求解未知数
- 从线性空间的角度来看,做行变换是在进行线性变换,变换线性空间的基,以此方便看出线性表示的系数
【例】求线性方程组的解
13−1234−571241x1x2x3=29101
x113−12+x234−57+x31241=29101
做线性行变换相当于在变换线性空间的基
本来在基{ϵ1,ϵ2,ϵ3,ϵ4}下讨论向量[13−12],[34−57],[1241]如何线性表出向量[29101]
将其变换到基{[13−12],[34−57],[1241],[0001]}下讨论向量[1000],[0100],[0010]如何线性表出向量[3−120]
⎩⎨⎧13−12,34−57,1241,0001⎭⎬⎫100001000010x1x2x3=⎩⎨⎧13−12,34−57,1241,0001⎭⎬⎫3−120
齐次方程
非齐次方程
- 无解(系数矩阵的秩 < 增广矩阵的秩)
- 唯一解(系数矩阵满秩)
- 无穷多解(系数矩阵退化,系数矩阵的秩 = 增广矩阵的秩)
线性空间
线性空间的定义
设V是一个非空集合,其中的元素称为向量;F是数域,其中的元素称为数或者纯量。如果在V中定义两种运算:
-
向量与向量的加法运算,使得
∀α,β∈V,有α+β∈V;(V关于加法运算封闭)
-
数与向量的数乘运算,使得
∀α,∀k∈F,有kα∈V.(V关于数乘运算封闭)
并且满足如下8条运算法则
关于加法运算(∀α,β,γ∈V)
- 交换律:α+β=β+α
- 结合律:(α+β)+γ=α+(β+γ)
- 存在零元:存在一个 零向量 0∈V,使得∀α∈V, 有 α+0=α
- 存在负元:对于∀α∈V,存在β∈V,使得α+β=0,其中称β为α的负向量,记为−α
关于加法成交换群
关于数乘运算(∀α,β∈V,∀k,l∈F)
- 存在幺元:1α=α,其中1为F的单位元
- 结合律:(kl)α=k(lα)
- 分配律:(k+l)α=kα+lα
- 分配律:k(α+β)=kα+kβ
称V是数域F上的一个线性空间或向量空间
线性空间的基和维数
基和维数的定义
设V是数域F上的线性空间,若存在一个有限元素的部分组α1,α2,⋯,αn满足
- α1,α2,⋯,αn线性无关
- V中的任意向量α可以由α1,α2,⋯,αn线性表示
则称α1,α2,⋯,αn为V的一组基;称部分组中向量的个数n为V的维数,记为dimV=n
基的作用和坐标
【定理】设α1,α2,⋯,αn是线性空间的V的一组基,β是V的一个向量。β由基α1,α2,⋯,αn的线性表示是唯一的。(证明唯一性)
证明:设β=x1α1+x2α2+⋯+xnαn,假设β的线性表示不是唯一的,设其存在另外的线性表示β=y1α1+y2α2+⋯+ynαn,两式相减整理得到
(x1−y1)α1+(x2−y2)α2+⋯+(xn−yn)αn=0
由α1,α2,⋯,αn线性无关⇒x1=y1,x2=y2,⋯,xn=yn
设α1,α2,⋯,αn是线性空间V的一组基,V的向量β可以由基α1,α2,⋯,αn唯一线性表示
β=x1α1+x2α2+⋯+xnαn.
称有序数组x1,x2,⋯,xn为向量β在基α1,α2,⋯,αn下的坐标,记为
X=x1x2⋮xn
当基确定后,向量与坐标是一一对应的关系
β=x1α1+x2α2+⋯+xnαn=[α1,α2,⋯,αn]x1x2⋮xn
基变换与坐标变换
基变换
设α1,α2,⋯,αn和β1,β2,⋯,βn是线性空间V的两组基,两组基之间存在过度关系
⎩⎨⎧β1=a11α1+a21α2+⋯+an1αnβ2=a12α1+a22α2+⋯+an2αn⋯βn=a1nα1+a2nα2+⋯+annαn
写成矩阵形式(注意不要写成转置,α和β分别是列向量)
[β1,β2,⋯,βn]=[α1,α2,⋯,αn]a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann
记上式右边的矩阵为A
[β1,β2,⋯,βn][α1,α2,⋯,αn]=[α1,α2,⋯,αn]A=[β1,β2,⋯,βn]A−1
称矩阵A为由基{α1,α2,⋯,αn}到基{β1,β2,⋯,βn}的过度矩阵
矩阵A−1为由基{β1,β2,⋯,βn}到基{α1,α2,⋯,αn}的过度矩阵
证明:设ξ=[k1,k2,⋯,kn]T
基{β}的线性无关性→[β1,β2,⋯,βn]ξ=0⇒ξ=0⇕基{α}的线性无关性→[α1,α2,⋯,αn]Aξ=0⇒Aξ=0⇓Aξ=0⇒ξ=0(Aξ=0只有零解,即A可逆)
坐标变换
设向量β在基{α1,α2,⋯,αn}和基{β1,β2,⋯,βn}下的坐标分别为X和Y
β=[α1,α2,⋯,αn]X=[β1,β2,⋯,βn]A−1Y=[β1,β2,⋯,βn]Y=[α1,α2,⋯,αn]AY
于是得到同一向量在不同基底下坐标间的关系
X=AYY=A−1X
【总结】在一个基变换中,基右乘过渡矩阵A得到变换后的基,向量的坐标左乘过渡矩阵的逆A−1得到变换后的坐标
β=[α1,α2,⋯,αn]X=[α1,α2,⋯,αn]AA−1X=[β1,β2,⋯,βn]Y
当你需要给向量的坐标进行一个左乘B的变换,那么就要对基进行过渡矩阵为B−1的基变换.
子空间
线性变换
映射的概念
给定集合A和B,若对于A中的每一个元素x,在B中存在唯一的元素y与之对应,则称此对应关系为由集合A到集合B的映射,记为
f:A→B或者f:x↦y=f(x)
称f(A)={f(x)∣x∈A}为映射f的像集
随着集合的不同,定义在集合上的映射,其名称也随之变化,如函数(数域)、变换(线性空间)、算子(函数空间)等
设映射f:A→B.
-
若f(A)=B,则称f是满射(surjective)
-
若x1=x2⇒f(x1)=f(x2),则称f是单射(injective)
或者f(x1)=f(x2)⇒x1=x2,两者是等价的(互为逆否命题)
-
若f既是单设又是满射,则称f是一一映射(one-to-one)或双射(bijective)
线性变换的定义
设V是数域F上的线性空间,映射T:V→V,满足
- T(α+β)=T(α)+T(β),∀α,β∈V
- T(kα)=kT(α),∀α,β∈V,∀k∈F
则称映射T是线性变换(Transformation)
Note: 线性变换的定义中强调了两点,一是它是线性空间到自身的映射,二是线性性.
线性变换的两个常用运算
运算1: 设矩阵 A=[A1,A2,⋯,An] 和向量 α=[a1,a2,⋯,an]T, 矩阵和向量乘积的线性变换满足下面的式子:
T(Aα)=T(A)α
证明:T(Aα)=T(A1a1+A2a2⋯+Anan)=T(A1a1)+T(A2a2)+⋯+T(Anan)=T(A1)a1+T(A2)a2+⋯+T(An)an=[T(A1),T(A2),⋯,T(An)]a1a2⋮an=T(A1,A2,⋯,An)α=T(A)α
**运算2: ** 设矩阵 A 和矩阵 B, 矩阵和矩阵乘积的线性变换满足下面的式子:
T(AB)=T(A)B
证明:T(AB)=T(A[B1,B2,⋯,Bn])=T([AB1,AB2,⋯,ABn])=[T(AB1),T(AB2),⋯,T(ABn)]=[T(A)B1,T(A)B2,⋯,T(A)Bn]=T(A)B
线性变换的运算
线性变换的乘积还是线性变换
线性变换的和还是线性变换
线性变换的数乘还是线性变换
线性空间 V 上的线性变换的全体, 对于线性变换的加法和数量乘法构成数域 P 上的一个线性空间.
核空间和像空间
设T是线性空间V上的线性变换,称
Ker(T)Im(T)={α∈V∣T(α)=0}={T(α)∣α∈V}
分别为线性变换T的核(kernel)和像(image)
其中核和像均成线性空间,Ker(T)和Im(T)又称为核空间和像空间
线性变换的矩阵
设T是线性空间V上的线性变换,α1,α2,⋯,αn是V的一组基,设
T(α1)T(α2)T(αn)=a11α1+a21α2+⋯+an1αn=a12α1+a22α2+⋯+an2αn⋯=a1nα1+a2nα2+⋯+annαn
写成矩阵形式
[Tα1,Tα2,⋯,Tαn]=[α1,α2,⋯,αn]a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮annT[α1,α2,⋯,αn]=[α1,α2,⋯,αn]A
称矩阵A为线性变换T在基{α1,α2,⋯,αn}下的矩阵.
定理: 线性变换在两组不同基下的矩阵是相似的.
证明: 设线性空间 V 上的线性变换 T 在两组基 {ϵ1,ϵ2,⋯,ϵn} 和 {η1,η2,⋯,ηn} 下的矩阵分别为 A 和 B , 从基 {ϵ} 到基 {η} 下的过度矩阵是 X, 于是有
T[η1,⋯,ηn]T[η1,⋯,ηn]=[η1,⋯,ηn]B=T([ϵ1,⋯,ϵn]X)=T[ϵ1,⋯,ϵn]X=[ϵ1,⋯,ϵn]AX=[η1,⋯,ηn]X−1AX
线性变换和基变换的关系
取线性空间 V 的一组基{α1,α2,⋯,αn}, 设向量 β 在基下的坐标为 X=[x1,⋯,xn]T.
β=(α1,α2,⋯,αn)X
设线性空间 V 上的线性变换 T 在基下对应的矩阵为 A
T[α1,α2,⋯,αn]=[α1,α2,⋯,αn]A
计算 T(β)
T[(α1,α2,⋯,αn)X]=T[x1α1+x2α2+⋯+xnαn]=[T(x1α1)+T(x2α2)+⋯+T(xnαn)]=[x1T(α1)+x2T(α2)+⋯+xnT(αn)]=[T(α1),T(α2),⋯,T(αn)]x1x2⋮xn=T(α1,α2,⋯,αn)X=[α1,α2,⋯,αn]AX
所以, 当一个线性空间的基 {α1,⋯,αn} 已经确定. 向量 β 在基下的坐标为 X , 线性变换 T 在基下对应的矩阵为 A, 对 β 的线性变换为
T(β)=(α1,α2,⋯,αn)AX
即 T(β) 在基 {α1,⋯,αn} 下的坐标为 AX.
特别地, 当基取为 {ϵ1,ϵ2,⋯,ϵn} 时, [ϵ1,ϵ2,⋯,ϵn]=I 为单位矩阵, 有
T(X)=T(IX)=[ϵ1,ϵ2,⋯,ϵn]AX=IAX=AX.
矩阵内积转化为矩阵乘积的迹
矩阵内积的定义:两个行数和列数相同的矩阵,对应元素相乘再求和,记为
<A,B>=i,j∑aijbij=tr(ATB),A,B∈Rm×n
ATB=A1TB1∗⋮∗∗A2TB2⋮∗⋯⋯⋱⋯∗∗⋮AnTBn=∑k=1mak1bk1∗⋮∗∗∑k=1mak2bk2⋮∗⋯⋯⋱⋯∗∗⋮∑k=1maknbkn
其中 A1,⋯,An 和 B1,⋯,Bn 分别表示矩阵 A,B 的列向量
矩阵对角化
A=PΛP−1
特征值与特征向量
定义
定义 设 A 是属于 P 上线性空间 V 的一个线性变换, 如果对于数域 P 中一个数 λ , 存在一个非零向量 ξ=0, 使得
Aξ=λξ,ξ=0.(eq33)
那么称 λ 为 A 的一个特征值, 而 ξ 称为 A 的属于特征值 λ 的特征向量.
Note: 从几何上来看, 特征向量的方向经过线性变换后, 保持在同一条直线上, 这时或方向不变(λ>0)或方向相反(λ<0), 至于λ=0 时, 特征向量被映射为0向量.
-
特征向量不是唯一的
如果 ξ 是线性变换 A 的属于特征值 λ 的特征向量, 那么 ξ 的任何一个非零倍数 kξ 也是 A 的属于特征值 λ 的特征向量, 因为
A(kξ)=λ(kξ)
Note: 这说明特征向量并不是被特征值唯一决定的. 相反, 特征值却是被特征向量所唯一决定的, 因为, 一个特征向量只能属于一个特征值.
Aξ=λ1ξAξ=λ2ξ⇒(λ1−λ2)ξ=0⇒λ1=λ2
求解
设 V 是数域 P 上 n 维线性空间, {ϵ1,⋯,ϵn} 是它的一组基, 线性变换 A 在这组基下的矩阵是 A. 设 λ 是 A 的一个特征值, 它的一个特征向量 ξ 在基 {ϵ1,⋯,ϵn} 下的坐标是 x=[x1,⋯,xn]T , 则 Aξ 在基 {ϵ1,⋯,ϵn} 下的坐标是 Ax, 那么 eq33 式可以写成坐标之间的等式
Aξ=[ϵ1⋯ϵn]Ax=[ϵ1⋯ϵn]λx=λξ⇕Ax=λx或(λE−A)x=0即⎩⎨⎧(λ−a11)x1−a12x2−⋯−a1nxn−a21x1+(λ−a22)x2−⋯−a2nxn⋯−an1x1−an2x2−⋯+(λ−ann)xn=0,=0,⋯=0.(eq137)
那么特征向量 ξ 是否存在的问题, 便等价成了齐次线性方程组 eq137 式是否有非零解的问题, 齐次线性方程组 eq137 式有非零解的充分必要条件是它的系数行列式为 0, 即
∣λE−A∣=λ−a11−a21⋮−an1−a12λ−a22⋮−an2⋯⋯⋱⋯−a1n−a2n⋮λ−ann=0.
其带参数的行列式 ∣λE−A∣ 被称为矩阵 A 的特征多项式.
Note: 上面的分析说明, 如果 λ0 是线性变换 A 的特征值, 那么 λ0 一定是矩阵 A 的特征多项式的一个根, 即 ∣λ0E−A∣=0, 那么齐次线性方程组 eq137 式当 λ 取 λ0 时就有非零解.
例如设 x=(x1,x2,⋯,xn) 是它的一个非零解, 那么非零向量 ξ=x1ϵ1+x2ϵ2+⋯+xnϵn∈V 即是 A 的属于特征值 λ0 的一个特征向量.
Ax=λ0x⇕Aξ=[ϵ1⋯ϵn]Ax=[ϵ1⋯ϵn]λ0x=λ0ξ
特征多项式
定义: 称带参数的行列式 ∣λE−A∣ 为矩阵 A 的特征多项式, 它是数域 P 上的一个 n 次多项式.
在线性变换的研究中, 特征多项式是重要的. 下面先来看一下它的系数. 在特征多项式
∣λE−A∣=λ−a11−a21⋮−an1−a12λ−a22⋮−an2⋯⋯⋱⋯−a1n−a2n⋮λ−ann
的展开式中, 有一项是主对角线上元素的连乘 (λ−a11)(λ−a22)⋯(λ−ann). 展开式中的其余各项至多包含 n−2 个主对角线上的元素, 它对 λ 的次数最多是 n−2 次. 因此特征多项式中含 λn 和 λn−1 的项只能在主对角线上元素的连乘中出现, 它们是
λn−(a11+a22+⋯+ann)λn−1
再令 λ=0, 即得特征多项式的常数项 ∣−A∣=(−1)n∣A∣. 因此, 特征多项式应该具有下面的形式:
∣λE−A∣=λn−(a11+a22+⋯+ann)λn−1+⋯+(−1)n∣A∣(eq40)
如果 ∣λE−A∣ 在数域 P 上能分解为一次因式的乘积如下, λ1,⋯,λn 对应为 A 的n个特征值.
∣λE−A∣=(λ−λ1)(λ−λ2)⋯(λ−λn)=λn−(λ1+λ2+⋯+λn)λn−1+⋯+(−1)nλ1λ2⋯λn(eq41)
由 eq40 式和 eq41 式可以看出 A 的全体特征值的和为 a11+a22+⋯+ann, 称为 A 的迹, 记为 Tr(A). 而 A 的全体特征值的乘积为 A 的行列式 ∣A∣.
迹 Tr(A) 和行列式 ∣A∣ 都是矩阵的相似不变量, 这说明它们都是属于线性变换本身的性质, 与基的选择无关.
定理: 相似的矩阵有相同的特征多项式.
证明: 设 A∼B, 即存在可逆矩阵 X , 使得 B=X−1AX . 于是
∣λE−B∣=∣λE−X−1AX∣=∣X−1(λE−A)X∣=∣X−1∣∣λE−A∣∣X∣=∣λE−A∣
Note1: 之前的定理中证明了, 线性变换在不同基下的矩阵是相似的. 而这个定理又说明相似矩阵有相同的特征多项式, 于是线性变换在不同基下的特征多项式是相同的.
Note2: 这个定理说明线性变换的矩阵的特征多项式与基的选择无关, 它直接被线性变换所决定, 因此可以直接说是线性变换的特征多项.
Note3: 此外还可以说明方程 ∣λE−A∣=0 的根, 即特征值, 也与基的选取无关.
特征子空间
可以看出, 对于线性变换 A 的任意一个特征值 λ0 , 全部满足条件
Aα=λ0α
的向量 α 所构成的集合, 也就是 A 的属于 λ0 的全部特征向量再加上零向量所构成的集合, 构成线性空间 V 的一个子空间, 称为 A 的一个特征子空间, 记为 Vλ0
Vλ0={α∣Aα=λ0α,α∈V}.
显然, Vλ0 的维数就是属于 λ0 的线性无关的特征向量的最大个数. 此外在给定的基下, 特征子空间中全体向量的坐标构成线性方程组
(λ0E−A)x=0
的解空间, Vλ0 的维数也等于线性方程组基础解系中向量的个数.
对角矩阵
定理1: 设 A 是 n 维线性空间 V 中的一个线性变换, A 在某一组基下的矩阵可以为对角阵的==充分必要条件==是, A 有 n 个线性无关的特征向量.
定理2: 属于不同特征值的特征向量是线性无关的.
定理3: 如果 λ1,⋯,λk 是线性变换 A 的不同的特征值, 而 αi(1),⋯,ai(ri) 是属于特征值 λi 的线性无关的特征向量, i=1,⋯,k, 那么向量组 α1(1),⋯,a1(r1),⋯⋯,αk(1),⋯,ak(rk) 也线性无关.
根据定理3, 对于一个线性变换, 求出属于每个特征值的线性无关的特征向量, 把它们合在一起还是线性无关的.
如果它们的个数等于空间的维数, 根据定理1, 那么这个线性变换在一组合适的基 (由特征向量构成的基) 下的矩阵是对角矩阵;
如果它们的个数少于空间的维数, 那么这个线性变换在任何一组基下的矩阵都不能是对角形的.
换句话说, 设 A 全部不同的特征值是 λ1,⋯,λk , 于是 A 在某一组基下的矩阵成对角形的==充分必要条件==是 A 的特征子空间 Vλ1,⋯,Vλk 的维数之和等于空间的维数.
Jordan标准型
对于一个 n 阶方阵 A, 当其有 n 个线性无关的特征向量时, 它可以相似于一个对角阵 P−1AP=Λ. 但当其没有 n 个线性无关的特征向量, 不能对角化时, 它可以相似于怎样的最简矩阵是本章所要讨论的内容, Jordan标准型.
任何一个复方阵都和一个Jordan标准型相似
本章主要围绕这个结论来展开.
行列式
二次型
多项式