向量范数

对于向量

x=[x1,x2,,xn]x = [x_1,x_2,\cdots,x_n]

p-范数

表示向量空间中的p阶闵氏距离

xp=(i=1nxip)1p\|x\|_p=(\sum_{i=1}^n|x_i|^p)^{\frac{1}{p}}

1-范数

当p取1时, 表示曼哈顿距离

x1=i=1nxi\|x\|_1 = \sum_{i=1}^n|x_i|

2-范数(欧氏范数)

当p取2时, 表示欧式距离

x2=(i=1nxi2)12\|x\|_2 = (\sum_{i=1}^n x_i^2)^{\frac{1}{2}}

\infty-范数

p+p\rightarrow +\infty

x=maxxi\|x\|_{\infty} = \max|x_i|

limp+(x1p+x2p++xnp)1p=elimpln(x1p+x2p++xnp)p=elimpln((x1maxxi)p++(xnmaxxi)p)+ln(maxxi)pp=maxxielimpln((x1maxxi)p++(xnmaxxi)p)p=maxxi\begin{split} &\lim_{p\rightarrow+\infty}(|x_1|^p+|x_2|^p+\cdots+|x_n|^p)^{\frac{1}{p}} \\ =& e^{\lim_{p\rightarrow\infty}\frac{\ln(|x_1|^p+|x_2|^p+\cdots+|x_n|^p)}{p}} \\ =& e^{ \lim_{p\rightarrow\infty} \frac{ \ln\left( (\frac{|x_1|}{\max|x_i|})^p+ \cdots+ (\frac{|x_n|}{\max |x_i|})^p \right) +\ln\left(\max|x_i|\right)^p }{p}} \\ =& \max|x_i|\cdot e^{ \lim_{p\rightarrow\infty} \frac{ \ln\left( (\frac{|x_1|}{\max|x_i|})^p+ \cdots+ (\frac{|x_n|}{\max |x_i|})^p \right) }{p}} \\ =& \max|x_i| \end{split}

-\infty-范数

pp\rightarrow -\infty

x=minixi\|x\|_{-\infty} = \min_i|x_i|

0-范数

p0p\rightarrow 0

limp0(x1p+x2p++xnp)1p=向量中非0元素的个数\begin{split} &\lim_{p\rightarrow 0}(|x_1|^p+|x_2|^p+\cdots+|x_n|^p)^{\frac{1}{p}} \\ =&向量中非0元素的个数 \end{split}

矩阵范数

对于矩阵ARn×nA\in \mathbb{R}^{n\times n}有下列定义的范数

矩阵的算子范数

定义 矩阵的算子范数

xRn,ARn×n,v\forall x \in \mathbb{R}^n,\quad\forall A\in\mathbb{R}^{n\times n},\quad \|\cdot\|_vRn\mathbb{R}^n上的向量范数

A=maxx0Axvxv\|A\| = \max_{x\neq0}\frac{\|Ax\|_v}{\|x\|_v}

称为矩阵AA算子范数, 或由向量范数v\|\cdot\|_v诱导的矩阵范数.

关于 xxAxvxv\frac{\|Ax\|_v}{\|x\|_v} 的最大值

相容条件

v\|\cdot\|_vRn\mathbb{R}^n上的一个向量范数, 则\|\cdot\|Rn×n\mathbb{R}^{n\times n}上矩阵的算子范数, 若两者满足相容条件

AxvAxv,xRn,ARn×n\|Ax\|_v \leq \|A\|\cdot\|x\|_v,\quad \forall x\in\mathbb{R}^n,\forall A\in\mathbb{R}^{n\times n}

则称矩阵范数 \|\cdot\| 与向量范数 v\|\cdot\|_v相容的(compatible).

1-范数(列和范数)

矩阵列向量中**1-范数(绝对值之和)**的最大值

A1=maxji=1naij\|A\|_1 = \max_j\sum_{i=1}^n|a_{ij}|

2-范数(谱范数)

A2=λmax(AHA)=ρ(AHA)\|A\|_2 = \sqrt{|\lambda_{max}(A^HA)|} = \sqrt{\rho(A^HA)}

λmax(AHA)\lambda_{max}(A^HA)为矩阵AHAA^HA的特征值中模最大的特征值

ρ()\rho(\cdot)表示谱半径, 即矩阵特征值中模最大的特征值的模

ρ(AHA)\rho(A^HA)表示矩阵AHAA^HA的谱半径, 即矩阵AHAA^HA的特征值中模最大的特征值的模

A2\|A\|_2AA的最大的奇异值

关于 AHAA^HA 以及的一些性质

  1. AA 为方阵, AHAA^HA 的特征值是 AA 的特征值的平方

    证明: 对于 AA 的任意特征值 λ\lambda 以及属于它的特征值向量 ξ\xi , 有

    ηξHξ=(AHAξ,ξ)=(Aξ,Aξ)=(λHλ)ξHξ\eta\cdot\xi^H\xi=(A^HA \xi, \xi) = (A\xi,A\xi)=(\lambda^H\lambda)\cdot\xi^H\xi

  2. AHAA^HA 的所有特征值都 0\geq 0

    λξHξ=(AHAξ,ξ)=(Aξ,Aξ)0\lambda\cdot\xi^H\xi=(A^HA \xi, \xi) = (A\xi,A\xi)\geq0

关于 AHA\sqrt{A^HA}

  1. 正定(半正定)矩阵定义: 若 Hermite 矩阵 HH 的特征值全为 正实数 (非负实数), 则称 HH 为正定的(半正定的), 记为 H>0H>0 (H0H\geq 0)

  2. 定理: 矩阵 HH 是正定的(或半正定的) 充分必要条件 是存在正定矩阵(或半正定矩阵) H0H_0, 使得

    H=H02,rank(H0)=rank(H)H=H_0^2,\qquad rank(H_0)=rank(H)

    证明: Hermite 矩阵(复对称矩阵)可以对角化, 设 H=UDUHH = UDU^H, D=diag{λ1,λ2,,λn}D=diag\{\lambda_1,\lambda_2,\cdots,\lambda_n\}(由于是正定的, 所以λ1,,n>0\lambda_{1,\cdots ,n}>0), 取 D0=diag{λ1,λ2,,λn}D_0 = diag\{\sqrt{\lambda_1},\sqrt{\lambda_2},\cdots,\sqrt{\lambda_n}\}, 以及 H0=UD0UHH_0 = UD_0U^H, 有

    H02=(UD0UH)(UD0UH)=UD02UH=HH_0^2 = (UD_0U^H)(UD_0U^H) = UD_0^2U^H = H

  3. 对于正定或半正定矩阵HH, 将满足上述定理条件 H=H02H=H_0^2H0H_0 称为 HH 的方根, 记为H\sqrt{H}

  4. 对于矩阵 AHAA^HA , 它是正定(半正定)的实对称矩阵, 它对应的H0H_0记为 AHA\sqrt{A^HA}

\infty-范数(行和范数)

矩阵行向量中1-范数的最大值

A=maxij=1naij\|A\|_{\infty} = \max_{i}\sum_{j=1}^n|a_{ij}|

FF-范数(Frobenius范数)

AF=i=1nj=1naij2=tr(AHA)=tr(AAH)\|A\|_F = \sqrt{\sum_{i=1}^n \sum_{j=1}^n|a_{ij}|^2} =\sqrt{tr(A^HA)} =\sqrt{tr(AA^H)}

AHA=[A1HA1A2HA2AnHAn]=[i=1nai12i=1nai22i=1nain2]A^HA = \begin{bmatrix} A_1^HA_1 & * & \cdots & * \\ * & A_2^HA_2 & \cdots & * \\ \vdots & \vdots & \ddots & \vdots \\ * & * & \cdots & A_n^HA_n \end{bmatrix} = \begin{bmatrix} \sum_{i=1}^n|a_{i1}|^2 & * & \cdots & * \\ * & \sum_{i=1}^n|a_{i2}|^2 & \cdots & * \\ \vdots & \vdots & \ddots & \vdots \\ * & * & \cdots & \sum_{i=1}^n|a_{in}|^2 \end{bmatrix}