admin 管理员组

文章数量: 1086019


2024年4月16日发(作者:360flash插件下载)

漫谈高数(四) 特征向量物理意义

[1. 特征的数学意义]

我们先考察一种线性变化,例如x,y坐标系的椭圆方程可以写为

x^2/a^2+y^2/b^2=1,那么坐标系关于原点做旋转以后,椭圆方程就要发生变换。我们可

以把原坐标系的(x,y)乘以一个矩阵,得到一个新的(x',y')的表示形式,写为算子的形式就是

(x,y)*M=(x',y')。这里的矩阵M代表一种线性变换:拉伸,平移,旋转。那么,有没有什么样的

线性变换b(b是一个向量),使得变换后的结果,看起来和让(x,y)*b像是一个数b乘以了一

个数字m*b? 换句话说,有没有这样的矢量b,使得矩阵A*b这样的线性变换相当于A在矢

量b上面的投影m*b? 如果有,那么b就是A的一个特征向量,m就是对应的一个特征

值。一个矩阵的特征向量可以有很多个。特征值可以用特征方程求出,特征向量可以有特

征值对应的方程组通解求出,反过来也一样。例如,设A为3阶实对称矩阵,a1=(a,-a,1)T是

Ax=0的解,a2=(a,1,-a)T 是(A+E)x=0的解,a≠2,则常数a=? 因为a1=(a,-a,1)T是Ax=0

的解,说明a1=(a,-a,1)T是A的属于0的特征向量,a2=(a,1,-a)T是(A+E)x=0的解,说明

a2=(a,1,-a)T是A的属于-1的特征向量。实对称矩阵属于不同特征值的特征向量式正交

的,所以a^2-a-a=0,a≠2,所以a=0。

还是太抽象了,具体的说,求特征向量的关系,就是把矩阵A所代表的空间,进行正交分解,

使得A的向量集合可以表示为每个向量a在各个特征向量上面的投影长度。例如A是

m*n的矩阵,n>m,那么特征向量就是m个(因为秩最大是m),n个行向量在每个特征向量

E上面有投影,其特征值v就是权重。那么每个行向量现在就可以写为

Vn=(E1*v1n,Em*vmn),矩阵变成了方阵。如果矩阵的秩更小,矩阵的存储还可以

压缩。再: 由于这些投影的大小代表了A在特征空间各个分量的投影,那么我们可以使用最

小2乘法,求出投影能量最大的那些分量,而把剩下的分量去掉,这样最大限度地保存了矩阵

代表的信息,同时可以大大降低矩阵需要存储的维度,简称PCA方法。

举个例子,对于x,y平面上的一个点(x,y),我对它作线性变换,(x,y)*[1,0;0,-1],分号代表

矩阵的换行,那么得到的结果就是(x,-y),这个线性变换相当于关于横轴x做镜像。我们可以

求出矩阵[1,0;0,-1]的特征向量有两个,[1,0]和[0,1],也就是x轴和y 轴。什么意思呢? 在x

轴上的投影,经过这个线性变换,没有改变。在y轴上的投影,乘以了幅度系数-1,并没有发生

旋转。两个特征向量说明了这个线性变换矩阵对于x轴和y轴这两个正交基是线性不变

的。对于其他的线性变换矩阵,我们也可以找到类似的,N个对称轴,变换后的结果,关于这N

个对称轴线性不变。这N个对称轴就是线性变换A的N个特征向量。这就是特征向量的

物理含义所在。所以,矩阵A等价于线性变换A。

对于实际应用的矩阵算法中,经常需要求矩阵的逆:当矩阵不是方阵的时候,无解,这是需

要用到奇异值分解的办法,也就是A=PSQ,P和Q是互逆的矩阵,而S是一个方阵,然后就可

以求出伪逆的值。同时,A=PSQ可以用来降低A的存储维度,只要P是一个是瘦长形矩

阵,Q是宽扁型矩阵。对于A非常大的情况可以降低存储量好几个数量级。

[2. 物理意义]

特征向量有什么具体的物理意义? 例如一个驻波通过一条绳子,绳子上面的每个点组成

一个无穷维的向量,这个向量的特征向量就是特征函数sin(t),因为是时变的,就成了特征函

数。每个点特征值就是每个点在特定时刻的sin(x+t)取值。再如,从太空中某个角度看地球


本文标签: 矩阵 特征向量 投影 向量 旋转