本文视频来自:3Blue1Brown:线性代数的本质,为学习笔记。
线性代数的计算不难,但其几何意义很少有老师好好讲。
向量究竟是什么
“引入一些数作为向量是鲁莽的行为。”
三种观点
- 物理观点:空间中的箭头
- 计算机观点:有序的数字组合
- 数学观点:保证相加和数乘有意义就好了
将几何的箭头定在原点,则计算机观点的数字组合则和坐标系上的点对应
向量的相加
向量可以被视为一种运动,像是一维数字加和的一种拓展。
使用首尾相连的方式连接两个向量(数学上表示为各项分别相加)。
向量相乘
几何角度:缩放向量(数字的主要作用)
数学上为和各项分别相乘。
线性代数的意义一方面体现在可以在数字序列和几何上相互转化,从而为数据的可视化提供了一条渠道,另一方面,为物理和计算机图形提供了一种语言来描述空间。
线性组合,张成的空间与基
坐标系的基
将一对向量的每一个坐标看成一个标量,实现对单位向量的拉伸。
思想:缩放向量(基)并相加——线性组合
空间
两向量全部线性组合构成的向量集合被称为“张成的空间”。(span)
实际是在问,只使用向量的相加和数乘,你能获得的所有可能向量集合是什么
为了简化看到的多个向量:在考虑一个向量的时候,把它看成一个箭头;在考虑多个向量的时候,就把他们看成点(从而连成线,平面)
线性相关
为了描述多个向量不能很好的构成空间(存在共线/共面)的情况。
线性相关:当去掉任意一个向量而不影响张成的空间时
OR:一个向量可以表示为其他向量的线性组合
反之:线性无关
基的严格定义
向量空间的一组基是张成该空间的一个线性无关向量集
矩阵与线性变换
线性变换的概念以及它和矩阵的关系
所谓变换:输入一些向量,得到另一些向量(就像函数)(但更像运动movement)
所谓线性:直线仍是直线,且原点保持固定。(网格线平行且等距)
原点变化的叫做仿射变换
用数值描述线性变换:矩阵 -> 用变换后的基坐标表示
线性变换是操纵空间的一种方式:后面变换的基础。
矩阵乘法与线性变换复合
如何定义描述独立变换的复合变换:通过相乘
相乘的几何意义:两个变换相继作用,注意是从右到左读。
由此可看出,矩阵相乘交换顺序对结果是有影响的,但交换律不会
附注1:多维空间中的矩阵变换同理,构成n维矩阵
行列式
意义:描述一块区域在经过空间变换后变化的大小。(线性变换改变面积的比例)(翻转为负)
用无数的小方块可以直观理解(微积分思想)
当行列式值为0时:空间被矩阵变换到了更小的维度上(所以当前体积就为0了)
通过这种理解,也可以解释为什么det(矩阵之积) = det(矩阵)之积了。
逆矩阵,列空间与零空间
矩阵可求解特定方程组:线性方程组
求解的几何含义:对于特定的一个变换(矩阵A),找到一个向量使得它的变换后为v
当A的行列式不为零时,通过A的逆变换(A的逆)可以找到x,此时存在唯一解。(高维同理)
当A行列式为零时,A将空间压缩到更低维度,此时没有逆变换(不能由一条直线解压为一个平面),解可能存在但无数(v正好在更低维)或不存在(v没和压缩结果重叠),解存在的难度变高了。
所有矩阵变换可能的输出集合为矩阵的列空间,也就是矩阵的列张成的空间。
秩(rank):A变换矩阵剩下的维度,也就是列空间的维数。
零向量一定在列空间中
零空间(核):变换后落在原点的向量集合,也就是AX = 0的解空间。
附注2:非方阵:列表示基向量的个数(原空间的维数),行数表示变换后只用几个坐标来表示。
竖着看矩阵的一列,是原空间对应基向量变换后的模样。
点积与对偶性
点积的几何意义:投影和另一个向量相乘,投影对自身放缩效果的继承使得点积可以交换顺序。
点积计算规则探究:1X2矩阵和二维向量有着微妙的联系
- 由此产生了投影矩阵:几何变换含义为“向量对一条过原点的数轴投影”
- 从而可以解释点积计算的来历:将一个1X2矩阵看成一个新的向量
对于任意一个多维-一维的线性变换,都可以找到唯一一个向量,使得进行这个变换和与这个向量点积结果相同。
对偶性:两种数学事物之间自然又出乎意料的对应关系。
一个多维到一维的变换与某个多维空间的向量是对偶关系。
将向量看作线性变换的物质载体,一个特定变换的概念性记号会更容易理解向量
叉积的标准介绍
本部分介绍的是叉积的一般算法理论。
叉积的几何意义:两个向量形成的面积,带正负,正负规则为右手定则。
因此,叉积的大小就是对应的行列式的值(单位正方形扩大的倍数)
垂直时叉积更大,数乘可移。
以线性变换的眼光看叉积
定义一个从三维空间到数轴的特定线性变换,其对偶向量为叉积结果。
其函数具体实现为:输入一个向量,通过矩阵行列式得到一个数。
性质上,这个函数是线性的,这很重要,因为这样我们就可以用矩阵乘法描述这个变换了:存在一个1X3的矩阵满足条件,这就是我们要求的那个叉积结果。
对于一个平行六面体的体积(行列式),可以先得到一个面的面积(V与W),再乘以剩下那个向量垂直于这个面的投影(点积)
基变换
本质上可以看作是两个空间之间的变换(基向量的改变)
可以认为,之前空间变换中的矩阵的那一套,并没有改变“视角”,也就是基向量,只是改变了空间里所有的向量的模样(拉伸旋转),从这种意义上,说它拉伸空间是不完全正确的。前后所使用的描述工具仍然是原先的基向量。
对别人的一个变换的矩阵描述:A逆MA,A是为了转换到我们的坐标系,M是在我们的系中变换对应的矩阵,这本质上是一个视角的转移。
A逆MA还是描述的同一个矩阵,只是从别人的视角下来看的
特征向量与特征值
在矩阵变换中,有些向量仍然留在了他们自己张成的空间中,这时候变换对于它们就像是一个数乘。
这些特殊向量被称为特征向量,其数乘的值被称为特征值。
可以通过特征值为1,找到一个旋转的三维变换的对称轴
理解特征向量和特征值可以摆脱选定的基向量,从而更加理解变换。
并非每一个变换都有特征向量(特征式出现复数解一般对应于某种旋转),特征值也可能多于特征向量。
当基向量恰好为特征向量,这个矩阵为对角矩阵(更容易计算)
当特征向量足够多,以至于可以张成一个空间,可以选取这些向量重新作为基向量,从而使得出现对角矩阵(结合上一章的基变换),一组基向量构成的集合被称为“特征基”。
抽象向量空间
行列式和特征向量与所选坐标系无关
可以发现,在相加和数乘的操作上,向量和函数十分接近。
因此,关于向量的很多概念能被应用到函数上,如线性变换(例如求导,将一个函数变为另一个函数)
线性变换条件(同时适用于函数和矩阵):可加性,成比例
用矩阵描述求导:
首先定义基向量:多项式中的1,x,x平方…,是无穷多的。
此时可以写出导数矩阵,为次对角线上的1到正无穷,可以通过对基向量求导得。
线性代数概念 | 函数对应的别名 |
---|---|
线性变换 | 线性算子 |
点积 | 内积 |
特征向量 | 特征函数 |
什么是向量
有很多类似于向量的不同事物,只要它们满足合理的数乘和相加概念(点,数组,函数…),线性代数中所有观点都应该适用。
构成的集合为向量空间,需要满足一定条件(八条公理)
这些公理为一个共识(清单),连接奇怪向量空间的使用者和数学家们。
就像函数库一样调用
因此,向量可以是任何东西——只要它满足一些公理。
就像“3是什么”一样。
普适的代价是抽象
克莱姆法则,几何解释
克莱姆法则是解线性方程组的一种解法,具体过程不再赘述,结果很美好。
正交变换:不改变点积(变换后基向量仍为单位向量且相互垂直)
虽然不一定是正交变换,但可以用基向量与该向量围成的两个平行四边形面积来表示它的坐标,然后通过行列式的计算保持面积的可求。