Alpha内测版本警告:此为早期内部构建版本,尚不完整且可能存在错误,欢迎大家提Issue反馈问题或建议。
Skip to content

兔狲学院:线性代数完整入门

兔狲教授的亲切提示:线性代数是多维世界的语言,是现代科学和技术的通用工具。我们将从向量和矩阵的基础开始,逐步构建完整的线性代数知识体系。每个概念都像多维空间中的一个坐标轴,共同构成理解复杂系统的框架。


词条1:向量——有方向的量

官方解释

向量是既有大小又有方向的量。在 Rn 中,向量表示为有序 n 元组: v=(v1,v2,,vn)

向量运算:

  1. 加法:u+v=(u1+v1,u2+v2,,un+vn)
  2. 数乘:cv=(cv1,cv2,,cvn)
  3. 点积:uv=i=1nuivi
  4. 范数(长度):v=vv=vi2

兔狲老师解释

向量就是"带箭头的量"。

小小猪的比喻:

  • 标量:只有大小(温度20°C)
  • 向量:大小 + 方向(风速20km/h,方向东北)

几何解释:R2 中的向量是从原点到点 (x,y) 的箭头。

向量的物理意义:

  • 力:大小(牛顿)和方向
  • 速度:速率和方向
  • 位移:距离和方向

思考题1:动手题

问题:向量运算练习

已知 u=(2,1,3)v=(1,4,2)

  1. 计算 u+v
  2. 计算 3u2v
  3. 计算 uv
  4. 计算 uv
  5. uv 之间的夹角(用点积公式:uv=uvcosθ

思考题2:动脑题

问题:为什么需要向量的概念?

思考方向:

  • 只用数字(标量)描述物理量有什么局限?
  • 在机器学习中,为什么用向量表示数据点?
  • 向量的"线性组合"概念为什么重要?

词条2:向量空间——向量的集合

官方解释

向量空间(线性空间)是一个集合 V,配有两种运算(加法和数乘),满足8条公理:

  1. 加法交换律:u+v=v+u
  2. 加法结合律:(u+v)+w=u+(v+w)
  3. 零向量存在:0V,vV,v+0=v
  4. 负向量存在:vV,vV,v+(v)=0
  5. 数乘结合律:a(bv)=(ab)v
  6. 数乘单位元:1v=v
  7. 分配律1:a(u+v)=au+av
  8. 分配律2:(a+b)v=av+bv

兔狲老师解释

向量空间就是"向量的游乐场"——有规则的游戏空间。

重要例子:

  1. Rnn维实向量空间(标准例子)
  2. 多项式空间:所有多项式的集合
  3. 函数空间:某些函数的集合
  4. 矩阵空间:所有 m×n 矩阵的集合

小海豹的视角:向量空间公理抓住了"线性"的本质特征。

思考题3:动手题

问题:验证向量空间公理

考虑集合 V={(x,y)R2:x0}(右半平面)

  1. V 对加法封闭吗?(如果 u,vVu+vV 吗?)
  2. V 对数乘封闭吗?(如果 vVcvV 对所有 cR 吗?)
  3. V 是向量空间吗?哪条公理不满足?

思考题4:动脑题

问题:为什么需要向量空间的抽象定义?

思考方向:

  • 具体向量(如 Rn)不够用吗?
  • 多项式为什么可以看作向量?
  • 抽象定义如何统一不同领域的线性结构?

词条3:线性相关与线性无关

官方解释

向量组 {v1,v2,,vk} 称为线性相关,如果存在不全为零的标量 c1,c2,,ck 使得: c1v1+c2v2++ckvk=0

否则称为线性无关

等价表述:一个向量可以由其他向量线性表示 ⇔ 线性相关。

兔狲老师解释

线性相关就是"有多余信息",线性无关就是"每个向量都提供新信息"。

小小猪的几何解释(R2):

  • 两个向量:线性相关 ⇔ 共线(在同一直线上)
  • 三个向量:在 R2 中一定线性相关(平面最多容纳2个独立方向)

测试方法:构造矩阵,化为行阶梯形,看是否有自由变量。

重要定理:n+1n 维向量一定线性相关。

思考题5:动手题

问题:判断向量组的线性相关性

  1. v1=(1,2,3)v2=(4,5,6)v3=(7,8,9)
  2. v1=(1,0,0)v2=(0,1,0)v3=(0,0,1)
  3. v1=(1,1)v2=(2,2)v3=(3,3)

对于每组,构造矩阵,化为行阶梯形,判断相关性。

思考题6:动脑题

问题:线性无关性为什么重要?

思考方向:

  • 在坐标系中,基向量为什么必须线性无关?
  • 在数据科学中,特征之间的相关性有什么影响?
  • 线性无关性和"维度"概念有什么关系?

词条4:基与维数

官方解释

向量空间 V是一个线性无关的向量组,且能生成整个 V(即 V 中任何向量都可表示为基向量的线性组合)。

维数:基中向量的个数,记作 dimV。维数与基的选择无关。

标准基:Rn 的标准基是 e1=(1,0,,0)e2=(0,1,,0),...,en=(0,0,,1)

兔狲老师解释

基就是"坐标系的标尺",维数就是"空间的自由度"。

小小猪的比喻:在三维空间中,我们需要三个独立方向(前后、左右、上下)来确定位置。这三个方向就是基,3就是维数。

坐标表示:给定基 {v1,v2,,vn},任何向量 w 可唯一表示为: w=c1v1+c2v2++cnvn(c1,c2,,cn) 就是 w 在该基下的坐标。

思考题7:动手题

问题:基与坐标练习

R3 中,考虑基 B={v1=(1,1,0),v2=(1,0,1),v3=(0,1,1)}

  1. 验证 B 是基(线性无关且生成 R3
  2. 求向量 w=(3,2,1) 在基 B 下的坐标
  3. 求标准基向量 e1=(1,0,0) 在基 B 下的坐标

思考题8:动脑题

问题:为什么维数是向量空间的内在性质?

思考方向:

  • 不同基的向量个数为什么相同?
  • 这和"线性无关向量的最大个数"有什么关系?
  • 无限维向量空间(如函数空间)有什么特点?

词条5:矩阵——线性变换的表示

官方解释

矩阵是数(或元素)的矩形阵列。m×n 矩阵有 mn 列: A=[a11a12a1na21a22a2nam1am2amn]

矩阵运算:

  1. 加法:对应元素相加(同型矩阵)
  2. 数乘:每个元素乘以标量
  3. 乘法:C=AB,其中 cij=k=1paikbkjAm×pBp×n

兔狲老师解释

矩阵就是"线性变换的密码本"。

每个 m×n 矩阵 A 对应一个线性变换 T:RnRmT(x)=Ax

矩阵的列:A 的第 j 列是 T(ej),其中 ejRn 的标准基向量。

矩阵乘法:变换的复合。如果 T1:RnRp 对应 AT2:RpRm 对应 B,则 T2T1 对应 BA

思考题9:动手题

问题:矩阵运算练习

A=[1234]B=[2013]C=[1102]

  1. 计算 A+B
  2. 计算 ABBA(注意顺序!)
  3. 计算 A(BC)(AB)C(验证结合律)
  4. 计算 A2=AA
  5. 解矩阵方程 AX=B(求 X

思考题10:动脑题

问题:矩阵乘法为什么一般不可交换?

思考方向:

  • 用几何变换解释:先旋转再平移 vs 先平移再旋转
  • 在物理学中,操作顺序为什么重要?
  • 什么情况下矩阵乘法可交换?(如对角矩阵相乘)

词条6:线性方程组——矩阵的应用

官方解释

m 个方程 n 个未知数的线性方程组{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm

矩阵形式:Ax=b,其中 A 是系数矩阵,x 是未知向量,b 是常数向量。

解的情况:

  1. 无解:方程组矛盾
  2. 唯一解:系数矩阵满秩
  3. 无穷多解:有自由变量

兔狲老师解释

线性方程组就是"用线性条件确定未知数"。

小小猪的比喻:像多个线索破案,每个方程提供一个线索。

解法:高斯消元法(行化简)

  1. 写出增广矩阵 [A|b]
  2. 化为行阶梯形
  3. 判断解的情况
  4. 如果有解,化为简化行阶梯形
  5. 写出解(可能含自由变量)

几何解释(R2):

  • 每个方程表示一条直线
  • 解是直线的交点
  • 无解:平行线
  • 唯一解:相交于一点
  • 无穷多解:同一条直线

思考题11:动手题

问题:解线性方程组

解方程组: {x+2yz=12x+y+z=8x+y+2z=7

  1. 写出增广矩阵
  2. 用高斯消元法化为行阶梯形
  3. 判断解的情况
  4. 如果有解,求出解

思考题12:动脑题

问题:线性方程组理论为什么重要?

思考方向:

  • 在工程中,电路网络分析如何化为线性方程组?
  • 在经济学中,投入产出模型如何使用线性方程组?
  • 线性方程组和矩阵的秩有什么关系?

词条7:行列式——体积的缩放因子

官方解释

行列式是方阵的一个标量值,记作 detA|A|

2×2 矩阵: det[abcd]=adbc

3×3 矩阵(Sarrus法则): det[abcdefghi]=aei+bfg+cdhcegbdiafh

一般 n×n 矩阵:按行(列)展开,或化为上三角矩阵(对角线乘积)。

兔狲老师解释

行列式就是"线性变换的体积缩放倍数"。

几何意义(R2):

  • detA 的绝对值:平行四边形面积的缩放倍数
  • detA 的正负:方向是否翻转(右手系变左手系)

性质:

  1. det(AB)=detAdetB
  2. det(A1)=1/detA(如果 A 可逆)
  3. detA=0A 不可逆 ⇔ 列向量线性相关

应用:判断矩阵是否可逆,计算体积,解线性方程组(克莱姆法则)。

思考题13:动手题

问题:行列式计算练习

  1. det[3124]
  2. det[123014560]
  3. det[2412](特别关注!)
  4. det[10002300456078910](三角矩阵)

思考题14:动脑题

问题:行列式为零意味着什么?

思考方向:

  • 在几何上,detA=0 对应什么变换?
  • 在线性方程组中,detA=0 意味着什么?
  • 在物理学中,什么情况下变换会"降维"?

词条8:逆矩阵——变换的逆操作

官方解释

方阵 A逆矩阵 A1 满足: AA1=A1A=I 其中 I 是单位矩阵。

A 可逆的充要条件:detA0

2×2 逆矩阵公式: [abcd]1=1adbc[dbca]

一般求法:高斯-若尔当消元法 [A|I][I|A1]

兔狲老师解释

逆矩阵就是"撤销变换"。

小小猪的比喻:如果矩阵 A 表示"旋转30度",那么 A1 表示"反向旋转30度"。

应用:

  1. 解线性方程组:Ax=bx=A1b
  2. 坐标变换:如果 y=Ax,则 x=A1y
  3. 矩阵方程:AX=BX=A1B

注意:不是所有矩阵都有逆。不可逆矩阵对应"不可逆"的变换(如投影到低维空间)。

思考题15:动手题

问题:求逆矩阵练习

  1. 验证 A=[1234] 是否可逆
  2. 如果可逆,用公式求 A1
  3. 用高斯-若尔当法求 A1[A|I][I|A1]
  4. 验证 AA1=I

思考题16:动脑题

问题:逆矩阵的存在性有什么意义?

思考方向:

  • 在密码学中,可逆矩阵如何用于加密解密?
  • 在计算机图形学中,为什么需要逆变换?
  • 不可逆变换在现实中对应什么情况?

词条9:特征值与特征向量

官方解释

对于 n×n 矩阵 A,如果存在非零向量 v 和标量 λ 使得: Av=λvλ 称为特征值v 称为对应的特征向量

特征方程:det(AλI)=0

特征多项式:p(λ)=det(AλI),是 λn 次多项式。

兔狲老师解释

特征向量就是"在变换中保持方向不变的向量"。

小小猪的比喻:矩阵变换像大风,大多数物体被吹得改变方向,但有些特殊方向(特征向量)上的物体只被拉伸/压缩(特征值),不改变方向。

几何意义:

  • 特征向量:变换的不变方向
  • 特征值:沿该方向的拉伸/压缩因子
  • 正特征值:保持方向
  • 负特征值:反向
  • 复特征值:旋转

应用:主成分分析(PCA)、振动分析、矩阵对角化。

思考题17:动手题

问题:求特征值和特征向量

对于 A=[4123]

  1. 求特征方程 det(AλI)=0
  2. 解特征方程得特征值 λ1,λ2
  3. 对每个特征值,解 (AλI)v=0 得特征向量
  4. 验证 Av1=λ1v1

思考题18:动脑题

问题:特征值和特征向量为什么重要?

思考方向:

  • 在主成分分析中,特征向量表示什么方向?
  • 在物理振动中,特征值和特征向量对应什么?
  • 为什么说特征值揭示了矩阵的"本质"?

词条10:矩阵对角化

官方解释

n×n 矩阵 A对角化,如果存在可逆矩阵 P 和对角矩阵 D 使得: A=PDP1 其中 D 的对角线元素是 A 的特征值,P 的列是对应的特征向量。

条件:An 个线性无关的特征向量(充分必要)。

对角化的好处:

  1. 计算幂:Ak=PDkP1Dk 容易计算)
  2. 解微分方程组
  3. 分析矩阵的长期行为

兔狲老师解释

对角化就是"换到特征向量坐标系"。

小小猪的比喻:在标准坐标系中,矩阵 A 的作用很复杂;但在特征向量坐标系中,A 只是简单的拉伸(对角矩阵)。

步骤:

  1. 求特征值 λ1,,λn
  2. 求对应的特征向量 v1,,vn
  3. 构造 P=[v1 v2  vn]
  4. 构造 D=diag(λ1,,λn)
  5. 验证 A=PDP1

不是所有矩阵都可对角化(如亏损矩阵)。

思考题19:动手题

问题:矩阵对角化练习

A=[4123](上题已求特征值特征向量)

  1. 构造 PD
  2. 计算 P1
  3. 验证 A=PDP1
  4. 计算 A5 用对角化方法

思考题20:动脑题

问题:对角化有什么实际应用?

思考方向:

  • 在马尔可夫链中,如何用对角化求稳态分布?
  • 在系统动力学中,对角化如何简化分析?
  • 什么情况下矩阵不可对角化?如何处理?

词条11:二次型与正定矩阵

官方解释

二次型是二次齐次多项式: Q(x)=xTAx=i=1nj=1naijxixj 其中 A 是对称矩阵(AT=A)。

正定矩阵:对称矩阵 A 是正定的,如果对所有非零向量 x,有 xTAx>0

判定方法:

  1. 所有特征值 > 0
  2. 所有顺序主子式 > 0
  3. 可分解为 A=RTRR 可逆)

兔狲老师解释

二次型就是"二次能量函数",正定性就是"能量总是正的"。

几何意义(R2):

  • 二次型 Q(x,y)=ax2+bxy+cy2
  • 正定时:Q(x,y)=1 表示椭圆
  • 不定时:Q(x,y)=1 表示双曲线

应用:

  1. 优化:二次函数的最值问题
  2. 物理:动能、势能是二次型
  3. 统计:多元正态分布的指数部分
  4. 机器学习:支持向量机、正则化

思考题21:动手题

问题:分析二次型

考虑 Q(x,y)=2x2+4xy+5y2

  1. 写出对应的对称矩阵 A
  2. 判断 A 是否正定(用特征值或主子式)
  3. Q 化为标准形(用正交变换)
  4. 画出 Q(x,y)=1 的图形

思考题22:动脑题

问题:正定矩阵为什么重要?

思考方向:

  • 在优化中,正定海森矩阵保证什么?
  • 在数值计算中,正定线性方程组有什么好性质?
  • 正定性和矩阵的"稳定性"有什么关系?

词条12:雅可比矩阵与多元微积分的连接

官方解释

雅可比矩阵是多变量向量值函数的导数矩阵。

对于函数 f:RnRmf(x)=(f1(x),f2(x),,fm(x)),其雅可比矩阵 Jf(x)m×n 矩阵: Jij=fixj

雅可比行列式:detJf,表示变换的局部体积缩放因子。

链式法则:如果 g:RpRnf:RnRm,则 Jfg(x)=Jf(g(x))Jg(x)

兔狲老师解释

雅可比矩阵就是"多维版的导数"!

小小猪的发现:单变量函数:导数(一个数)→ 斜率 多变量函数:雅可比矩阵(一个矩阵)→ 每个方向的变化率

几何意义:在一点附近,可微函数近似为线性变换,雅可比矩阵就是这个线性变换的矩阵。

应用:

  1. 牛顿法求根:解 f(x)=0,迭代 xk+1=xkJf(xk)1f(xk)
  2. 优化:梯度下降的多元推广
  3. 坐标变换:多重积分中的变量替换
  4. 神经网络:反向传播算法

思考题23:动手题

问题:雅可比矩阵计算

f(x,y)=(x2+y,xy,x+y)

  1. 求雅可比矩阵 Jf(x,y)
  2. 在点 (1,2) 计算 Jf
  3. 用雅可比矩阵近似 f(1.1,2.05)
  4. 计算雅可比行列式 detJf(x,y)

思考题24:动脑题

问题:雅可比矩阵如何连接线性代数和微积分?

思考方向:

  • 雅可比矩阵和线性变换的矩阵有什么对应?
  • 链式法则的矩阵形式为什么是乘法?
  • 在深度学习中,反向传播如何用雅可比矩阵表示?

兔狲学院小结:线性代数知识链

通过12个词条,我们建立了完整的线性代数知识链:

  1. 向量 → 有方向的量,线性代数的基本元素
  2. 向量空间 → 向量的集合与运算规则
  3. 线性相关/无关 → 向量的独立性
  4. 基与维数 → 坐标系的数学描述
  5. 矩阵 → 线性变换的表示
  6. 线性方程组 → 矩阵的核心应用
  7. 行列式 → 体积缩放因子,可逆性判据
  8. 逆矩阵 → 变换的逆操作
  9. 特征值与特征向量 → 变换的不变方向
  10. 矩阵对角化 → 简化复杂变换
  11. 二次型与正定矩阵 → 二次函数与优化
  12. 雅可比矩阵 → 连接线性代数与微积分

兔狲教授的最后一课: "线性代数不是关于数字的排列游戏,而是关于结构和关系的科学。它提供了理解多维世界的语言:用向量表示数据点,用矩阵表示变换,用特征值抓住本质,用二次型描述能量。

更重要的是,线性代数教会我们一种思维方式:在复杂系统中寻找线性结构,在高维空间中建立坐标系,在变换中寻找不变量。这是现代科学、工程和数据分析的核心能力。

现在,你不仅学会了线性代数的技术,更掌握了处理多维信息的思维框架。用这个框架去理解世界吧——从计算机图形到量子力学,从机器学习到经济模型,线性结构无处不在。"


下一站:西方近代以前哲学——理性思维的起源