线性代数
“线性代数是数学的基础,它为我们提供了理解和操作多维空间的语言。” —— 数学家吉尔伯特·斯特朗
线性代数是数学建模中最基础也是最重要的工具之一。它不仅提供了处理多元线性关系的数学框架,更是现代数据科学、机器学习和工程计算的核心基础。
向量空间理论
向量的概念与运算
向量的定义
向量是具有大小和方向的量,在n维空间中可以表示为: \[\mathbf{v} = \begin{pmatrix} v_1 \ v_2 \ \vdots \ v_n \end{pmatrix}\]
向量运算
加法: \[\mathbf{u} + \mathbf{v} = \begin{pmatrix} u_1 + v_1 \ u_2 + v_2 \ \vdots \ u_n + v_n \end{pmatrix}\]
数乘: \[c\mathbf{v} = \begin{pmatrix} cv_1 \ cv_2 \ \vdots \ cv_n \end{pmatrix}\]
内积(点积): \[\mathbf{u} \cdot \mathbf{v} = u_1v_1 + u_2v_2 + \cdots + u_nv_n = \sum_{i=1}^n u_iv_i\]
外积(叉积,仅适用于三维): \[\mathbf{u} \times \mathbf{v} = \begin{pmatrix} u_2v_3 - u_3v_2 \ u_3v_1 - u_1v_3 \ u_1v_2 - u_2v_1 \end{pmatrix}\]
向量的几何意义
模长(范数): \[|\mathbf{v}| = \sqrt{v_1^2 + v_2^2 + \cdots + v_n^2} = \sqrt{\mathbf{v} \cdot \mathbf{v}}\]
夹角: \[\cos\theta = \frac{\mathbf{u} \cdot \mathbf{v}}{|\mathbf{u}||\mathbf{v}|}\]
正交性:两向量正交当且仅当 \(\mathbf{u} \cdot \mathbf{v} = 0\)
向量空间的公理
向量空间 \(V\) 是满足以下8个公理的集合:
- 加法封闭性:\(\mathbf{u}, \mathbf{v} \in V \Rightarrow \mathbf{u} + \mathbf{v} \in V\)
- 加法交换律:\(\mathbf{u} + \mathbf{v} = \mathbf{v} + \mathbf{u}\)
- 加法结合律:\((\mathbf{u} + \mathbf{v}) + \mathbf{w} = \mathbf{u} + (\mathbf{v} + \mathbf{w})\)
- 零向量存在:存在 \(\mathbf{0} \in V\) 使得 \(\mathbf{v} + \mathbf{0} = \mathbf{v}\)
- 负向量存在:对任意 \(\mathbf{v} \in V\),存在 \(-\mathbf{v} \in V\) 使得 \(\mathbf{v} + (-\mathbf{v}) = \mathbf{0}\)
- 数乘封闭性:\(c \in \mathbb{R}, \mathbf{v} \in V \Rightarrow c\mathbf{v} \in V\)
- 数乘分配律:\(c(\mathbf{u} + \mathbf{v}) = c\mathbf{u} + c\mathbf{v}\) 和 \((c + d)\mathbf{v} = c\mathbf{v} + d\mathbf{v}\)
- 数乘结合律:\((cd)\mathbf{v} = c(d\mathbf{v})\) 和 \(1\mathbf{v} = \mathbf{v}\)
线性相关性与基
线性组合
向量 \(\mathbf{v}\) 是向量组 \({\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k}\) 的线性组合,如果存在标量 \(c_1, c_2, \ldots, c_k\) 使得: \[\mathbf{v} = c_1\mathbf{v}_1 + c_2\mathbf{v}_2 + \cdots + c_k\mathbf{v}_k\]
线性相关性
向量组 \({\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k}\) 线性相关,如果存在不全为零的标量 \(c_1, c_2, \ldots, c_k\) 使得: \[c_1\mathbf{v}_1 + c_2\mathbf{v}_2 + \cdots + c_k\mathbf{v}_k = \mathbf{0}\]
否则称这些向量线性无关。
基与维数
基:向量空间 \(V\) 的一组基是 \(V\) 中线性无关且能生成整个空间的向量组。
维数:向量空间的维数等于其任意一组基中向量的个数。
标准基:\(\mathbb{R}^n\) 的标准基是: \[\mathbf{e}_1 = \begin{pmatrix} 1 \ 0 \ \vdots \ 0 \end{pmatrix}, \mathbf{e}_2 = \begin{pmatrix} 0 \ 1 \ \vdots \ 0 \end{pmatrix}, \ldots, \mathbf{e}_n = \begin{pmatrix} 0 \ 0 \ \vdots \ 1 \end{pmatrix}\]
子空间
子空间的定义
集合 \(W \subseteq V\) 是向量空间 \(V\) 的子空间,如果:
- \(\mathbf{0} \in W\)
- 对任意 \(\mathbf{u}, \mathbf{v} \in W\),有 \(\mathbf{u} + \mathbf{v} \in W\)
- 对任意 \(c \in \mathbb{R}, \mathbf{v} \in W\),有 \(c\mathbf{v} \in W\)
重要的子空间
列空间:矩阵 \(A\) 的列空间 \(\text{Col}(A)\) 是由其列向量生成的子空间。
零空间:矩阵 \(A\) 的零空间 \(\text{Null}(A) = {\mathbf{x} : A\mathbf{x} = \mathbf{0}}\)。
行空间:矩阵 \(A\) 的行空间 \(\text{Row}(A)\) 是由其行向量生成的子空间。
左零空间:矩阵 \(A\) 的左零空间 \(\text{Null}(A^T) = {\mathbf{y} : A^T\mathbf{y} = \mathbf{0}}\)。
矩阵理论
矩阵的基本概念
矩阵定义
\(m \times n\) 矩阵是一个矩形数组: \[A = \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \ a_{21} & a_{22} & \cdots & a_{2n} \ \vdots & \vdots & \ddots & \vdots \ a_{m1} & a_{m2} & \cdots & a_{mn} \end{pmatrix}\]
特殊矩阵
方阵:行数等于列数的矩阵。
对角矩阵:只有对角元素非零的方阵: \[D = \begin{pmatrix} d_1 & 0 & \cdots & 0 \ 0 & d_2 & \cdots & 0 \ \vdots & \vdots & \ddots & \vdots \ 0 & 0 & \cdots & d_n \end{pmatrix}\]
单位矩阵:对角元素全为1的对角矩阵: \[I = \begin{pmatrix} 1 & 0 & \cdots & 0 \ 0 & 1 & \cdots & 0 \ \vdots & \vdots & \ddots & \vdots \ 0 & 0 & \cdots & 1 \end{pmatrix}\]
对称矩阵:满足 \(A = A^T\) 的方阵。
反对称矩阵:满足 \(A = -A^T\) 的方阵。
正交矩阵:满足 \(Q^TQ = I\) 的方阵。
矩阵运算
基本运算
加法: \[(A + B){ij} = a{ij} + b_{ij}\]
数乘: \[(cA){ij} = ca{ij}\]
乘法: \[(AB){ij} = \sum{k=1}^p a_{ik}b_{kj}\]
转置: \[(A^T){ij} = a{ji}\]
矩阵乘法的性质
- 结合律:\((AB)C = A(BC)\)
- 分配律:\(A(B + C) = AB + AC\)
- 转置性质:\((AB)^T = B^TA^T\)
- 一般不满足交换律:\(AB \neq BA\)
矩阵的逆
可逆矩阵
方阵 \(A\) 可逆,如果存在矩阵 \(A^{-1}\) 使得: \[AA^{-1} = A^{-1}A = I\]
可逆的条件
矩阵 \(A\) 可逆当且仅当:
- \(\det(A) \neq 0\)
- \(A\) 的列向量线性无关
- \(A\) 的零空间只包含零向量
- \(A\) 的列空间是整个 \(\mathbb{R}^n\)
逆矩阵的计算
2×2矩阵: \[A = \begin{pmatrix} a & b \ c & d \end{pmatrix}, \quad A^{-1} = \frac{1}{ad-bc}\begin{pmatrix} d & -b \ -c & a \end{pmatrix}\]
一般方法:高斯-约旦消元法 \[[A|I] \rightarrow [I|A^{-1}]\]
矩阵的秩
秩的定义
矩阵的秩是其线性无关行(或列)的最大个数,记作 \(\text{rank}(A)\)。
秩的性质
- \(\text{rank}(A) = \text{rank}(A^T)\)
- \(\text{rank}(AB) \leq \min(\text{rank}(A), \text{rank}(B))\)
- \(\text{rank}(A + B) \leq \text{rank}(A) + \text{rank}(B)\)
- 对可逆矩阵 \(P, Q\):\(\text{rank}(PAQ) = \text{rank}(A)\)
满秩矩阵
- 行满秩:\(\text{rank}(A) = m\)(行数)
- 列满秩:\(\text{rank}(A) = n\)(列数)
- 满秩:\(\text{rank}(A) = \min(m, n)\)
线性方程组
线性方程组的矩阵表示
线性方程组: \[\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2 \ \vdots \ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m \end{cases}\]
矩阵形式:\(A\mathbf{x} = \mathbf{b}\)
增广矩阵:\([A|\mathbf{b}]\)
解的存在性和唯一性
根据克拉默法则和矩阵理论:
- 有唯一解:\(\text{rank}(A) = \text{rank}([A|\mathbf{b}]) = n\)
- 有无穷解:\(\text{rank}(A) = \text{rank}([A|\mathbf{b}]) < n\)
- 无解:\(\text{rank}(A) < \text{rank}([A|\mathbf{b}])\)
齐次线性方程组
方程组 \(A\mathbf{x} = \mathbf{0}\) 总有解(至少有零解)。
基础解系:齐次方程组解空间的一组基。
如果 \(\text{rank}(A) = r < n\),则基础解系包含 \(n - r\) 个线性无关的解向量。
非齐次线性方程组
通解结构: \[\mathbf{x} = \mathbf{x}_0 + \mathbf{x}_h\]
其中 \(\mathbf{x}_0\) 是特解,\(\mathbf{x}_h\) 是齐次方程组的通解。
高斯消元法
通过行变换将增广矩阵化为阶梯形:
行阶梯形矩阵:
- 非零行在零行之上
- 每行的首个非零元素(主元)在上一行主元的右边
最简行阶梯形矩阵:
- 满足行阶梯形的条件
- 主元为1
- 主元所在列的其他元素为0
特征值与特征向量
基本概念
特征值和特征向量的定义
对于 \(n \times n\) 矩阵 \(A\),如果存在非零向量 \(\mathbf{v}\) 和标量 \(\lambda\) 使得: \[A\mathbf{v} = \lambda\mathbf{v}\]
则称 \(\lambda\) 为 \(A\) 的特征值,\(\mathbf{v}\) 为对应的特征向量。
特征多项式
特征值是特征方程的根: \[\det(A - \lambda I) = 0\]
\(\det(A - \lambda I)\) 称为特征多项式。
特征空间
对应特征值 \(\lambda\) 的特征空间是: \[E_\lambda = {\mathbf{v} : A\mathbf{v} = \lambda\mathbf{v}} = \text{Null}(A - \lambda I)\]
特征值的性质
- 迹:\(\text{tr}(A) = \lambda_1 + \lambda_2 + \cdots + \lambda_n\)
- 行列式:\(\det(A) = \lambda_1 \lambda_2 \cdots \lambda_n\)
- 相似不变性:相似矩阵有相同的特征值
- 实对称矩阵的特征值都是实数
对角化
可对角化的条件
矩阵 \(A\) 可对角化当且仅当 \(A\) 有 \(n\) 个线性无关的特征向量。
如果 \(A\) 可对角化,则存在可逆矩阵 \(P\) 使得: \[P^{-1}AP = D\]
其中 \(D\) 是对角矩阵,\(P\) 的列是 \(A\) 的特征向量。
对称矩阵的对角化
谱定理:任何实对称矩阵都可以正交对角化,即存在正交矩阵 \(Q\) 使得: \[Q^TAQ = D\]
二次型
二次型的定义
\(n\) 元二次型是形如: \[f(x_1, x_2, \ldots, x_n) = \sum_{i=1}^n \sum_{j=1}^n a_{ij}x_ix_j = \mathbf{x}^TA\mathbf{x}\]
的函数,其中 \(A\) 是对称矩阵。
二次型的分类
根据特征值的符号:
- 正定:所有特征值 > 0
- 负定:所有特征值 < 0
- 半正定:所有特征值 ≥ 0
- 半负定:所有特征值 ≤ 0
- 不定:既有正特征值又有负特征值
主轴定理
通过正交变换 \(\mathbf{x} = Q\mathbf{y}\),二次型可化为标准形: \[f = \lambda_1 y_1^2 + \lambda_2 y_2^2 + \cdots + \lambda_n y_n^2\]
矩阵分解
LU分解
将矩阵分解为下三角矩阵和上三角矩阵的乘积: \[A = LU\]
其中 \(L\) 是下三角矩阵,\(U\) 是上三角矩阵。
PLU分解(带行交换): \[PA = LU\]
QR分解
将矩阵分解为正交矩阵和上三角矩阵的乘积: \[A = QR\]
其中 \(Q\) 是正交矩阵,\(R\) 是上三角矩阵。
Gram-Schmidt正交化
给定线性无关向量组 \({\mathbf{v}_1, \mathbf{v}_2, \ldots, \mathbf{v}_k}\),可构造正交向量组:
\[\mathbf{u}_1 = \mathbf{v}_1\]
\[\mathbf{u}_2 = \mathbf{v}_2 - \frac{\mathbf{v}_2 \cdot \mathbf{u}_1}{\mathbf{u}_1 \cdot \mathbf{u}_1}\mathbf{u}_1\]
\[\mathbf{u}_3 = \mathbf{v}_3 - \frac{\mathbf{v}_3 \cdot \mathbf{u}_1}{\mathbf{u}_1 \cdot \mathbf{u}_1}\mathbf{u}_1 - \frac{\mathbf{v}_3 \cdot \mathbf{u}_2}{\mathbf{u}_2 \cdot \mathbf{u}_2}\mathbf{u}_2\]
以此类推。
奇异值分解(SVD)
任何 \(m \times n\) 矩阵 \(A\) 都可以分解为: \[A = U\Sigma V^T\]
其中:
- \(U\) 是 \(m \times m\) 正交矩阵
- \(V\) 是 \(n \times n\) 正交矩阵
- \(\Sigma\) 是 \(m \times n\) 对角矩阵,对角元素 \(\sigma_i \geq 0\) 称为奇异值
SVD的几何意义
SVD 描述了线性变换的完整几何结构:
- \(V^T\):坐标系旋转
- \(\Sigma\):沿坐标轴缩放
- \(U\):坐标系旋转
SVD的应用
- 数据压缩:保留主要奇异值
- 主成分分析:降维
- 矩阵的伪逆:\(A^+ = V\Sigma^+U^T\)
- 最小二乘问题
线性变换
线性变换的定义
函数 \(T: V \rightarrow W\) 是线性变换,如果:
- \(T(\mathbf{u} + \mathbf{v}) = T(\mathbf{u}) + T(\mathbf{v})\)
- \(T(c\mathbf{v}) = cT(\mathbf{v})\)
线性变换的矩阵表示
选定基后,线性变换可用矩阵表示: \[T(\mathbf{x}) = A\mathbf{x}\]
重要的线性变换
几何变换
旋转变换(二维,逆时针旋转角度 \(\theta\)): \[R_\theta = \begin{pmatrix} \cos\theta & -\sin\theta \ \sin\theta & \cos\theta \end{pmatrix}\]
反射变换(关于x轴): \[S = \begin{pmatrix} 1 & 0 \ 0 & -1 \end{pmatrix}\]
缩放变换: \[D = \begin{pmatrix} s_x & 0 \ 0 & s_y \end{pmatrix}\]
剪切变换: \[H = \begin{pmatrix} 1 & k \ 0 & 1 \end{pmatrix}\]
投影变换
正交投影到子空间 \(W\): \[P = A(A^TA)^{-1}A^T\]
其中 \(A\) 的列向量构成 \(W\) 的基。
核与像
核(零空间): \[\ker(T) = {\mathbf{v} \in V : T(\mathbf{v}) = \mathbf{0}}\]
像(值域): \[\text{Im}(T) = {T(\mathbf{v}) : \mathbf{v} \in V}\]
维数定理: \[\dim(V) = \dim(\ker(T)) + \dim(\text{Im}(T))\]
线性代数在建模中的应用
线性回归
最小二乘法
对于线性模型 \(\mathbf{y} = X\boldsymbol{\beta} + \boldsymbol{\epsilon}\),最小二乘解为: \[\hat{\boldsymbol{\beta}} = (X^TX)^{-1}X^T\mathbf{y}\]
正规方程
最小二乘问题等价于求解正规方程: \[X^TX\boldsymbol{\beta} = X^T\mathbf{y}\]
几何解释
最小二乘解是 \(\mathbf{y}\) 在列空间 \(\text{Col}(X)\) 上的正交投影。
主成分分析(PCA)
问题描述
给定数据矩阵 \(X\),寻找低维表示保留最大方差。
数学表述
- 计算协方差矩阵:\(C = \frac{1}{n-1}X^TX\)
- 求特征值分解:\(C = PDP^T\)
- 选择前 \(k\) 个主成分对应的特征向量
PCA的应用
- 降维:减少数据维度
- 数据可视化:高维数据的二维展示
- 噪声去除:保留主要成分,去除噪声
- 特征提取:提取数据的主要特征
马尔可夫链
转移矩阵
马尔可夫链的状态转移由转移矩阵 \(P\) 描述: \[P_{ij} = P(X_{n+1} = j | X_n = i)\]
性质
- 每行元素和为1:\(\sum_j P_{ij} = 1\)
- \(n\) 步转移概率:\(P^{(n)} = P^n\)
平稳分布
平稳分布 \(\boldsymbol{\pi}\) 满足: \[\boldsymbol{\pi}^T P = \boldsymbol{\pi}^T\]
即 \(\boldsymbol{\pi}\) 是转移矩阵 \(P^T\) 对应特征值1的特征向量。
网络分析
图的邻接矩阵
对于 \(n\) 个节点的图,邻接矩阵 \(A\) 定义为: \[A_{ij} = \begin{cases} 1 & \text{如果节点 } i \text{ 和 } j \text{ 相连} \ 0 & \text{否则} \end{cases}\]
度矩阵
度矩阵 \(D\) 是对角矩阵: \[D_{ii} = \sum_j A_{ij}\]
拉普拉斯矩阵
\[L = D - A\]
拉普拉斯矩阵的特征值提供了图的重要信息:
- 第二小特征值(Fiedler值):连通性度量
- 特征向量:图的分割
PageRank算法
Google的PageRank算法基于特征向量: \[(1-d)A + \frac{d}{n}\mathbf{1}\mathbf{1}^T)\mathbf{r} = \mathbf{r}\]
其中 \(\mathbf{r}\) 是PageRank向量,\(d\) 是阻尼系数。
线性规划
标准形式
\[\min \mathbf{c}^T\mathbf{x}\] \[\text{s.t. } A\mathbf{x} = \mathbf{b}, \mathbf{x} \geq \mathbf{0}\]
单纯形法
单纯形法在可行域的顶点间移动寻找最优解,每个顶点对应基本可行解。
对偶理论
原问题:\(\min \mathbf{c}^T\mathbf{x}\),\(A\mathbf{x} = \mathbf{b}\),\(\mathbf{x} \geq \mathbf{0}\)
对偶问题:\(\max \mathbf{b}^T\mathbf{y}\),\(A^T\mathbf{y} \leq \mathbf{c}\)
强对偶定理保证最优值相等。
控制理论
状态空间模型
线性系统的状态空间表示: \[\frac{d\mathbf{x}}{dt} = A\mathbf{x} + B\mathbf{u}\] \[\mathbf{y} = C\mathbf{x} + D\mathbf{u}\]
能控性
系统能控当且仅当能控性矩阵满秩: \[\mathcal{C} = [B, AB, A^2B, \ldots, A^{n-1}B]\]
能观性
系统能观当且仅当能观性矩阵满秩: \[\mathcal{O} = \begin{bmatrix} C \ CA \ CA^2 \ \vdots \ CA^{n-1} \end{bmatrix}\]
系统稳定性
线性系统稳定当且仅当矩阵 \(A\) 的所有特征值实部为负。
图像处理
图像的矩阵表示
灰度图像可表示为矩阵,每个元素是像素强度。
图像压缩
使用SVD进行图像压缩: \[A = U\Sigma V^T \approx U_k\Sigma_k V_k^T\]
保留前 \(k\) 个奇异值可实现压缩。
图像变换
- 平移:\(\mathbf{x}’ = \mathbf{x} + \mathbf{t}\)
- 旋转:\(\mathbf{x}’ = R\mathbf{x}\)
- 缩放:\(\mathbf{x}’ = S\mathbf{x}\)
齐次坐标系统一处理: \[\begin{pmatrix} x’ \ y’ \ 1 \end{pmatrix} = \begin{pmatrix} a & b & t_x \ c & d & t_y \ 0 & 0 & 1 \end{pmatrix}\begin{pmatrix} x \ y \ 1 \end{pmatrix}\]
数值线性代数
矩阵范数
向量范数
- 1-范数:\(|\mathbf{x}|1 = \sum{i=1}^n |x_i|\)
- 2-范数:\(|\mathbf{x}|2 = \sqrt{\sum{i=1}^n x_i^2}\)
- ∞-范数:\(|\mathbf{x}|\infty = \max{1 \leq i \leq n} |x_i|\)
矩阵范数
- Frobenius范数:\(|A|F = \sqrt{\sum{i,j} a_{ij}^2}\)
- 谱范数:\(|A|2 = \sigma{\max}(A)\)(最大奇异值)
- 1-范数:\(|A|1 = \max_j \sum_i |a{ij}|\)(最大列和)
- ∞-范数:\(|A|\infty = \max_i \sum_j |a{ij}|\)(最大行和)
条件数
矩阵 \(A\) 的条件数定义为: \[\kappa(A) = |A||A^{-1}|\]
条件数度量了矩阵的数值稳定性:
- \(\kappa(A) = 1\):最好的条件(正交矩阵)
- \(\kappa(A)\) 很大:病态矩阵,数值不稳定
迭代方法
Jacobi迭代
对于方程组 \(A\mathbf{x} = \mathbf{b}\),Jacobi迭代为: \[x_i^{(k+1)} = \frac{1}{a_{ii}}\left(b_i - \sum_{j \neq i} a_{ij}x_j^{(k)}\right)\]
Gauss-Seidel迭代
\[x_i^{(k+1)} = \frac{1}{a_{ii}}\left(b_i - \sum_{j < i} a_{ij}x_j^{(k+1)} - \sum_{j > i} a_{ij}x_j^{(k)}\right)\]
收敛性
迭代方法收敛的充分条件:
- 严格对角占优:\(|a_{ii}| > \sum_{j \neq i} |a_{ij}|\)
- 正定矩阵:对称正定矩阵保证收敛
最小二乘问题的数值解法
对于超定方程组 \(A\mathbf{x} = \mathbf{b}\)(\(m > n\)),有几种数值方法:
正规方程法
解 \(A^TA\mathbf{x} = A^T\mathbf{b}\)
缺点:条件数平方,数值不稳定。
QR分解法
\(A = QR\),则 \(\mathbf{x} = R^{-1}Q^T\mathbf{b}\)
优点:数值稳定。
SVD法
\(A = U\Sigma V^T\),则 \(\mathbf{x} = V\Sigma^+U^T\mathbf{b}\)
优点:最稳定,可处理秩亏情况。
矩阵微积分
向量函数的导数
标量对向量的导数
\[\frac{\partial f}{\partial \mathbf{x}} = \begin{pmatrix} \frac{\partial f}{\partial x_1} \ \frac{\partial f}{\partial x_2} \ \vdots \ \frac{\partial f}{\partial x_n} \end{pmatrix}\]
向量对标量的导数
\[\frac{d\mathbf{f}}{dt} = \begin{pmatrix} \frac{df_1}{dt} \ \frac{df_2}{dt} \ \vdots \ \frac{df_n}{dt} \end{pmatrix}\]
常用公式
- \(\frac{\partial}{\partial \mathbf{x}}(\mathbf{a}^T\mathbf{x}) = \mathbf{a}\)
- \(\frac{\partial}{\partial \mathbf{x}}(\mathbf{x}^T A \mathbf{x}) = (A + A^T)\mathbf{x}\)
- \(\frac{\partial}{\partial \mathbf{x}}(\mathbf{x}^T\mathbf{x}) = 2\mathbf{x}\)
矩阵函数的导数
矩阵指数
\[e^{At} = I + At + \frac{(At)^2}{2!} + \frac{(At)^3}{3!} + \cdots\]
性质:
- \(\frac{d}{dt}e^{At} = Ae^{At}\)
- 如果 \(AB = BA\),则 \(e^{A+B} = e^A e^B\)
应用
线性微分方程组 \(\frac{d\mathbf{x}}{dt} = A\mathbf{x}\) 的解: \[\mathbf{x}(t) = e^{At}\mathbf{x}(0)\]
小结
线性代数为数学建模提供了强大的工具:
- 多元线性关系:向量和矩阵描述多变量系统
- 几何直觉:线性变换的几何意义
- 数值计算:高效的算法和稳定性分析
- 数据分析:主成分分析、回归分析等
- 系统分析:状态空间模型、稳定性分析
- 优化问题:线性规划、二次规划
掌握线性代数的关键在于:
- 理解抽象概念的几何意义
- 熟练掌握矩阵运算和分解
- 了解数值稳定性和算法效率
- 能够将实际问题转化为线性代数问题
线性代数是现代数学建模的基石,与微积分、概率统计等工具结合,构成了解决复杂问题的完整框架。