线性代数概论

引言

想了很久从哪里开始，还是从我们为什么要学它开始吧，这篇文章中我不想谈太多线性代数的具体内容，先谈谈学习路线，比较推荐的学习路线是先在 B 站看 3Blue1Brown 的线性代数入门系列视频线性代数的本质，然后看 Linear Algebra Done Right 或者竺院宏篇巨著 Linear Algebra Left Undone （注意到它和前面形成对偶关系）。好教材还包括 MIT 的 Gilbert Strang 的教材 Introduction to Linear Algebra，另外你可以阅读我自己做的线性代数笔记 Linear Algebra Note，里面倾注了很多我对线性代数这门课的思考。

线性代数究竟是什么样子，国内教材搞了很多年，也没有完全搞清楚，可能几何与代数那本书的思路比较好，搞了个映射起手，但是最后线性代数（甲）僵化了

为什么要学线性代数呢？这是很多学生没搞明白的问题，学到最后只知道矩阵运算，证明题也不明所以，后续课程用到时也不求甚解地推导公式或者干脆直接抄别人的运算结果。虽然从计算上来讲这么做是没什么问题，但是我们还是希望多理解一些的，于是，我们不得不思考这个问题，即为什么我们要学线性代数。

$\mathbb{R}\to\mathbb{R}$ 。为了研究多维的世界，我们需要线性代数（需要说明的是，成千上万的维度是非常常见的，例如在计算机视觉、自然语言处理、数据分析、生物学等多个领域都很容易找到高维数据的例子）。直接研究多维的函数似乎是非常棘手的一件事情，那么我们不妨从简单的情形研究起，拓展到复杂的情形。一种是研究简单的函数，一种是研究较低的维度，然后拓展而研究一般维度上一般函数的性质。简单的函数构成了线性代数，较低的维度构成了初步的多元微积分，大体来讲可以列出这么一个表格

	一维	低维	一般维度
线性函数	初中数学（一次函数）	初中数学（方程组）	线性代数
一般函数	一元极限、一元微积分	线，面，体积分、多元微分	多变量微积分

图肯定是有疏漏之处，但是大体可以让我们产生一个印象：线性代数，从其本质上，研究的是一般维度上的线性函数，或者与线性函数相关的性质，是为了让我们方便处理高维问题的工具。

我看线性代数

下一节 $f(x,y) = x^2 + y^2$ $(2, 1)$ 点附近的性质，我们就会发现

\begin{aligned} f (2 + Δ x, 1 + Δ y) & = 4 + 4 Δ x + (Δ x)^{2} + 1 + 2 Δ y + (Δ y)^{2} \\ = 5 + (4 Δ x + 2 Δ y) + (小 量) \end{aligned}

$(\Delta x)^2$ $\Delta x$ 很小的时候是可以被忽略掉的，于是我们差不多可以写出

Δ f \approx 4 Δ x + 2 Δ y at (2, 1)

$\mathrm{e}^x$ $0$ $1+x$ 没啥太大差别（找个图形计算器自己验证一下你就会同意这一点）。所以，有一次项大体上来讲就够了。

那么，什么是线性函数呢？从其定义上来讲，线性函数是这样一个函数，使得

f (x_{1} + x_{2}) = f (x_{1}) + f (x_{2}), f (c x) = c f (x)

$x$ $f$ 吃进去一个向量，返回一个向量，也就是说它看起来可能长这样：

x = (x_{1}, x_{2}, \dots, x_{n})

而输出

y = f (x) = (y_{1}, y_{2}, \dots, y_{m})

$y=f(x)$ $y$ $m$ $x$ $n$ 个分量，这等于说可以写成

\begin{aligned} y_{1} & = a_{11} x_{1} + a_{12} x_{2} + \dots + a_{1 n} x_{n} \\ y_{2} & = a_{21} x_{1} + a_{22} x_{2} + \dots + a_{2 n} x_{n} \\ \dots \\ y_{m} & = a_{m 1} x_{1} + a_{m 2} x_{2} + \dots + a_{m n} x_{n} \end{aligned}

$y=ax$ $f(cx)=cf(x)$ $x=1, a=f(1)$ $f:\mathbb{R}^n\to\mathbb{R}^m$ $y$ $x$ 的线性组合

$m\times n$ 个松散的数做乘法和求和相比，矩阵让表达式更加紧凑，为了符合上面一排表达式的格式，我们把向量写成竖着的，另外我会习惯写成方括号，上课的教材上用的是圆括号，这没啥区别，纯粹是个人习惯问题）

\begin{matrix} y = [\begin{matrix} y_{1} \\ y_{2} \\ ⋮ \\ y_{m} \end{matrix}] = [\begin{matrix} a_{11} & a_{12} & \dots & a_{1 n} \\ a_{21} & a_{22} & \dots & a_{2 n} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ a_{m 1} & a_{m 2} & \dots & a_{m n} \end{matrix}] [\begin{matrix} x_{1} \\ x_{2} \\ ⋮ \\ x_{m} \end{matrix}] \end{matrix}

$y=Ax$ $A$ $y$ .

$y$ $Ax=y$ $x$ 问题，从初中开始就会的加减消元在这里被拓展为了高斯消元，表现在矩阵上就成了行之间的加减，研究矩阵作为一个函数的性质，就需要引出一些和它相关的量，于是有了秩和行列式的概念，除此之外还有特征值，如果去看我的笔记，里面会有我的详细引入，在这里就不讲太多。

$f:\mathbb{R}^n\to\mathbb{R}$ 的一个齐次二次函数. 只是强行借用了矩阵符号来表示。

$(1, 1)$ $(2, 0)$ 形的张量，两个之间并不相同，但是内积可以诱导相关关系

$y=y_0 + a(x-x_0)^2,a>0$ $0$ 的情况下，只有在二阶小量对应的函数正定时才能取得函数的极小值。考虑到极小值是一个常见的需要判定的问题，考虑二次函数自然也非常重要，于是需要这一块的内容，它在优化问题中也非常常见。当理解了抛物线之后我们就会发现正定的二次函数截出的等高线/面会是椭圆，椭球（或者更高维的东西）这一部分的内容又和多元微积分中的空间解析几何产生关系（只不过除了对二次曲面做出基本的分类之外，微积分中并没有进行更加深刻的研究，也许是不想增加大家的学习负担）。

如何学线性代数

那么，我对学习线性代数的看法是怎么样的呢？一千个人的眼中有一千本线性代数，它实在是太常见了，而每个人用到它的方式都不尽相同，故而会产生完全不同的理解。但是总的来讲我提供几个建议

多看书，多思考
把矩阵看成映射：虽然从存储上，矩阵就是一个二维的数表，但是把它仅仅看成一个数表会丢失很多，它描述的是两个空间之间的映射（或者说多元函数）关系
面向对象：把向量、矩阵、向量组作为对象，它们有着自己的属性和行为，虽然在最开始可以以高斯消元起手看矩阵的性质，但是归根结底还是要把这些操作抽象出来理解作为一个整体。
联系几何：如果不理解背后的几何原因，很多概念的定义可能会看起来费解，因此，我们应当想想定义一个概念的几何动机是什么。
如果可以的话，学着画交换图：画交换图可以帮助你快速理解映射关系、基底变换、矩阵乘法、相似变换，它也是理解更进一步的代数的有力工具。我的笔记中就画了大量交换图，希望大家可以多多理解。
注：交换图就是这样的东西，会画还是挺方便的
$\beta\circ \alpha$ $(\beta\circ \alpha) (x) = \beta(\alpha(x))$
（既然都会画交换图了，去看看抽象代数吧 x）
加入线代群（群号612551642）来水群（×）