线代[8]|北大丘维声教授《怎样学习线性代数?》(红色字体为博主注释)

news/2025/2/23 6:26:13

文章目录


说明

文章中红色字体为博主敲录完丘教授这篇文章后所加,刷到这篇文章的读者在首次阅读应当跳过红色字体,先通读一读文章全文,一遍,两遍,甚至是三遍以上。

该篇文章为大学工科专业线性代数课程脉络的梳理性质文章,仅仅到“二次型”为止与考研大纲相同,并未涉及“哈密顿—凯莱定理、奇异值分解(SVD)、广义逆矩阵、多项式理论、群环域、一元多项式、多元多项式、双线性函数、若当标准型、谱定理、仿射空间、射影空间、张量积、外代数”等偏拔高性质的代数内容。在我个人印象中有一本很火的英文翻译教材《线性代数应该这样学》,这本书适合学完高等代数后来阅读,初学线性代数者切勿跳级阅读。


初学线性代数的同学们一定想了解,线性代数的主要内容是什么?学习线性代数有哪些用处?这门课程有什么特点?学习时应注意什么?本文想就这几个方面的问题谈谈自己的体会。(注:该篇文章是北京大学著名数学教授丘维声先生在中央电大担任数学讲师,教授线性代数课程时,论述关于如何学好线性代数的综合文章。)

一、线性代数的内容简介

同学们在中学里都学过代数(即初等代数)。初等代数的主要内容是:研究数及运算。 由于用字母表示数,因此应用题可以列方程来解,解方程就成为初等代数的一个中心议题。(博主:1《数学原来可以这样学:初中篇》西成活裕,2《什么是初中数学》柏干、范兴亚、李岩,3《什么是初中物理》张虎岗,4《中考数学复习微专题讲座》易良斌,5《全解全练:中考数学压轴题》李静文,6《初中数学、高中数学脱节知识补缺教材》赵南平,7《初中数学知识补习课本》丘维声,8《中学代数研究》张奠宇、张广祥、宋乃庆,9《小学数学教材中的大道理——核心概念的理解和呈现》张奠宇、巩子坤、任敏龙、殷文娣,10~11《核心素养立意下的高中数学课程教材研究(上、下)》章建跃,12~17 初中数学千题解系列六册《二次函数与相似》、《中考压轴题》、《代数综合与圆》、《一次函数与四边形》、《反比例与最值问题》、《全等与几何综合》。2025.2.22 20:24)

由于初等代数研究的是数的运算和方程,所以代数的方法其优点在于可以运算,正因为这样,人们很早就运用代数的方法去研究几何图形的性质,即建立坐标系,用坐标表示点,用方程表示图形,这就是解析几何。线性代数正是随着解析几何的研究而发展起来的。

在解析几何里我们知道: 在平面上直线的方程是一次方程,反之,任一个二元一次方程在平面上表示一条直线。由于这个几何直观,通常把一次方程称为线性方程。当然,这里“线性”的意思是指变量的次数是一次,并不是说,线性方程都表示直线。事实上,在空间中,一次方程表示一个平面。在几何里,经常要求几个平面的交点,这转化为代数上就是要解三元一次方程组,即三个未知量的线性方程组。数学的各个分支、物理及许多实际问题则进一步提出要解几个未知量的线性方程组(1),其中: x 1 , x 2 , ⋯   , x n x_1,x_2,\cdots,x_n x1,x2,,xn 是未知量; a i j a_{ij} aij表示第 i 个方程中 x j x_j xj 的系数; b j b_j bj 称为常系数。

{ a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 ⋮ a s 1 x 1 + a s 2 x 2 + ⋯ + a s n x n = b s ( 1 ) \mathsf{\left\{\begin{array}{c} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\ \vdots\\ a_{s1}x_1+a_{s2}x_2+\cdots+a_{sn}x_n=b_s \end{array}\right.}(1) a11x1+a12x2++a1nxn=b1a11x1+a12x2++a1nxn=b1as1x1+as2x2++asnxn=bs1

线性方程组(1)在什么时候有解?如何求解?解的结构如何?这就是线性代数要研究的第一个问题。在求解线性方程组时,行列式是一个重要的工具,所以先要研究行列式。线性方程组完全被它的全部系数和常数项所决定,至于未知量用什么符号表示是没有什么关系的。因此,线性方程组(2)可以用下面这张表来表示。这种由一些数排列成的若干行(横的)、若干列(纵的)所组成的表称为一个矩阵。于是研究线性方程组就转化为研究矩阵。

[ a 11 a 12 ⋯ a 1 n b 1 a 21 a 22 ⋯ a 2 n b 2 ⋮ ⋮ ⋮ ⋮ a s 1 a s 2 ⋯ a s n b n ] ( 2 ) \begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}&b_1\\ a_{21}&a_{22}&\cdots&a_{2n}&b_2\\ \vdots&\vdots&&\vdots&\vdots\\ a_{s1}&a_{s2}&\cdots&a_{sn}&b_n \end{bmatrix}(2) a11a21as1a12a22as2a1na2nasnb1b2bn 2

除了线性方程组之外,还有大量的各种各样的问题也都提出矩阵的概念,譬如,解析几何中,平面直角坐标系的转轴公式为式(3)。

{ x = x ′ cos ⁡ θ − y ′ sin ⁡ θ y = x ′ sin ⁡ θ + y ′ cos ⁡ θ ( 3 ) \begin{cases} x=x'\cos\theta-y'\sin\theta\\ y=x'\sin\theta+y'\cos\theta \end{cases}(3) {x=xcosθysinθy=xsinθ+ycosθ3显然,新旧坐标之间的关系完全可以通过公式(3)中的系数排列成矩阵(4)表示出来。(博主:该矩阵为旋转矩阵。凡是在平面直角坐标系上进行旋转变换的向量,皆可用原向量左乘该矩阵求出的旋转后的向量。2025.2.17 21:30)

[ cos ⁡ θ − sin ⁡ θ sin ⁡ θ cos ⁡ θ ] ( 4 ) \begin{bmatrix}\cos\theta&-\sin\theta\\ \sin\theta&\cos\theta\end{bmatrix}(4) [cosθsinθsinθcosθ]4

矩阵是线性代数的一个主要研究对象。矩阵已经不是数,而是由一些数排列成的一张表,但是矩阵可以像数那样进行运算。矩阵的运算有加法、数量乘法、乘法等。矩阵由于可以进行运算,因此它的用途就很广,特别是矩阵的乘法很独特,矩阵的应用很多就是由矩阵的乘法而来的。矩阵除了可以进行运算外,还可以进行一些交换变成较简单的矩阵,根据不同问题的需要,对矩阵进行不同的变换。矩阵的变换有 初等变换、合同变换、相似变换 等。由于矩阵可以进行运算和交换,因此它成为了一个强有力的数学工具,希望同学们像熟练掌握微积分一样熟练掌握矩阵。

在解析几何中,平面上二次曲线的一般方程是

a x 2 + 2 b x y + c y 2 + 2 d x + 2 e y + f = 0 ( 5 ) ax^{2}+2bxy+cy^{2}+2dx+2ey+f=0(5) ax2+2bxy+cy2+2dx+2ey+f=05

为了研究这条曲线二次曲线的性质,需要坐标变换,把方程(5)化成标准方程。如果方程(5)中没有交叉项(即 x y xy xy项),那么只需要配方,然后作移轴就可以化成标准方程了,于是关键在于如何消去交叉项,而这实质就是把式(6)化成平方和的形式(7)。

a x 2 + 2 b x y + c y 2 ( 6 ) → a ′ x ′ 2 + c ′ y ′ 2 ( 7 ) ax^{2}+2bxy+cy^{2} (6) \rightarrow a'x'^{2}+c'y'^{2}(7) ax2+2bxy+cy2(6)ax2+cy27

式(6)是 x x x y y y 的二次齐次多项式,简称为 x x x y y y 的二次齐次或二次型。于是把二次曲线方程(5)化成标准方程的关键是要把二次型(6)化成平方和(7)的形式。因此,二次曲线问题的提出需要研究二次型。此外,数学的其他分支以及物理力学中也常常会碰到二次型。(博主:线性代数里的二次型与微分几何【第一基本形式、第二基本形式】、概率论与数理统计【概率密度函数】、经典力学【动能、势能】、电动力学【电场能量密度、磁场能量密度】均有关联。这一段文字来自豆包大模型。2025.2.17 21:50)在研究二次型时,矩阵是一个有力的工具。

在解析几何中研究了向量。我们知道向量可以进行运算,有加法、数量乘法运算等,并满足加法交换律等八条运算规律(以下简称八条规律 )。

向量满足的八条规律通常是指向量空间的公理。一个向量空间是定义在某个域上的一个集合,其中的元素称为向量。

  • 1、加法封闭性:对于向量空间中的任意两个向量 u 、 v u、v uv,它们的和 u + v u+v u+v 也在向量空间中。
  • 2、加法结合律:对于向量空间中的任意三个向量 u 、 v 、 w u、v、w uvw,有 ( u + v ) + w = u + ( v + w ) (u+v)+w=u+(v+w) (u+v)+w=u+(v+w)
  • 3、加法交换律:对于向量空间中的任意两个向量 u 、 v u、v uv,有 u + v = v + u u+v=v+u u+v=v+u
  • 4、加法单位元:存在一个向量 0 0 0(零向量),使得对于向量空间中任意一个向量 u u u,有 u + 0 = u u+0=u u+0=u
  • 5、加法逆元:对于向量空间中的任意一个向量 u u u,存在一个向量 − u -u u(负向量),使得 u + ( − u ) = 0 u+(-u)=0 u+(u)=0
  • 6、数乘封闭性:对于向量空间中的任意一个向量 u u u 和域中的任一个标量 c c c,它们的数乘 c u cu cu 也在向量空间中。
  • 7、数乘对向量加法的分配律:对于向量空间中的任意两个向量 u 、 v u、v uv,以及域中的任意一个标量 c c c,有 c ( u + v ) = c u + c v c(u+v)=cu+cv c(u+v)=cu+cv
  • 8、数乘对域加法的分配律:对于向量空间中的任意一个向量 u u u ,以及域中任意两个标量 c c c d d d,有 ( c + d ) u = c u + d u (c+d)u=cu+du (c+d)u=cu+du

除以上8条外,实际上还有两条关于数乘的规律:

  • 9、数乘的结合律:对于向量空间中的任意一个向量 u u u ,以及域中的任意两个标量 c 、 d c、d cd,有 ( c d ) u = c ( d u ) (cd)u=c(du) (cd)u=c(du)
  • 10、数乘的单位元:对于向量空间中的任意一个向量 u u u,有 1 u = u 1u=u 1u=u,其中 1 就是域中的乘法单位元。

综述,向量空间中的公理共有十条,但课本上通常只有八条,因为最后两条是关于数乘的额外规则。

在研究线性方程组时,一个线性方程 a 1 x 1 + a 2 x 2 + ⋯ + a n x n = b a_1x_1+a_2x_2+\cdots+a_nx_n=b a1x1+a2x2++anxn=b 可以用有序数组 ( a 1 , a 2 , a n , b ) (a_1,a_2,a_n,b) (a1,a2,an,b) 表示,这种有序数组也称为向量。一个 n n n 元有序数组 ( a 1 , a 2 , . . . , a n ) (a_1,a_2,...,a_n) (a1,a2,...,an) 称为一个 n n n 维向量。 n n n 维向量之间也可以规定加法和数量乘法两种运算,这两种运算同样满足八条规律。矩阵也有加法、数量乘法,并且这两种运算也滞足八条规律。像向量、矩阵这些对象已经不是数,但是它们都有加法、数量乘法这两种运算(加法、数量乘法称为线性运算),并且满足加法交换率等八条规律。这样的一些对象很多,譬如,多项式、连续函数等也都具有加法、数量乘法两种运算,且满足八条规律。代数是研究运算的,线性代数就是研究具有加法、数量乘法这两种线性运算的集合。 像向量组成的集合、矩阵组成的集合,都是具有两种线性运算,且满足八条规律的集合,这样的集合就称为线性空间。线性空间是线性代数研究的最基本的对象。解析几何里,全体向量组成的集合就是一个线性空间。我们都知道,若取定了三个不共面的向量 e 1 、 e 2 、 e 3 e_1、e_2、e_3 e1e2e3,则空间中任何一个向量 a a a 都以表示成 e 1 、 e 2 、 e 3 e_1、e_2、e_3 e1e2e3 的线性组合: a = x 1 e 1 + x 2 e 2 + x 3 e 3 a=x_1e_1 +x_2e_2+x_3e_3 a=x1e1+x2e2+x3e3 。这说明通过三个不共面的向量 e 1 、 e 2 、 e 3 e_1、e_2、e_3 e1e2e3 就能表示出空间中的全部向量,于是称这空间是三维的,并且称这三个不共面的向量 e 1 、 e 2 、 e 3 e_1、e_2、e_3 e1e2e3 是这空间的一组基维数和基的概念可以推广到抽象的线性空间中。

线性空间是某一类事物从量的方面的一个抽象。我们认识客观事物,固然要弄清它们单个的和总体的性质,但更重要的是研究它们之间的各种各样的联系。在线性空间中,事物之间的联系就反映为线性空间的映射。线性空间 V V V 到自身的映射通常称为 V V V 的一个变换。其中最简单的一种变换就是线性变换,即保持线性运算的变换:

{ Γ ( α + β ) = Γ ( a ) + Γ ( b ) Γ ( k α ) = k Γ ( α ) ( 8 ) \begin{cases} \Gamma(\alpha+\beta)=\Gamma(a)+\Gamma(b)\\ \Gamma(k\alpha)=k\Gamma(\alpha) \end{cases}(8) {Γ(α+β)=Γ(a)+Γ(b)Γ(kα)=kΓ(α)8

譬如在几何空间中,关于平面 Π \Pi Π 的投影就是一个线性变换。这是因为,若向量 α \alpha α 的投影是 α ′ \alpha' α,向量 β \beta β 的投影是 β ’ \beta’ β,则易看出 α + β \alpha+\beta α+β 的投影是 α ′ + β ′ \alpha'+ \beta' α+β。这表明投影是保持向量加法的。同样,容易看出 k α k\alpha kα 的投影是 k α ′ k\alpha' kα,这表明投影是保持数量乘法的。

线性变换是线性代数的重要研究对象。线性变换与矩阵有着非常密切的联系,在线性空间中若取定一组基,则一个线性变换可以对应到一个矩阵,这个对应是一一对应,并且这个对应是保持运算的。因此矩阵的好些问题可以通过研究线性变换来得到解决,而线性变换的好些问题又可以利用矩阵的工具来解决,它们互相渗透,密切相连。

以上所述的 线性方程组、矩阵、二次型、线性空间和线性变换 就是线性代数研究的主要对象。由于电大“线性代数”这门课程的学时比较少,我们就不讲抽象的线性空间了,而讲具体的 n n n 维向量空间;也不讲线性变换的概念了,而把线性变换的主要问题用矩阵的语言来讲。在这里顺便指出,高等代数是包括线性代数和多项式理论这两部分内容的,而我们仅学习线性代数这部分内容。


二、学习线性代数的用处

由于线性代数研究的是具有加法和数量乘法这两种运算的集合,而具有这两种线性运算的对象是很多的,因此线性代数的内容有广泛的应用。

线性方程组是最简单的方程组,在数学的各个分支、物理以及工程技术实际问题中会大量遇到线性方程组。因此给了一个线性方程组,它有没有解?若有解,如何求解?这都是必须明确的问题,以便于我们在数学的各个分支以及实际工作中能正确而迅速地解决所遇到的线性方程组的问题。

矩阵是非常重要的数学工具,许多数学问题、实际问题都可以引出矩阵,并且可以通过对矩阵进行运算或变换得到解决。例如,在微分方程组中,要解微分方程组(9),其中 y 1 、 y 2 y_1、y_2 y1y2 是未知函数。

{ d y 1 d x = y 1 + 4 y 2 d y 2 d x = y 1 + y ( 9 ) \begin{cases}\frac{dy_1}{dx}=y_1+4y_2\\ \frac{dy_2}{dx}=y_1+y\end{cases}(9) {dxdy1=y1+4y2dxdy2=y1+y9

式(9)右边的系数可以排成一个矩阵 A = [ 1 4 1 1 ] A=\begin{bmatrix}1&4\\ 1&1\end{bmatrix} A=[1141] 。如果记 d d x ( y 1 y 2 ) = ( d y 1 d x d y 2 d x ) \frac{d}{dx}\begin{pmatrix}y_1\\ y_2\end{pmatrix}=\begin{pmatrix}\frac{dy_1}{dx}\\ \frac{dy_2}{dx}\end{pmatrix} dxd(y1y2)=(dxdy1dxdy2),则利用矩阵的乘法可以把式(9)写成(10)。 d d x ( y 1 y 2 ) = ( 1 4 1 1 ) ( y 1 y 2 ) ( 10 ) \frac{d}{dx}\begin{pmatrix}y_1\\ y_2\end{pmatrix}=\begin{pmatrix}1&4\\ 1&1\end{pmatrix}\begin{pmatrix}y_1\\y_2\end{pmatrix}(10) dxd(y1y2)=(1141)(y1y2)10

作未知函数的线性替换 { y 1 = t 11 z 1 + t 12 z 2 y 2 = t 21 z 1 + t 22 z 2 ( 11 ) \begin{cases}y_1=t_{11}z_1+t_{12}z_2\\ y_2=t_{21}z_1+t_{22}z_2\end{cases}(11) {y1=t11z1+t12z2y2=t21z1+t22z211

式(11)也可以利用矩阵的乘法写成(12) ( y 1 y 2 ) = ( t 11 t 12 t 21 t 22 ) ( z 1 z 2 ) ( 12 ) \begin{pmatrix}y_1\\ y_2\end{pmatrix}=\begin{pmatrix}t_{11}&t_{12}\\ t_{21}&t_{22}\end{pmatrix}\begin{pmatrix}z_1\\z_2\end{pmatrix}(12) (y1y2)=(t11t21t12t22)(z1z2)12

T = [ t 11 t 12 t 21 t 22 ] T=\begin{bmatrix}t_{11}&t_{12}\\ t_{21}&t_{22}\end{bmatrix} T=[t11t21t12t22],将式(12)代入式(10),得

d d x ( T ( z 1 z 2 ) ) = A T ( z 1 z 2 ) \frac{d}{dx}\Big(T\begin{pmatrix}z_1\\z_2\end{pmatrix}\Big)=AT\begin{pmatrix}z_1\\z_2\end{pmatrix} dxd(T(z1z2))=AT(z1z2)

T d d x ( z 1 z 2 ) = A T ( z 1 z 2 ) ( 13 ) T\frac{d}{dx}\begin{pmatrix}z_1\\z_2\end{pmatrix}=AT\begin{pmatrix}z_1\\z_2\end{pmatrix}(13) Tdxd(z1z2)=AT(z1z2)13

在式(13)两边左乘 T − 1 T^{-1} T1 (T的逆矩阵),得

d d x ( z 1 z 2 ) = T − 1 A T ( z 1 z 2 ) ( 14 ) \frac{d}{dx}\begin{pmatrix}z_1\\z_2\end{pmatrix}=T^{-1}AT\begin{pmatrix}z_1\\z_2\end{pmatrix}(14) dxd(z1z2)=T1AT(z1z2)14

如果能选择矩阵 T T T,使得 T − 1 A T T^{-1}AT T1AT 称为对角矩阵 [ a 1 0 0 a 2 ] \begin{bmatrix}a_1&0\\ 0&a_{2}\end{bmatrix} [a100a2] ,那么式(14)变成

d d x ( z 1 z 2 ) = [ a 1 0 0 a 2 ] ( z 1 z 2 ) ( 15 ) \frac{d}{dx}\begin{pmatrix}z_1\\z_2\end{pmatrix}=\begin{bmatrix}a_1&0\\ 0&a_{2}\end{bmatrix}\begin{pmatrix}z_1\\z_2\end{pmatrix}(15) dxd(z1z2)=[a100a2](z1z2)15

利用矩阵的乘法,式(15)就成为

{ d z 1 d x = a 1 z 1 d z 2 d x = a 2 z 2 ( 16 ) \begin{cases}\frac{dz_1}{dx}=a_1z_1\\ \frac{dz_2}{dx}=a_2z_2\end{cases}(16) {dxdz1=a1z1dxdz2=a2z216

显然,微分方程组(16)是很容易求解的。这个例子说明,通过矩阵的运算和矩阵的变换,可以把一个复杂的问题变成一个较简单的问题,所以矩阵是一个很有用的工具。(博主:对于线性代数和微分方程之间的联系,可参考博主在2020年5月21日写的一篇文章《线代[6]|矩阵对角化以及特征值在微分方程中的应用》。2025.2.22 21:06)

二次型理论首先的一个应用是解决了二次曲线,特别是二次曲面的分类问题。其次,系数是实数的二次型的正定、负定、不定性被用在数学分析中解决多元函数的极大值、极小值问题。二次型理论在概率论与数理统计以及物理力学中也有重要应用。

值得指出的是,我们学习线性代数,除了线性代数的内容有广泛的应用以外,还在于线性代数这门学科考虑问题、解决问题的思想方法对我们有很大的帮助。譬如,代数学总是要对所研究的对象进行分类,在每类中取一个最简单的对象作为代表来进行研究。关于这点,举一个例子,对于两个 n n n 阶矩阵(n 行 n 列的矩阵) A A A B B B,如果存在一个可逆矩阵 T T T,使得

B = T − 1 A T B=T^{-1}AT B=T1AT

A 、 B A、B AB 称为相似。按照这个相似关系,全体 n 阶矩阵就被分成好多类,每一类里的矩阵是彼此相似的。有人会问:在每一类里能否找到一个最简单的矩阵作为代表?上面提到的微分方程组的例子中,关于选择 T T T,使得 T − 1 A T T^{-1}AT T1AT 成为对角矩阵,就是这里所说的问题。这个问题在第五章矩阵的标准形中将得到解决。代数学的上述这种研究问题的方法对我们解决其他数学分支中的问题以至于实际中的一些问题都是可取的。又譬如在代数学里,经常要在一类对象里找出具有某一特定性质的特殊对象,举一个例子:什么样的 n n n 阶矩阵是可逆矩阵?在解决这种问题时,总是先考虑如果矩阵 A A A 是可逆矩阵,那么它将具有哪些性质,然后再考虑具有这些性质的矩阵是否一定是可逆矩阵。这种考虑问题的方法是:先缩小范围,然后在这缩小了的范围内来审查这些对象是否都是具有某一特定性质的对象。这种考虑问题的方法也是可取的。像这种在学习一门课程的时候,除了学习这门课程的内容外,还注意学习这门学科考虑问题的一些方法也是很有必要的。这样我们学到的就不仅是一些现成的结论,而且有考虑问题、解决问题的一些方法。


三、线性代数的特点

代数学研究问题的基本方法是,先从某些具有公共性质的对象抽象出它们最基本的几条性质作为定义,然后从这些定义出发进行逻辑推理,揭示出这类对象的新的性质。譬如线性空间这一概念就是这样抽象出来的:把具有加法和数量乘法这两种运算,并且满足八条规律作为线性空间的定义,然后从线性空间的定义出发进行逻辑推理,揭示出线性空间的许多性质,这些性质由于是只用到线性空间的定义进行逻辑推理得到的,并没有用到线性空间里的元素的具体特性,因此这样推导出来的性质就对所有的线性空间都适用,不管是几何空间、 n 维向量空间、还是矩阵组成的空间、连续函数组成的空间,都具有这些性质。可见,这种方法的好处在于它能使应用非常广泛。 代数学的这种研究问题的方法称为公理化的方法或抽象的方法,这种公理化的方法使得线性代数具有如下几个特点:

第一,概念多而且抽象。 警如在第三章线性方程组中,将遇到向量组的线性相关、线性无关,等价的向量组,向量组的极大无关组,向量组的秩,矩阵的秩等一系列概念,而且这些概念都比较抽象。概念上的高度抽象性是近代数学的特点之一。由此而来的则是应用上的极其广泛性,这也是近代数学的一个特点。在线性代多中,由线性方程组抽象出 n n n 维向量和矩阵这两个概念,又从 n n n 维向量空间抽象出线性空间的概念,一次比一次抽象。抽象的东西不如具体的东西好学,但是抽象的东西比具体的东西应用要广,所以还是需要认真下功夫把它学好。

第二,逻辑性强。 由于代数学的基本方法是由具体事务抽象出一般概念,再运用这些概念逻辑推理揭示出事物新的性质,因此线性代数这门课程的逻辑性强,一环扣一环。

第三,明显的几何背景。 这在前面介绍线性代数的内容时已多次提到。这个特点使我们在学习线性代数里的抽象的概念时,可以借助几何直观来帮助我们理解这些概念,应该充分利用这一特点。


四、学习线性代数的方法

根据线性代数的上述特点,我们在学习线性代数时应当注意以下几方面。

第一,要把概念弄清楚,理解确切并且记住。 如果概念不清楚,模模糊糊,那就没有办法运用概念去进行逻辑推理,做题时就不知道如何下手。因此在学习中,应当首先复习概念、定理,弄明白了,然后再开始做作业。表面上看起来,似乎比一开始就做作业要慢,实际上,先复习概念、定理、例题,然后再做作业,可以使作业做得比较顺利,反倒省时间。更何况,我们如果没有弄清楚概念,那么只会做跟例题差不多的题,稍灵活一些,变换一下题目,就不会做了。所以希望同学们务必先复习概念、定理、例题,然后再做作业。由于线性代数逻辑性强,后面的内容需要用到前面的好些概念、定理,如果每次课,没有及时复习、消化,那么时间越长,学的概念、定理越多,脑子里就会堆积着一大堆模模糊糊的东西,这样学起后面的内容就很吃力。而如果每次课后,都能及时复习、及时消化,就会越学越顺利,那么怎样才能把概念弄清楚呢?一般来说应当从以下几方面着手:

  • 【1】先要弄清楚这个概念是怎样提出来的?它的背景是什么?
  • 【2】这个概念的确切内容是什么?
  • 【3】多举一些具体的例子来帮助理解抽象的概念,特别是举一些几何上的例子,比较直观、形象。

譬如,向量组线性相关、线性无关这个概念,它是怎么提出来的呢?为什么要学习这个概念呢?这是因为我们要研究线性方程组什么时候有解。由于每个线性方程可用一个向量表示,于是线性方程组是否有解必然跟表示这些方程的一组向量是怎么样的向量组有关系。

从几何上看,两个向量 α 、 b \alpha、b αb 组成的向量组有两种可能,即 α \alpha α b b b 共线,或者 α \alpha α b b b 不共线。前一情形, α \alpha α b b b 在一条直线上,我们称向量组 α 、 b \alpha、b αb 线性相关;后一情形, α \alpha α b b b 不在一条直线上,我们称 α \alpha α b b b 组成的向量组线性无关。为了能把线性相关、线性无关的概念推广到 n 维向量空间中,需要对几何上的向量 α \alpha α b b b 共线在代数上如何表示加以分析。在解析几何里知道, α \alpha α b b b 共线的充分必要条件是其中一个向量是另一个向量的倍数,即 α = n b \alpha= nb α=nb 或者 b = μ α b=\mu\alpha b=μα ,其中 n、m 是实数,也就是 1 ⋅ α − λ b = 0 1\cdot\alpha-\lambda b=0 1αλb=0 或者 μ α − 1 ⋅ b = 0 \mu\alpha-1 \cdot b=0 μα1b=0 。换言之,存在不全为 0 的数 k 1 、 k 2 k1、k2 k1k2 ,使得 k α + k b = 0 k\alpha+kb=0 kα+kb=0 。从这几何背景引出向量组线性相关的定义:对于向量组 a 1 , a 2 , ⋯   , a s ( s ≥ 1 ) a_1,a_2,\cdots,a_s(s \geq 1) a1,a2,,as(s1),如果存在一组不全为 0 的数 k 1 , k 2 , ⋯   , k s k_1,k_2,\cdots,k_s k1,k2,,ks,使得式(17)成立,则称向量组 α 1 , α 2 , ⋯   , α s ( s ≥ 1 ) \alpha_1,\alpha_2,\cdots,\alpha_s(s \geq 1) α1,α2,,αs(s1) 线性相关。

k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 ( 17 ) k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s=0(17) k1α1+k2α2++ksαs=017

在理解这个定义时,要注意“不全为 0”这几个字。因为对于任何向量组 a 1 , a 2 , ⋯   , a s a_1,a_2,\cdots,a_s a1,a2,,as 来说,都有

0 ⋅ α 1 + 0 ⋅ α 2 + ⋯ + 0 ⋅ α s = 0 0\cdot\alpha_1+0\cdot\alpha_2+\cdots+0\cdot\alpha_s=0 0α1+0α2++0αs=0

所以如果在线性相关的定义中不添加上“不全为 0”的限制,那么就毫无意义了。何况从几何背景上我们知道 α \alpha α b b b 共线的充分必要条件是存在不全为 0 的数 k 1 , k 2 , ⋯   , k s k_1,k_2,\cdots,k_s k1,k2,,ks 使得 k α + k b = 0 k\alpha+kb=0 kα+kb=0,所以只有当向量组 a 1 , a 2 , ⋯   , a s a_1,a_2,\cdots,a_s a1,a2,,as 存在不全为 0 的数 k 1 , k 2 , ⋯   , k s k_1,k_2,\cdots,k_s k1,k2,,ks 使得式(17)成立时,才是线性相关。

一个向量组不线性相关就称这个向量组线性无关。例如,几何上两个向量a与b若不共线,就称向量组 a、b 线性无关。既然向量组 a 1 , a 2 , ⋯   , a s a_1,a_2,\cdots,a_s a1a2,,as 不线性相关,就称为线性无关,因此向量组线性无关的定义又可叙述如下:

对于向量组 α 1 , α 2 , ⋯   , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,,αs,如果从 k 1 α 1 + k 2 α 2 + ⋯ + k s α s = 0 ( 17 ) k_1\alpha_1+k_2\alpha_2+\cdots+k_s\alpha_s=0(17) k1α1+k2α2++ksαs=017 可以推出 k 1 = k 2 = ⋯ = k s = 0 k_1=k_2=\cdots=k_s=0 k1=k2==ks=0,则称向量组 α 1 , α 2 , ⋯   , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,,αs 线性无关。这就是说,对于向量组 α 1 , α 2 , ⋯   , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,,αs,如果只有一组全为 0 的数,使得式(17)成立,则称向量组 α 1 , α 2 , ⋯   , α s \alpha_1,\alpha_2,\cdots,\alpha_s α1,α2,,αs 线性无关。

为了更好地把握向量线性无关的定义,我们在学习中,还应该多通过一些具体的例子去深入体会。(博主:对于以上文本中涉及到的一切数学概念的梳理,可阅读博主于2020年4月23日发布的一篇文章《线代[2]|对极易混淆概念的梳理:线性相关与线性无关、极大线性无关部分组与秩与基础解系、向量空间的基与维数》。2025.2.22 21:15)

第二,要努力培养逻辑推理的能力,即运用概念和已知的定理、性质进行推理、判断的能力。 为此,形式逻辑的一些基本常识是应当熟悉的。譬如,命题有四种形式: 原命题、逆命题、否命题、逆否命题。若原命题正确,则逆否命题一定正确,但是逆命题和否命题不一定正确。

要能进行逻辑推理,就必须熟记概念和定理、性质,否则就没有武器,遇到一个题就不知道如何下手。

第三,学习每一章、每一节时,都要明确这章、这节要研究什么问题,是如何解决的。 这样做,学习中头脑就是清醒的;如果不这样做,就会稀里糊涂,不知道现在在干什么。在学习一个定理时也要这样,要明确为什么要有这个定理,这个定理是如何证明的,主要是抓住证明的思路,弄清是怎样去证明的。如果坚持这么做了,就能不断学到一些方法,从而提高分析问题、解决问题的能力。

第四,学习线性代数学习任何一门数学课一样,必须适当多做一些习题。 光听课、光看书,自己不动手做题,那是学不好数学的。只有通过做题,才能加深对概念、定理的理解,才能学到一些方法。做习题时,一定要自己动脑子想,不要轻易翻习题解答,只有当想了很久确实想不出来时,才翻一下习题解答,稍微看一两眼,得到一点提示就可以不看了,自己再去想。只有自己动脑子做出来的题才是真的会了,如果是自己动脑子不够,轻易就看习题解答,那么很快就会忘的。做完题要注意小结,看看这样一类问题应当如何下手,千万不要任务观点,赶紧做完作业就放到一边。应当想一想,通过做这几个题有什么收获,学到什么方法。这样日积月累,能力就逐渐提高了。还要指出一点,做计算题时要算到底,不要因为算起来较麻烦就不愿意往下算了认为反正我方法会了。这样下去是不行的。其实算得对、算得快,这也是需要培养的一种能力,不在平时做作业时训练,就会在今后实际工作中算题时尽出错。

线性代数概念较多,也比较抽象一点,但是只要我们下决心,并且注意学习方法,是能够学好的。


五、更新时间记录

  • 收录第一节内容至“旋转矩阵”;「2025.2.15 13:54」
  • 第一节“线性代数的内容简介”收录完毕;「2025.2.15 20:07」
  • 第二节收录“”至代数式(12);「2025.2.15 20:26」
  • 第二节“学习线性代数的用处”收录完毕;「2025.2.16 11:32」
  • 第三节“线性代数的特点”收录完毕;「2025.2.16 11:32」
  • 第四节收录至线性相关部分(这些数学符号手打太累人了!!!);「2025.2.16 12:04」
  • 第四节“学习线性代数的方法”收录完毕;「2025.2.16 13:34」
  • 额外增加“向量空间的十条公理”;「2025.2.22 20:57」
  • 在原文中增加了两篇博主几年前写的线代文章链接;「2025.2.22 21:15」
  • 在文章开头增加“说明”一节。「2025.2.22 21:41」

P.S.1 四年多了,四年多了,在2020年6月1日写下线性代数专栏的第7篇文章《线代[7]|实对称矩阵》后,我终于又敲录了第8篇!「2025.2.22 21:45」

P.S.2 现在这个时代也许光从课本的内容出发学习线性代数就有点单薄了,线性代数是许多高阶数学与物理课的基础,同时在游戏开发,统计,R编程,Python编程,人工智能大模型等领域有极其重要的应用。但这些涉及专业的领域,我个人已无能为力……「2025.2.22 21:52」


http://www.niftyadmin.cn/n/5863112.html

相关文章

深度学习之特征提取

前言 深度学习就是把输入转换成一个高维的向量,之后利用这个向量去完成分类、回归等任务。 深度学习特征工程知识图谱 1. 特征提取的本质 核心目标:将原始数据→高维语义特征向量 监督驱动:标签决定特征提取方向 典型架构: …

Javascript排序算法(冒泡排序、快速排序、选择排序、堆排序、插入排序、希尔排序)详解

JS 排序算法详解 排序算法是计算机科学中的基础,用于将一组数据按照某种顺序重新排列。JavaScript中常见的排序算法包括冒泡排序、选择排序、插入排序、快速排序、归并排序等。以下是这些算法的详细介绍和代码示例。 冒泡排序(Bubble Sort)…

GPIO外设

一、GPIO简介 GPIO,general-purpos IO port,通用输入输出引脚,所有的GPIO引脚都有基本的输入输出功能。 最基本的输出功能:STM32控制引脚输出高、低电平,实现开关控制;最基本的输入功能:检测外部输入电平&…

CDGA|企业数据治理实战:从疏通“信息河”到打造优质“数据湖”

在当今的数字化时代,数据已成为企业的重要资产,其价值不言而喻。然而,面对海量的数据,如何进行有效的治理,将其转化为企业的竞争优势,成为了众多企业面临的难题。本文将深入探讨企业数据治理的实战策略&…

[实现Rpc] 服务端 | RpcRouter实现 | Builder模式

目录 项目服务端独用类的实现 1. RpcRouter类的实现 ServiceDescribe SDescribeFactory ⭕ Builder模式 1. 动机 2. 模式定义 3. 要点总结 4. 代码感受 ServiceManager RpcRouter 4. 代码感受 ServiceManager RpcRouter 前文我们就将 Rpc 通用类都实现完啦&#…

MySQL 架构

目录 1. MySQL 架构概览 (1) 客户端/服务器架构 (2) 存储引擎架构 2. 主要组件 (1) 客户端工具 (2) MySQL 服务器 (3) 存储引擎 3. MySQL 架构图 4. MySQL 架构的特点 5. MySQL 的高级架构 (1) 主从复制(Master-Slave Replication) (2) 主主…

透彻理解:方差、协方差、相关系数、协方差矩阵及其应用

最近看了几篇跨领域特征对齐方面的经典文献,学者们搞了很多花样,如有的提出一阶统计特征对齐,有的提出二阶统计特征对齐,有的学者提出高阶统计特征对齐。 通俗而言,就是在统计特征层面对跨域特征进行对齐,…

.NET MVC实现电影票管理

.NET MVC(Model-View-Controller)是微软推出的基于 Model-View-Controller 设计模式的 Web 应用框架,属于 ASP.NET Core 的重要组成部分。其核心目标是通过清晰的分层架构实现 高内聚、低耦合 的开发模式,适用于构建可扩展的企业级…