大智网汇
综合信息情报站

线性代数到底应该怎么学?

赞(0) 打赏
以上内容(如有图片或视频亦包括在内)为自媒体平台用户上传并发布,未作人工编辑处理,不构成投资建议请自行甄别,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:wolfba@qq.com 进行举报,并提供相关证据,工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容!

评论 4

  1. #1

    哭了,点赞数只有收藏的1/3,各位随手点个赞呗


    这个问题码了很久想答,现在终于有时间啦

    利益相关:浙大本科,线性代数期末卷面分97(GPA 5.0/5.0 ),大学以来所有数学(微积分、概统等杂七杂八的)成绩均在90以上。

    本篇回答,应试方法较强,数学思想略有涉猎。自知能力不足,无法深入分析线性代数的思想,线代和Machine Learning各种神奇的巧合等等,也在学习的过程中。

    一. 如何总结

    线代是一门逻辑性非常强的数学,非常注重对概念的深入理解,这从ZJU的线代考试80%以上的证明题可以看出。我一开始也觉得线代概念很乱且环环相扣,学的时候经常要翻前面的东西hhh

    如何理清楚线代的概念,靠的一定是总结。方法和大多数人一样,书+记笔记+刷题,但这三个怎么用,在我看到的周围人的用法中,我觉得大部分人对总结是有很大误解的,以下将说明我认为最高效的总结方法。

    1.1 书

    【重点的误解】划重点不是书上粗体,更不是每个定义,线代概念这么多,很多朋友强迫症似的把每个定义整整齐齐用荧光笔标出来,然后整本书都是重点,那期末怎么复习呀。我认为需要标出的重点为

    A. 不懂,或是生涩,或是不熟悉的部分。这点很重要,有的定义浅显,但证明方法很奇怪。我会将晦涩的定义,证明方法标出。在看书时,所有例题将答案遮住,自己做,卡住了就说明不熟悉这个例题的方法,也标出。

    B. 老师课上总结或强调的部分。这个没啥好讲的,跟着老师走就对了

    C. 你自己做题过程中,发现模糊的知识点

    1.2 记笔记

    记笔记千万不是抄书!!!我看到很多课友都是,抄老师的PPT,或者把书上的东西搬到笔记本上。有人可能觉得抄容易记起来,但数学不是背书嗷,抄一遍浪费时间且无用。我用我笔记的一小部分来说明怎么做笔记。

    (原谅我字丑)

    a. 线代最基础的——行列式计算。ZJU行列式有时候考的很难(甚至不懂怎么算),我的方法是把所有用到的计算技巧,用错题一个个总结起来。并把几个技巧烂熟于心,即使考试一时半会反应不出来,也可以一个一个试一下。

    b. 不断发现问题

    自我怀疑,发现问题是学数学很基本的思想。学习过程中发现混淆的概念,一定要及时去查资料把问题解决。比如常见的矩阵等价、相似和合同之间的关系,我总结的一部分图:

    c. 理清概念之间的逻辑

    比如极大线性无关组的一堆定义和推论,看起来很难记,但搞懂他们之间的关系就很简单了

    4. 做题技巧。划重点!我贼喜欢整做题技巧hhh,因为整了以后一看题目就能条件反射出做法,这种感觉刷题的时候真的太舒服了555

    比如这个对角化的判断:

    1.3 刷题

    【不是逮到一题写一题】

    大学数学不是高考,考试的时候简单题不会有坑,会就不会错。所以没必要在简单题上浪费时间。即使是为了交作业,看了就会的题我都是抄答案的(溜

    刷题很重要很重要,刷题不止是为了考试,只有做题才能让你真的发现自己的知识漏洞。

    a. 刷题的材料

    我一般采用的是,工作日完成作业,周末做做拓展的材料(比如吉米多维奇),考试周刷历年卷的方法。

    b. 刷题一定要总结错题

    错题同样也不是抄起来就行了,是重做+巩固知识点+总结思考

    比如下面这题证明题,我不仅重做了证明方法,而且加了一点点自己的思考进去,当作给自己的提醒。

    上面这个就是= =我怎么这么喜欢框图晕倒(可能我那时候觉得这样画比较开心)

    最后,关于总结。我不赞同大家去copy网上的资料,这不是你自己的总结,只有自己总结了才会有很深的印象,才能真正理清知识点之间的关系,才能内化为自己的知识。

    二. 碎碎念

    大学数学不同于高中,对于大多数朋友来说,数学只是一门基础科学。比如我学数学更多的是为之后要做的CS方面做铺垫,毕竟数理基础太重要了。所以有条件的话,建议去学一些拓展的东西,寻找数学和你所学知识之间更多的联系,不断发现问题和解决问题。


    以上应该是全部的回答啦。必须承认我的方法必然存在局限性和不足之处,仅供朋友们参考~

    大家,好好学习天天向上(●'◡'●)

    Chenlei4年前 (2019-10-30)回复
  2. #2

    线性代数的核心不是行列式和线性方程组,而是向量空间和线性映射

    这个回答中主要是从向量空间和线性映射的角度讲的,为了保持整体性,我还写了一篇与线性方程组有关的笔记,线代笔记(二):线性方程组的三种视角,欢迎移步去阅。

    另外,欢迎关注我的个人公众号:可乐学人。主要是分享笔记和新知,只愿日拱一卒,进一寸有一寸的欢喜。

    以下为原答案,欢迎批评指正。


    首先需要明确线性代数的核心不是行列式和线性方程组。

    维基百科对线性代数的定义是:线性代数是关于向量空间和线性映射的一个数学分支,包括对线、面和子空间的研究,同时也涉及到所有向量空间的一般性质。

    由此可见,线性代数的核心应该是向量空间和线性映射,而不是大学线代课上着重讲的行列式和线性方程组。

    今天分享一下矩阵的两种理解方法,静态上可以理解成多个点的坐标,动态上可以理解成是一个转移矩阵,从而可以延伸出矩阵的两个作用:1. 封装数据,2.线性变换。

    整篇文章试图说明以下几个论断,可能有些地方为了理解得更直观而表述得不严谨,如有错误欢迎批评指正。预计阅读时间10分钟,希望大家读完都会有所收获。

    1. 线性代数的核心是向量空间和线性映射

    2. 矩阵可以用来封装数据,也可以用来进行线性变换

    3. 秩是线性变换后向量空间的维度

    4. 行列式是线性变换后基向量张成的面积

    5. 特征向量是线性变换后仍在同一条直线上的向量,特征值是这些特征向量伸缩的程度

    一、铺垫:向量和向量空间

    1. 向量的三种表示

    向量有三种表示方法,箭头、坐标、头上顶了个箭头的字母。比如定义向量overrightarrow{v}

    2. 向量空间中最重要的是基向量

    因为向量可以表示成坐标,所以向量空间简单点可以直接想成是坐标系。

    整个向量空间中最重要的向量是基向量。

    基向量是可以张成整个向量空间的线性无关的向量,比如二维向量空间中,i=left[1,0right]j=[0,1]就是一组基向量,之前定义的向量overrightarrow{v}就可以由他们两个线性表示出来:overrightarrow{v}=1cdot overrightarrow{i}+2cdot overrightarrow{j}

    基向量的个数就是向量空间的维度,基向量确定了,向量空间也就确定了。

    二、矩阵的静态理解:封装数据

    教科书会把重点放在静态角度,用矩阵封装数据,可以简化问题的理解和计算。

    1. 剑桥减肥食谱的直观表示

    比如剑桥减肥食谱的问题(图片来自复旦大学《经济生活中的数学》课程PPT):

    如果用矩阵和向量封装数据,就可以将问题非常简单非常直观地表述出来,然后直接求overrightarrow{x} = A^{-1}overrightarrow{b}就可以了。

    2. 图像可以表示成矩阵

    再比如,图像是由像素构成的,每个像素都有位置和颜色两个参数。放大一张图片看到的一个个小方块就是像素。

    因此,一张像素为1024times 768的图片就可以存储为一个1024列,768行的矩阵,矩阵中每个元素就是每个像素点的颜色代码。

    三、矩阵的动态理解:线性变换

    更重要的是将矩阵理解成转移矩阵,也就是说,每个矩阵都对应一个线性变换,可以将一个向量变换为另一个向量。

    1. 矩阵的列对应线性变换后的基向量坐标

    对向量空间做线性变换等同于对基向量做变换,矩阵的每一列就对应的是线性变换后的基向量坐标

    比如这个例子,

    矩阵A就将overrightarrow{i}overrightarrow{j}变换为T(overrightarrow{i})T(overrightarrow{j}),第一列left[2,0right]就是T(overrightarrow{i})的坐标,第二列[1,3]就是T(overrightarrow{j})的坐标。

    2. 图像处理可以表示成矩阵

    再举个例子,简单的图像处理就是将图片进行伸缩或者进行旋转,这实际上就是把每个像素点的位置坐标乘以一个矩阵,得到新的像素点的坐标。

    3. 伸缩、旋转和投影

    伸缩和旋转是进行同维度的线性变换,也就是说本来是二维的图片,经过变换以后还是二维的。

    还有一种常见的线性变换是投影,比如阳光的照射。人是立体的,影子是平面上的,阳光照射就是一个三维到二维的线性变换。

    四、秩和行列式

    重点来了。将矩阵理解成线性变换,就可以理解一些从静态角度不那么好理解的概念。

    1.矩阵的秩就是线性变换后向量空间的维度

    伸缩和旋转矩阵是二维到二维的变换,所以秩就是2,因此是列满秩的。而投影矩阵对空间进行了压缩,所以一定是不满秩的。

    比如: 一个两列的矩阵,秩为1,就说明是将原来的二维空间压缩到了一条直线上。

    一个三列的矩阵,秩为2,就说明是将原来的三维空间压缩到了一个平面上。

    因为矩阵的每一列就是线性变换后的基向量,所以秩也可以定义为“矩阵的列向量张成的空间的维度”。

    2.矩阵的行列式就是线性变换后基向量张成的面积

    伸缩和旋转矩阵无非是把本来的正方形变成平行四边形,或者转一转,所以行列式一定不是零。而投影矩阵将空间进行了压缩,变换后的基向量一定存在共线或者共面,所以张成的面积一定是零。

    3. 秩、行列式与矩阵可逆的关系

    由此可见,秩和行列式都是矩阵的内在性质,都代表了对应的线性变换的特性:

    秩代表了线性变换后空间的维度,从而可以判断线性变换是否进行了降维;行列式代表了线性变换后基向量张成的面积,从而刻画了线性变换对空间的伸缩程度。

    理解了矩阵的秩和行列式,矩阵可逆不可逆就很好理解了。

    二维变换到二维,是可逆的。二维变换到一维,是不可逆的,因为将一个面压缩成一条线可以,反过来将线扩张成原来的面却是不可能的。

    换成秩和行列式的语言,高维到低维的变换就相当于压缩了向量空间,所以不满秩,压缩后基向量张成的面积一定是零,所以行列式为零。

    于是可以得到以下推论:

    矩阵不满秩<=>行列式为零<=>矩阵是降维变换<=>矩阵不可逆

    五、特征值和特征向量

    1. 特征向量是变换后仍在同一条直线上的向量

    特征向量是指线性变换后仍在同一条直线上的向量,特征值则是这些特征向量伸缩的程度。

    Aoverrightarrow{x}=lambdaoverrightarrow{x} \

    比如投影到二维的投影矩阵,它的特征向量就是平面上的向量和垂直于平面的向量,对应的特征值分别是10.而其他向量,比如overrightarrow{x}投影以后变成了T(overrightarrow{x}),方向改变了,所以不是特征向量。

    再比如图像的翻转,维基百科上的例子是这样的,很直观,就不赘述了。

    2. 特征值为1的特征向量可以反映稳态特征

    特征向量有啥用呢?举个简单的例子。

    可乐公司目前只生产可口可乐,不生产百事可乐,但是公司想雨露均沾,两种可乐都生产一点,于是计划每年都将可口可乐的20%换成百事可乐。

    同时为了保持稳定,每年也都将百事可乐的10%换成可口可乐,不然迟早有一天就只生产百事可乐了。

    这个例子可以用矩阵和向量的语言很直观地表示出来,初始时刻的状态用向量表示,变化情况则可以用一个转移矩阵表示:

    于是,将右边的转移矩阵乘以左边的初始向量就可以算出计划实施后第一年的状态,以此类推可以算出之后每一年的状态。

    用Python简单计算一下:

    import numpy as np
    
    A = np.array([[0.8,0.1],[0.2,0.9]])
    x = np.array([1,0])
    
    for i in range(1, 10):
        print('第{2}年:[{0:.2f},{1:.2f}]'.format(*np.dot(np.linalg.matrix_power(A,i),x),i))

    输出结果为:

    第1年:[0.80,0.20]
    第2年:[0.66,0.34]
    第3年:[0.56,0.44]
    第4年:[0.49,0.51]
    第5年:[0.45,0.55]
    第6年:[0.41,0.59]
    第7年:[0.39,0.61]
    第8年:[0.37,0.63]
    第9年:[0.36,0.64]

    可以看到,结果似乎趋于稳定了。

    实际上最终的结果逼近于向量left[begin{array}{c}0.33 \0.67 end{array}right],这个向量叫稳态向量,意味着最终可口可乐和百事可乐的占比分别稳定在三分之一和三分之二。

    于是我们可以发现一个有趣的事实:

    left[ begin{array} {cc} 0.8 & 0.1 \ 0.2 & 0.9 end{array} right] left[ begin{array} {c} 0.33 \ 0.67 end{array} right] = left[ begin{array} {c} 0.33 \ 0.67 end{array} right] \

    也就是说,转移矩阵乘以稳态向量,还等于稳态向量

    这不就是特征值和特征向量的定义式吗,稳态向量就是特征向量,1就是特征值。

    所以在这个例子中,特征向量的作用就显而易见了:转移矩阵一旦确定,不管初始状态如何,最终都会趋于这个稳态的特征向量。换句话说,特征值和特征向量可以反映矩阵的稳态特征。

    3. 特征值之积等于行列式

    关于复杂一点的特征值和特征向量,以后有空了再慢慢更新,对于理解线性代数来说,能理解到这两个玩意儿可以描述矩阵的一些性质就够了。

    最后再给个小福利,教科书中提到特征值的计算时,会推导出一个结论:特征值之积就等于行列式。

    真是让人摸不着头脑,行列式的计算那么复杂,特征值的计算又是另外一套体系,为啥会有这样优美的结论??!!

    用本文中的两句话,或许可以直观感受一下行列式和特征值的内在联系:

    第一句:行列式可以刻画线性变换对向量空间的伸缩程度。

    第二句:特征值是特征向量伸缩的程度。


    欢迎关注我的公众号:可乐学人。公众号中排版会更耐读。

    可乐学人3年前 (2020-11-28)回复
  3. #3

    无法理解线性代数的原因有很多,本文主要来讲讲各大高校使用的主流教材同济大学版的《线性代数》的问题。

    之前写过一篇无法理解高等数学怎么办的文章,对同济大学版的《高等数学》教材进行过一些评论,认为这本教授微积分的主流教材的问题在于坡度太陡了,但逻辑主线是没有问题的,所以我们在创作《马同学单变量微积分》内容时基本上还能和此书的目录结构保持一致。

    但同济大学版的《线性代数》问题就很大了,随便摘选下豆瓣的书评:

    这本同济大学版的《线性代数》担得起“误人子弟”这四个字,根子上就有问题,拿着这本书学不好也情有可原。我们在创作《马同学线性代数》内容时,虽然目标是覆盖同济大学版的《线性代数》,但迫不得已对逻辑结构、目录结构进行了大规模的调整。

    下面来具体讲讲同济大学版的《线性代数》问题出在哪里吧。

    1 线性代数的大致内容

    1.1 向量、矩阵、行列式

    先简单介绍下线性代数讲的是什么内容。一个立方体、一根直线、一个平面都是线性的:

    用向量就可以表示它们,比如说下图就展示了可以用三个向量boldsymbol{u}boldsymbol{v}boldsymbol{w} 以及向量的加减法就可以表示一个立方体:

    而矩阵可以对向量进行变换,比如通过旋转矩阵可以让某个正方形变换为旋转后的正方形:

    而行列式代表的是矩阵变换前后的面积(体积)之比:

    很显然旋转正方形不会导致面积改变,所以旋转矩阵变换前后的面积之比为1,或者说行列式为1:

    begin{vmatrix}costheta&-sintheta\sintheta&costhetaend{vmatrix}=costhetacostheta+sinthetasintheta=1\

    至此,线性代数最重要的几个概念就出现了,然后就可以用它们去解决实际问题了。

    1.2 线性方程组

    线性代数最早出现就是为了求解线性方程组,假如想求解下列线性方程组:

    begin{cases} a_{11}x_1+a_{12}x_2=b_{1}\ a_{21}x_1+a_{22}x_2=b_{2} end{cases} \

    其实就是要求出这两个方程所代表的直线的交点:

    再复杂点的线性方程组:

    begin{cases} a_{11}x_1+a_{12}x_2+a_{13}x_3=b_{1}\ a_{21}x_1+a_{22}x_2+a_{23}x_3=b_{2}\ a_{31}x_1+a_{32}x_2+a_{33}x_3=b_{3} end{cases} \

    无外乎也是求这些方程所代表的平面的交点、交线、交面:

    所以,可以通过向量组把这些直线、平面表示出来,然后通过矩阵对这些直线、平面进行变换,再用行列式判断变换的结果,最终找到方程组的解。大概就是这么一个思路吧,细节还很多,这里就不细说了。

    2 同济版《线性代数》中的行列式

    2.1 定义式

    同济版《线性代数》的第一单元就是介绍行列式,首先介绍了二阶行列式代表如下算法:

    三节行列式代表了更复杂的计算方法,因为比较复杂,所以可以靠对角线法则来进行记忆:

    至于更高阶的行列式代表的计算方法就必须靠全排列和逆序数才能说得清楚,最终给出了行列式的定义:

    n 阶行列式定义为:
    D=begin{vmatrix} a_{11}&a_{12}&cdots&a_{1n}\ a_{21}&a_{22}&cdots&a_{2n}\ vdots&vdots&quad&vdots\ a_{n1}&a_{n2}&cdots&a_{nn} end{vmatrix} \
    其值为:
    D=sum(-1)^ta_{1p_1}a_{2p_2}cdots a_{np_n} \
    其中,t 为排列a_{1p_1}a_{2p_2}cdots a_{np_n} 的逆序数。

    我就问问你,那个高考结束没有多久、刚刚过了一个愉快的暑假、背井离乡、来到一个陌生的地方、开始新的学习生活的你,看到这个定义怕不怕?

    因为行列式是考试重点,所以紧接着就给出了十多条行列式的性质,条条看上去都凶神恶煞。

    2.2 线性方程组

    然后介绍了一个克拉默法则,使得可以通过行列式求解线性方程组的解。具体的算法如下,假如说线性方程组:

    begin{cases} a_{11}x_1+a_{12}x_2=b_1\ a_{21}x_1+a_{22}x_2=b_2 end{cases} \

    有唯一解,那么所求的x_1x_2 为:

    x_{color{red}1}=displaystyle frac{begin{vmatrix}color{red}{b_1}&a_{12}\color{red}{b_2}&a_{22}end{vmatrix}}{begin{vmatrix}a_{11}&a_{12}\a_{21}&a_{22}end{vmatrix}} quad x_{color{red}2}=displaystyle frac{begin{vmatrix}a_{11}&{color{red}{b_1}}\a_{21}&{color{red}{b_2}}end{vmatrix}}{begin{vmatrix}a_{11}&a_{12}\a_{21}&a_{22}end{vmatrix}} \

    其实克拉默法则是有明确几何意义的。同济版《线性代数》这样介绍行列式以及它的用法,整个一单元一副几何图像都没有,会让你没有办法获得数学的直觉,造成很大的学习负担。

    3 同济版《线性代数》更大的问题

    整本书既没有强调矩阵是对向量的变换,也没有说明行列式的几何意义是变换前后的比例,这样就生生割断了矩阵和行列式之前的联系,造成我们对线性代数在后继学科中的应用缺乏全局的理解,所以也搞不清楚为什么要学习线性代数。

    比如在学习多变量微积分的时候,已知S 是这么一个三维光滑曲面:

    可以通过如下公式来求解它的面积:

    displaystylemathop{iint}_{S}dS=mathop{iint}_{D_{xy}} sqrt{1+(frac{partial f}{partial x})^2 +(frac{partial f}{partial y})^2}mathrm{d}xmathrm{d}y\

    其中S 指的是曲面面积,D_{xy}Sxy 平面的投影。

    这个公式应该怎么理解呢?根据微积分的思想,可以把这个曲面切成很多小份,其中某一小份的曲面面积mathrm{d}S 可以用它的切平面的面积mathrm{d}A 来近似(也就是有mathrm{d}Sapprox mathrm{d}A ):

    mathrm{d}Axy 平面上的投影为mathrm{d}D_{xy}

    现在我们有两个平面了,一个是mathrm{d}D_{xy} ,一个是mathrm{d}A ,根据之前对线性代数的介绍,这两个平面可以通过某个矩阵(也就是导数D )完成转换:

    mathrm{d}D_{xy}xrightarrow{quad Dquad}mathrm{d}A\

    那么这两个面积的比例就为该矩阵的行列式,所以最终可以得到(详细推论过程见如何解释曲面面积公式):

    displaystylemathop{iint}_{S}dS=mathop{iint}_{D_{xy}} underbrace{sqrt{1+(frac{partial f}{partial x})^2 +(frac{partial f}{partial y})^2}}_{某行列式}quadunderbrace{mathrm{d}xmathrm{d}y}_{mathrm{d}D_{xy}}\

    4 小结

    综上,同济版《线性代数》主要有以下的问题:

    • 线性代数是几何意义非常明确的数学学科,而此书内几乎毫无几何图像的讲解,导致同学完全无法建立直觉
    • 逻辑关联性差,行列式和矩阵各行其是(以及其它的线性代数概念),似乎毫不相关,让同学无法融会贯通
    • 仅限于代数计算,没有大局观,妨碍了其它学科的深造
    • 作为主流教材,作为业界标杆,就算有识之士想为它写教辅,也很难不被带歪。如果不按照它的体系来写又需要一定的勇气

    大家在学习的时候一定要开一个好头,可以选择参加我们的付费课程《马同学线性代数》;或者重新购买比同济版《线性代数》更好的教材,比如《线性代数及其应用》;或者观看B站、网易公开课等知名公开课视频、知名博主的视频。

    在此强烈推荐马同学图解数学系列

    马同学1年前 (2022-10-18)回复
  4. #4

    转载于sheh伟伟的答案

    看这个 提高非常大 当你把什么是矩阵 什么是线性变换 相似矩阵的意义是什么等等这些基础问题 你就会发现线性代数变成了一个空间里的小游戏 理解起来直观简单

    矩阵的理解(一):

    blog.csdn.net/myan/arti

    矩阵的理解(二):

    blog.csdn.net/myan/arti

    矩阵的理解(三):

    blog.csdn.net/myan/arti

    创建于 2012-05-11

    著作权归作者所有

    春子1年前 (2023-02-13)回复

大智网汇

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 wolfba@q.com 举报,一经查实,本站将立刻删除。

投稿&软文

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

微信扫一扫打赏

登录

找回密码

注册