Skip to content

Latest commit

 

History

History
91 lines (48 loc) · 6.75 KB

howtolearn.md

File metadata and controls

91 lines (48 loc) · 6.75 KB

学习方法

下文是参考文献 [1] 中所刊登的《关于线性代数的学习改进方法》内容摘录(为了便于阅读,排版和部分内容做了少量修订)。

英国数学家哈代(G.H.Hardy)在《一个数学家的辩白》(A mathematician's Apology)中说:

如果一个数学家发现自己在写关于数学的东西,他会感到很忧伤的。因为数学家的工作是做实事,比如证明新定理,使数学有所发展,而不是谈自己活别的数学家干了些什么。

政治家蔑视时事评论家;画家蔑视艺术评论家;生理学家、物理学家或数学家一般都有类似的感觉。做事者对评论者的蔑视是最深刻的,总的来看也是最合理的。解释、评论、鉴赏是此等工作。

或许在遗留数学家眼中,解释(exposition)、评论(criticism)和鉴赏(appreciation)是次等工作,但对于研习数学(特别是线性代数)的人来说,这些却都是最重要的实事。

线性代数与其他数学科目,如微积分、微分方程、概率的主要不同之处在于学习重心从计算程序转移至消化并掌握计算程序底下的基本概念。线性代数着重演绎逻辑(deductive logic),我们经常以概念取代量化关系。譬如,以“对称矩阵”取代 $$a_{ji}=a_{ij}$$ ,因此清楚理解这些概念是学好线性代数的第一步。紧接着,我们有创造出许多命题来连接概念之间的关系,譬如,“对称矩阵对应相异特征值的特征向量必定正交”。最后,我们还希望从不同或相反的角度来掌握问题,譬如,我们想知道“那些矩阵对应相异特征值的特征向量必定是正交的”?下面针对上述几项分别说明学习线性代数时必须特别注意的重点。

定义:什么是对称矩阵?

教科书普遍采用的定义如下:

$$\pmb{A}=[a_{ij}]$$ 是一个 $$n\times n$$ 阶对称矩阵,若 $$a_{ji}=a_{ij}$$ ,或简记为 $$\pmb{A}^{\rm{T}}=\pmb{A}$$ ,其中 $$\pmb{A}^{\rm{T}}$$$$\pmb{A}$$ 的转置矩阵,即 $$(\pmb{A}^{\rm{T}}){ij}=a{ji}$$ 。

这个朴素的定义像是展示泡在药水瓶里的青蛙标本,我们看见了它的形体,却不知道这只青蛙活着时不仅在池塘中有用,也会跑到陆地上活动。想要进一步理解对称矩阵,唯有重新认识转置矩阵。数学家的口袋里其实还有另外一个转置矩阵的定义,称为伴随(adjoint):

$$\pmb{A}$$ 是一个实矩阵,对于任意 $$\pmb{x},\pmb{y}\in\mathbb{R}^{\rm{n}}$$ ,转置矩阵 $$\pmb{A}^{\rm{T}}$$ 满足:

$$(\pmb{Ax})^{\rm{T}}\pmb{y}=\pmb{x}^{\rm{T}}(\pmb{A}^{\rm{T}}\pmb{y})$$

符合此性质的 $$\pmb{A}^{\rm{T}}$$ 是唯一存在的。若采用此定义,实对称矩阵 $$\pmb{A}^{\rm{T}}=\pmb{A}$$​ 满足下列不等式:

$$(\pmb{Ax})^{\rm{T}}\pmb{y}=\pmb{x}^{\rm{T}}(\pmb{Ay})$$

这么以来,对称矩阵从标本变成了活的生物——线性变换,我们称它为对称变换或许更恰当些。至少我们知道,对称矩阵可由向量内积界定。

当上式等于零时:若 $$\pmb{Ax}$$​ 正交于 $$\pmb{y}$$​ ,则 $$\pmb{Ay}$$ 正交于 $$\pmb{x}$$

命题:对于实对称矩阵,对应相异特征值的特征向量必定正交

实对称矩阵的特征值为实数,设 $$\pmb{Ax}=\lambda\pmb{x},\pmb{Ay}=\mu\pmb{y},\lambda,\mu\in\mathbb{R},\lambda\ne\mu$$

第二式左乘 $$\pmb{x}^{\rm{T}}$$ ,得:

$$\pmb{x}^{\rm{T}}\pmb{Ay}=\pmb{x}^{\rm{T}}\mu\pmb{y}=\mu\pmb{x}^{\rm{T}}\pmb{y}$$

第一式取转置:$$\pmb{x}^{\rm{T}}\pmb{A}^{\rm{T}}=\lambda\pmb{x}^{\rm{T}}$$ ,在右乘 $$\pmb{y}$$ ,得:

$$\pmb{x}^{\rm{T}}\pmb{A}^{\rm{T}}\pmb{y}=\lambda\pmb{x}^{\rm{T}}\pmb{y}$$

因为 $$\pmb{A}^{\rm{T}}=\pmb{A}$$​ ,上面两式左边相等,故:

$$(\mu-\lambda)\pmb{x}^{\rm{T}}\pmb{y}=0$$

已知 $$\lambda\ne\mu$$ ,所以 $$\pmb{x}^{\rm{T}}\pmb{y}=0$$ ,即特征向量正交。

上述证明方法的缺点是包含过多的代数运算,即使获得证明也未必真的弄懂了。原因是当人们投入心力在计算时,往往不能同时推理,自然也不会思考其中的意义。信息一旦缺少了意义,便无法称为知识。可想而知,那些不被我们使用的信息又如何能在脑中长存呢?以往所学是没有慎思的必然结果。

如果采用对称矩阵的内积定义:$$(\pmb{Ax})^{\rm{T}}\pmb{y}=\pmb{x}^{\rm{T}}(\pmb{Ay})$$ ,代入特征方程 $$\pmb{Ax}=\lambda\pmb{x},\pmb{Ay}=\mu\pmb{y}$$ ,得:

$$\lambda\pmb{x}^{\rm{T}}\pmb{y}=\mu\pmb{x}^{\rm{T}}\pmb{y}$$

已知 $$\lambda\ne\mu$$ ,所以 $$\pmb{x}^{\rm{T}}\pmb{y}=0$$ ,即特征向量正交。

推广:还有那些矩阵对应相异特征值的特征向量是正交的?

$$\pmb{A}^{\rm{T}}=-\pmb{A}$$ ,则称 $$\pmb{A}$$ 是反对称矩阵,亦即

$$(\pmb{Ax})^{\rm{T}}\pmb{y}=-\pmb{x}^{\rm{T}}(\pmb{Ay})$$

反对称矩阵的特征值必为零或纯虚数,特征向量可能是复向量,于是,实向量的内积 $$\pmb{x}^{\rm{T}}\pmb{y}$$​ 须改为 $$\pmb{x}^{\ast}\pmb{y}$$​ ,则:

$$(\pmb{Ax})^{\ast}\pmb{y}=-\pmb{x}^{\ast}(\pmb{Ay})$$

代入 $$\pmb{Ax}=(i\lambda)\pmb{x},\pmb{Ay}=(i\mu)\pmb{y}$$​ ,得:

$$-i\lambda\pmb{x}^{\ast}\pmb{y}=-i\mu\pmb{x}^{\ast}\pmb{y}$$

$$\lambda\ne\mu$$ ,得 $$\pmb{x}^{\ast}\pmb{y}=0$$

运用其他分析技巧,还可以证明只要 $$\pmb{A}$$ 满足 $$\pmb{A}^{\ast}\pmb{A}=\pmb{A}\pmb{A}^{\ast}$$ ,称正规矩阵(normal matrix),不论其特征值为何,$$\pmb{A}$$ 总有完整的单范正交(orthonormal)特征向量。

结论:

  • 厘清概念的定义与含义,尽可能列举出概念的所有性质以及延伸版图。
  • 推论证明时应尽量多使用“居先的”(a priori)事实,也就是那些我们累积的经验命题。居先的事实越完整,推理步骤越简短,如此也容易在脑中形成绵密且强固的知识网络。
  • 将既有的成功推论程序应用于其他问题上,以加速开疆扩土。倘若失效,则表示我们需要使用新概念或另寻其他分析技巧。百尺竿头更进一步。这是我们应当为新障碍的出现感到高兴。

此外,建议读者多利用图形来阐述概念之间的联系。推论前务必取得足够的信息。过程中跟紧前提,大胆猜测,并不时反向推理。结束后记录研究结果,撰写评论,供日后个人或他人鉴赏之用。

行远必自迩,登高必自卑。谁说解释、评论、鉴赏是此等工作?

参考文献

[1]. 线代启示录:答chang——关于线性代数的学习改进方法