为什么当今数学教材写的跟天书一样,根本看不懂?

发布时间:
2023-08-16 11:25
阅读量:
21

别收藏了我,就让我吃灰哈!有人留言,收藏即入土,扎了我的肺管子。



我当年读大学的时候也是对线性代数、概率统计课程各种抱怨,特别是线性代数。在我眼里,一个中括号括起来的一堆10以内的小破数,能有什么用?!

看看咱们的线代教材,告诉我你的感受!

后来,读博士的时候,对矩阵论、多元统计、数值方法、优化方法各种教材和课程,完全没好感,甚至厌恶。

书也读了,课也上了,题也做了,试也考了。考完就想赶紧彻底忘掉,不想有任何瓜葛。

特别是考虑到,我现在的工作几乎天天用线性代数、多元统计、多元微积分这些数学工具,以及自己的线性代数学习血泪史 ...

与其抱怨,不如改变。不必听自暴自弃者流的话。 能做事的做事

于是,无知者无畏,小弟不才,厚着脸皮自己写了一套教材,免费给大家看。

稿件和python代码都在这,完全开源,不必注册,免费下载!

Visualize-ML - Overview

全套鸢尾花图册的坑很大,谢谢大家的耐心等待。目前稿件状态:

《编程不难》:2023年三月份上传草稿

《可视之美》:2023年三月份上传草稿

《数学要素》:583幅图,136个代码文件,其中24个Streamlit App

《矩阵力量》:584幅图,81个代码文件,其中18个Streamlit App

《统计至简》:已上传全部25章草稿,还会再修改两轮

《数据有道》:已经上传大部分草稿,还会大改两轮

《机器学习》:已经上传大部分草稿,还会大改两轮

《数学要素》粉丝五折入口:

生姜DrGinger:鸢尾花书《数学要素》粉丝五折入口终于来啦

看个人情况,开源资源,永久有效哈。



欢迎大家提意见,我会及时修改并更新Github。

不能登陆github的朋友可以使用如下镜像。感谢Higkoo

Higkoo/Book3_Elements-of-MathematicsHigkoo/Book4_Power-of-MatrixHigkoo/Book5_Essentials-of-Probability-and-StatisticsHigkoo/Book6_First-Course-in-Data-ScienceHigkoo/Book7_Visualizations-for-Machine-Learning

目前还在配套学习视频,全免费!视频地址在PDF文件下方。

各位亲们,除了收藏让我吃灰,我厚脸皮要个赞呗!拜谢了!

咱们这套图册的“小名”----鸢尾花书!原因是,书中到处使用鸢尾花数据集做例子。

再次强调,本文和书稿都是针对“数据科学”和“机器学习”经典算法和应用相关的数学工具,不是纯数学。

虽然系列名称叫——从加减乘除到机器学习,但是希望读者至少有高二数学水平。

这套教材,相当于写给十年前的自己,告诉自己,学数学,不仅仅是为了考试!数学好玩,数学有用(能成为你糊口养家的工具)!

# ============================

图册特别强调,数据可视化 + 机器学习应用 + Python编程 + 数学板块融合。

学习资料包括:纸质书 + 电子书(免费) + 微课(免费)+ 代码文件(免费)+ 动画制作(免费)

用鸡兔同笼讲线性代数,我的一个小实验

为了将阅读压力减至最低,甚至让你喜欢上数学,我还在书中加入很多国风元素。

比如《鸡兔同笼三部曲》(《数学要素》中23、24、25三章),虚构了一个香格里拉世外桃源,讲解线性代数!

这也算是一个有趣的教学实验了!

写这三章耗费了好多脑力,真心希望日后有人能把这三章做成动画短片,手动狗头。

引用鸡兔同笼三部曲开篇和和结尾哈:

鸡兔同笼三部曲 >>>>>> 开篇 >>>>>>

云山青青,风泉泠泠,山色可爱,泉声可听。土地平旷,屋舍俨然,阡陌交通,鸡犬相闻。

崇山峻岭之中,茂林修竹深处,有个小村,村中有五十余户人家。小村村民甘其食,美其服,安其居,乐其俗。黄发垂髫,怡然自乐。

村民善养鸡兔,又善筹算。在这个与世隔绝的小村庄,鸡兔同笼这样的经典数学问题,代代流传,深入人心。村民中有个农夫,他特别痴迷数学。最近他手不释卷地阅读一本叫《线性代数》的舶来经典。

本书最后三章给大家说说村民在养鸡养兔遇到的数学问题,讲讲如何用线性代数帮助大伙儿解决这些问题。

鸡兔同笼三部曲 >>>>>> 结尾 >>>>>>

至此,小村村民心中一块大石头算是落地了。对于“鸡兔互变”这个奇事,大伙儿也都见怪不怪了!

前后脚的事儿,村民发现鸡兔互变也停了。笑容在大伙儿脸上绽开,农夫把全村老少都邀到自家菜园,要好好欢庆一番!

大伙儿都没闲着,摘果蔬,网肥鱼,蒸米饭,取美酒,摆桌椅,嘉宾纷沓,鼓瑟吹笙,烹羊宰牛且为乐,会须一饮三百杯 …

这阵仗吓坏了的一笼鸡兔,它们蜷缩一团,瑟瑟发抖。农夫见状,撸着一只毛绒兔耳朵说,“你们这次立了大功,留着过年吧!”

欢言酌春酒,摘我园中蔬。微雨从东来,好风与之俱。

变与不变

书到用时方恨少,腹有诗书气自华,农夫这次让大伙儿理解了这两句话的精髓。

经过这场线性代数风暴之后,小村村民白天田间耕作时都会怀揣一本数学典籍,一得片刻休息,大伙儿分秒必争、手不释卷。夜深人静时,焚膏继晷、挑灯夜读者甚多。

学数学,用数学,成了小村新风尚。

大伙儿不再惧怕未知,因为“我们必须知道,我们终将知道。”

渐渐地,这个曾经与世隔绝的小村处处都在变化,村民们也都肉眼可见地变化。你让我说,小村和村民哪里发生了变化?我也说不上。反正,时时刻刻都在变化,感觉一切都在变得更好。

而不变的是,小村还是那个小村,村民还是咱们这五十几户村民。

云山青青,风泉泠泠。山色依旧可爱,泉声更是可听。

(镜头拉远拉高) 一川松竹任横斜,有人家,被云遮。

东风升,云雾腾。

紫气东来,祥云西至。

鸡兔同笼引发的思想风暴,似乎给这个沉睡数百年的村庄带了什么,也似乎带走了什么。

好像什么都没有发生,又好像要发生什么。

往时曾发生的,来日终将发生。


# ======================

纯数学我也不懂,我就是在搞机器学习、数据分析的时候,多学了点实用性很强的数学工具,特别结合我的线代血泪史做例子牢骚一番!

我的线代血泪史

我的线性代数学习,真的是血泪史 ...

本科一年级,线性代数濒临挂科。作为小镇做题家的我,这简直就是奇耻大辱。然后大二,我再修了一次,期末分数就多了5分。面对,一个中括号括起来的一堆10以内的数,我不但迷惑,而且反感,甚至有了恐惧。

研究生一年级,学了矩阵论,考完试我就把书撕了。

这门课用的教材是,某著名大学数学教材编写组写的书,教学的老师也是这个编写组的成员 ... 考完试,整个寝室楼的同学骂娘 ...

让人更加绝望的是,做研究开始阅读各种数学文献写综述的时候,矩阵运算、矩阵分解铺天盖地而来,一纸纸天书让我窒息,甚至绝望。

当时编程用MATLAB,也是基于矩阵运算。很长一段时间,我几乎要放弃当时的博士学位(爱哭,所以哭过很多次),原因多数来自线性代数让我感到的自卑和自我怀疑。

也需要感谢MATLAB,让我意识到了线代各种运算和矩阵分解的重要作用。码代码,码着骂着,突然某一天就开窍了,准确来说,就是接受了,不再挣扎。

有些人选择躺平,这是你的权利。我选择,躺下来休息一会,想想接下来怎么走。想清楚后,继续上路。因为我有我想做的事,想去但没去过的地方。

出来混,总是要还的

之后,一直到现在,每年都会几次翻各种线代的书。

这不是凡尔赛,只是想告诉大家,学线代,我是认真的;线代给我的伤害,和惨痛教训,也是深刻的。

我不再在意书内容的编排,也不抱怨某些书的内容(放弃)。

我不是为了把线代研究的多深入,而是试图更好理解最基本的工具,并把它们用好,用明白。

比如,特征值分解。过去的五年内,结合工作,每次用到特征值分解,翻书翻到特征值分解,我都会有新的体会。

再比如,宇宙无敌——奇异值分解SVD。做不同项目时,每当到奇异值分解SVD,我就会去翻翻书,再去想想。

特别是,几何视角,数据视角,这两个视角,让我对SVD有了更深入的理解,更实用的理解。

比如主成分分析可以使用几种路线:

1)特征值分解,协方差矩阵

2)特征值分解,Gram矩阵

3)特征值分解,相关性系数矩阵

4)奇异值分解,原数据矩阵

5)奇异值分解,去均值数据矩阵

6)奇异值分解,z分数

这几种方法的区别和联系是什么?实用场景是什么?结果差异性体现在哪里?

这些问题,其实一幅图就解决了(鄙人画的,手动狗头)

需要新的教材编写思路

以前线代的教学、学习思路都是,代数 >>> 线性代数。我的一点经验是,“代数 >>> 线性代数”这个线代教学、学习思路早就过时,必须淘汰!

它已经不再适合现在的数据分析、机器学习应用场景。

数学科学、机器学习的各种算法,更需要“几何 + 数据”的视角来学线代,用线代。

有教无类

再批判一点的话,就是很多数学书,带有“淘汰”过滤器。就是“读不懂我的书,是你的问题”。我知道,我已经被数学淘汰了;但是,这不代表我不会用数学工具。

就好比,我没有语言天赋,不是做翻译的料,不能做比较文学研究,不能精通八国语言;但是,这不代表我不能用英语和别人交流。

数学就是语言,就是工具!没啥稀罕的

咱们一般人就是用这个语言,用这个工具而已。加减乘除就够用的话,恭喜你!很多人现在需要用再“难一点”的数学工具,那就再深入学一点,这就足够了。

特别是,什么机器学习、数据科学啦,很多算法需要我们掌握一定量的数学工具,那我们就多学一点,不是什么难事。

翻开一本本数学书,我的首先感受到的是,拒人千里之外的冰冷,甚至是自恃清高的傲慢。它们仿佛在说“知难而退吧,少年!拿开你的手,把我放回书架!”。

多数数学书对入门读者极不友好,自带门槛。很多书都“理所当然”地认为,作为读者的我们已经具备这样、那样的基础。少有几本好心的书,会告诉我们想要读懂本书,请先去看哪些入门级别的书。

这本书虽然没啥名气,但是我个人很喜欢!看到这本书之后,有种相见恨晚的感觉!我特地跑去Linkedin给作者写了感谢,人家竟然热情洋溢地回复了!贴一张图,大家感受一下!


和编程结合

另外,现在数学离不开编程,不管你用什么语言,Python、MATLAB、R、C、Java。现在的主流数学教材似乎都没有考虑这一点。

现在让我对某数学考研教材编写组喊话的话,我会告诉他们“除了随堂测验和期末考试,没有人手算SVD分解了!!醒醒吧!!”

一提到线性代数,就拉你出来鞭尸。心里没个数吗?!

下面这两本书很好!都有配代码!第一版配MATLAB,第二版配Python!缺点很明显,学习曲线极其陡峭,简直就是垂直上升!

竟然也有免费下载!良心好书都会免费给你读!

probml.github.io/pml-bo

理解,理解,还是理解

而且,手算SVD分解,完全理解不到SVD的精髓!必须从几何、数据、空间等视角,才能领略得到奇异值分解的伟力,甚至美丽!

有人在回答这个问题说,懂不懂,理不理解,不重要!只要会做题,就行!我表示不能理解,而且大为震惊!!!你不理解数学工具背后的思想,你怎么用?!难道学数学,就是为了分数?!

出来混总是要还的!

继续批判,数学板块割裂问题严重!

微积分、概率统计、几何、线性代数、数值方法、优化方法等等,永远都是一门门独立的课程,一本本独立的教材。

用圆锥曲线来说明这一点吧。

为圆锥曲线正名

之前看到很多帖子批判,高中圆锥曲线学了没用。真扯淡!我给你贴几张图,让你好好看看圆锥曲线的用途!也为圆锥曲线正名!

这几幅图中,看到圆锥曲线了吧?








可视化,可视化,可视化!

让数学教材编写者,多画一张图,简直就是要了他们的命!公式给你写几页,多画一张图,更好地解释定义、定理、结论,他们绝不肯!

人生来摸到的,看到的,都是几何体!我的陋见,几何和解析几何是打开数学大门的钥匙!几乎所有的数学工具,特别是线性代数中的数学工具,都可以用几何方法更直观地解释!

我真心希望,以后的教材编者能够用点心,用可视化工具把数学概念解释清楚!

下面这本书配图不多,但都很精致!上过Haykin老爷子的几门课,后悔学的不扎实。

还有,堆砌公式!

我见过最“作呕”的所谓机器学习数学之类的书,几乎就是把考研数学所有书的公式抄一遍 ... 大家买过,翻过,肯定知道我说的哪些些书。不想引战,这里我就不点名了。

我不介意你引用借鉴(抄袭),至少抄出美感,抄出创意吧?!把错误都抄来,过分了吧!?把人家的图(还是错图),原封不动复制粘贴过来,很便宜吧?!

数学还是思想史,历史,文化

学数学的同时,也要看到历史发展!贴几幅我的书里面自己做的图吧。




几本好书

MIT的Gilbert Strang教授新书Linear Algebra and Learning from Data,已经不错了,将线代和机器学习、数据科学联系的很紧密。但是,我的拙见是,这本书还是在传统的线代框架之内,不够突出“数据”!

Mathematics for Machine Learning这本书是近些年来少有的“好书”!而且全免费下载。我的拙见是,对初学者极不友好。此外,对统计学习,特别是多元统计相关内容,涉及较少。

mml-book.github.io/book

清华社翻的这本书绝对经典!这本书绝对强调理解!但是,初学者慎入!

可以下载

hastie.su.domains/ElemS


数学书中,用“图”解释数学工具的典范,当属加拿大McMaster大学James Stewart教授编写的Calculus: Early Transcendentals

老爷子已经驾鹤西征,留下了一本好书,一个漂亮的别墅Integral House。

有朋友私信问我,什么书可以帮助提升数据可视化,我给大家推荐这本小册子。它不是数学书,但是给了很多数据可视化的好建议!我闲来无事就翻翻它,很容易读!作者毕业于Yale MFA项目,从业经验丰富。

给自己一个再学数学的理由

被数学淘汰的感觉很难受;但是出于功利,为了升学,哪怕数学虐我千百遍,我待数学如初见。

我们,从小学、初高中,甚至大学,一直在学习数学。

但是,数学对于很多人来说,味同嚼蜡,枯燥无味,甚至让人恨之入骨。这不能怪数学,值得反思的是学习数学的方法、目的。

考试是牵着我们往前走的绳索,是头悬梁的绳,是锥刺骨的锥。

考完试,恨不得把数学书,撕碎,吃掉。

为数学而数学,听起来很高尚;但是相信对于绝大部分人来说,数学是工具,甚至是谋生的手段,而不是目的。大家学数学,是想用数学工具解决具体问题;不是想在某个数学领域有所突破建树。

而我厚着脸皮写这套内容的初衷就是,不希望大家学完线性代数、微积分、概率统计、数值方法10年之后,几乎已经忘得一干二净,才猛然意识到它们的重要作用,而悔恨当初没有学好,出来混总是要还的。

希望这套图册能够给大家再次学习数学的动力,甚至是兴趣!这次不再是考试,不再是分数,不再是升学;而是,以数据科学、机器学习为牵引,自我提升,面向未来。

我的个人经验是,当我们没有钱用来投资的时候,最值得投资的是自己的时间;而拿出一部分时间投资在数学上,绝对会意想不到的收益。

知者不言,言者不知。知者不博,博者不知。我就权当,无知者无畏了。

下面是第一本PDF和代码。后面几本持续创作中,作者水平真的有限(不是自谦),内容浅显,望大家多提意见。

github.com/Visualize-ML

github.com/Visualize-ML

上几幅书里图吧,不是矢量图,凑合着看吧。












































END