搞AI,我建议你了解一下大模型的本质

数据智能相依偎 2024-02-24 08:00:07
01

这一波的人工智能大模型热潮的火源可追溯到深度学习的复兴。

那么,深度学习究竟是啥呢?为啥它能让计算机瞬间变得聪明起来呢?

说到底,深度学习和其他机器学习的套路一样,就是用数学模型解决现实问题的一种方法。

Emmm,我明白一提到“数学”,你可能会想要溜了溜了,更别说那个非理工科的“建模”了。

有没有可能用通俗易懂的话,给非理工科的我们解释一下为什么深度学习这算法在人工智能领域这么牛气呢?

02

深度学习是机器学习的一种,因为有“学习”这个名字,所以和我们人学东西有点类似。

来个生动的例子,想象一下小朋友用识字卡片认字的情景,其实,教计算机认字也是差不多的事。

计算机得像个钻研学子,把每个字反复看个没完没了。

然后,在计算机的“智慧大脑”(处理器加上存储器)里,得总结出个规律。

这样,以后计算机再碰到类似的图案,只要符合之前总结的规律,计算机就能秒懂这是啥字。

以专业术语解释,计算机学习的过程包括使用名为“训练数据集”的图片进行训练;

这些数据集中不同类别之间的差异性被称为“特征”;计算机在其“大脑”中总结规律的过程称为“建模”;

而大脑中总结的规律即为我们说的“模型”;通过反复观察图像、总结规律并学习认知的整个过程则被称为“机器学习”。

想知道计算机是怎么学东西的吗?它学到的规律是啥样的呢?其实,这得看我们用什么机器学习算法。

让我们从小朋友学认字开始说起,一开始告诉他们,“一”一笔写,“二”两笔写,“三”三笔写。

这个规律简单易懂。

但是,学了新字,这规律可能就不灵了。比如,“口”也是三笔,可它不是“三”。

于是,我们又告诉小朋友,“口”是围成个方框儿的,“三”是排成横排的。

这规律又加深了一层,可随着字的增多,规律还是显得不够。

举个例子,“田”也是个方框儿,但它不是“口”。

于是,我们再告诉小朋友,方框里有个“十”的是“田”。

后来,“田”上面出头是“由”,下面出头是“甲”,上下都出头是“申”……规律越来越多。

03

决策树算法就和小朋友根据特征规律学字的过程非常像。

当计算机只需要认识“一”“二”“三”这几个字时,它只需数一数笔画就能搞定。

当我们加入“口”和“田”这两个字时,计算机之前的规律就不够用了,得引入其他判定条件。

这样一步步学习,计算机才能认识越来越多的字了。

决策树很简洁,但但但但,嘿,太简单了,有点应付不了大场面。

所以科学家和工程师们就发明了不少花样繁多、玩法高级的机器学习方法。

比如,把字的特点弄到一个虚拟的空间里,就像是在星空里找规律一样。

就像把空间划分成一块块独立区域一样,用简单的方法比如画个直线,让每个字都待在自己的地盘。

但问题是,咱们的汉字可不是几十个,得数千个,画直线的事情就显得力不从心了。

所以,科学家就开始玩花样了,用复杂的曲线啊,还有把二维空间变成三维、四维,甚至几百维、几千维、几万维的高维空间。

嘿,这样搞也不够,想不想让计算机自己动脑筋找规律?

得设计个灵活点的表达方式,让计算机在学习过程中自己摸索,总结规律,最终找到适合描述真实世界的表示方法。

04

现在,咱们终于谈到了深度学习这个大名鼎鼎的家伙!

用数学的眼光看,深度学习和之前那些传统机器学习的家伙其实没啥本质上的区别,都是希望在高高高维空间中,通过捕捉对象的特征,把不同类别的东西给弄清楚。

但是,深度学习的表达能力和其他方法不可同日而语,某些任务上跟传统机器学习简直要差了十万八千里。

深度学习处理的数据犹如信息的"水流",咱们把这整个深度学习网络想象成一个超级大水管系统。

这个水管系统有好几层,每一层都像是一个水流调控专业户,手里握着一群调节水流的阀门。

入口和出口就是水管的开口,而每个阀门都和下一层的阀门通过水管串通了起来,搞得就像是一条从头到尾、逐层串通的水流系统。

那么,计算机是如何在水管网络里学会认字的?

当计算机瞄见一张写有“田”字的图片,它会把图片中的每个颜色点翻译成一串由“0”和“1”组成的数字,然后灌进这个大水管网络。

每个出口都对应一个汉字,计算机会查看哪个出口的水流最大。

如果不对,我们就得指挥计算机:动动那些调节阀,让“田”字那出口的水流最多。

这下,计算机可得开始调阀门了,要操心不少!

好在计算机计算得飞快,用上算法优化,就像是在玩一场数学游戏,几乎总能把阀门都调好,让水流符合要求。

(其实,数学公式就留给专业人士了,我们这里只要想象计算机拼命计算、调控专业户拼命工作的情景就好)

接下来,咱们学新字“申”了。同样的套路,把每张写有“申”字的图片变成一串数字组成的水流,往水管网络里一灌,看看哪个出口的水流最旺盛。

不行的话,得再动动调节阀,这次可得精心调整,保证既不影响刚学的“田”字,又能把新的“申”字处理好。

这样一遍又一遍,直到所有汉字都能顺利地在水管网络里畅通无阻地流过。

这时,我们就得意洋洋地说,这水管网络已经是个训练有素的深度学习模型了。

当大量识字卡片都被这水管网络处理过,所有阀门都调得刚刚好,整套水管网络就可以出场了,准备好识别汉字。

这时候,咱们就可以把所有调好的阀门“焊死”,静静等着新的水流涌来。

与训练时的折腾差不多,未知的图片被计算机转化成了数据水流,灌入训练好的水管网络。

此刻,计算机只需瞄一眼,看哪个出口的水流最猛,就能断定这张图片写的是哪个字。

简单吗?神奇吗?

深度学习难道真的就是通过狂调阀门“凑”出最佳模型的学习方式?

水管网络内部,为啥每个阀门都得这么调,为什么调到这个程度,完全由最后每个出口的水流量决定吗?

这其中,是不是真的没有什么深奥的原理呢?

05

深度学习就好比是把人类的数学智慧和计算机的运算能力结合起来,然后大手一挥,加入海量的训练数据,调校内部参数,使之朝着问题目标不断逼近。

这种半理论、半经验的建模方式,简直像是烹调一道美味佳肴。

深度学习的指导思想可谓实用主义,就是干活不求甚解。

前面说得不求甚解的学习方法是不是有点像,啊我上一趴就在教你深度学习了 hhh

想想看,有史以来最火的机器学习方法,居然是一个被认为是“黑盒子”的家伙,你说这是不是有趣极了?

深度学习,就是一个巨大的水管网络,疯狂学习通过阀门控制水流的出口。

就这么简单,就这么神奇

就这么简单,就这么神奇

参考文献:Brabara 《Learning How to Learn》安竹林 《面向计算机视觉的深度学习技术》(2023)吴军 《数学之美》 人民邮电出版社; 第 3 版(2020)李开复,王咏刚 《人工智能》 文化发展出版社; 第1版 (2017)

0 阅读:0

数据智能相依偎

简介:感谢大家的关注