2023年,“人工智能新时代”再来看这个问题,感觉在朴素中又透露着一点缺失感。说缺失感意思是彼时人们对人工智能的想象一定没有今天这样丰富和具体,大模型时代让人们对人工智能和其背后的技术原理有了更深刻的认知。因此,我觉得这个问题在当下依然有很大的讨论价值,甚至有重新认识它的必要。

人工智能+机器学习+深度学习、学习资料需要的同学关注“AI技术星球”公众号,关注后回复“221C”获取。

这篇回答主要三个部分。首先介绍人工智能、机器学习和深度学习之间的区别和联系;然后结合当下人工智能最新的发展水平,梳理一些重要的概念;最后提供一个学习路线和学习思路。感兴趣的可以分别跳转到对应部分。

人工智能发展的重要节点。图片来源:OurWorldData

人工智能vs机器学习vs深度学习

首先回答一下题目问题——人工智能、机器学习和深度学习这三个概念到底有什么区别?

人工智能

其实这个问题不难理解,我们可以通过一个类比来解释。假设把人工智能比作一个婴儿的大脑,那么机器学习和深度学习就是让这个婴儿的大脑有能力去观看世界、聆听世界,感受世界以及与世界互动。

直观的说,深度学习只是服务于人工智能的一个工具(也许在若干年以后,随着科技的发展,会出现一种全新的工具可以代替现在的深度学习去以另外一种技术路线实现人工智能),把这个工具用在语音识别领域,就能让机器更会听;把他用在自然语言处理领域,就能让机器更会理解;而把他用到计算机视觉领域,就能让机器更会看。

深度学习

深度学习(Deep Learning)的本质就是各种神经网络,从最早最简单的感知机,到多层神经网络,再到后来引起第一轮AI变革的CNNs、RNNs、Transformers等网络结构,再到如今的AI大模型,其目的都是构建一个合适的神经网络结构,让机器有能力“自己思考”——也称之为“智能”。大模型毫无疑问是当下最火的概念之一,它把人工智能带入了一个全新的时代,基于各类大模型的AIGC产品(如ChatGPT、Midjourney等)的诞生让人们对AI有了重新的想象。甚至很多人把今年2023年看作通用人工智能(AGI)元年,并认为大模型是帮助人类实现AGI的“终极方案”。

机器学习

关于机器学习(Machine Learning),它是比深度学习更为广泛的研究领域,发展的也比较早。在人工智能届有一种说法:认为机器学习是人工智能领域中最能够体现智能的一个分支。从发展历史来看,机器学习也的确是AI领域发展最快的分支之一。

在ML的早期发展阶段,由于计算机运算性能、样本规模等因素的限制,很多ML算法只存在于实验室和paper中,而没法在实际中应用。但是到后来,GPU 、AI芯片和超级计算机的发展很快,使得系统的计算能力和存储能力都有了很大的飞升,数据发掘引领了大数据时代的到来,让原来复杂度很高的算法得以实现,得到的结果也更为精细。

理论上,只要计算机计算能力足够强、样本数据量足够大,就可以不断增加神经网络的层数以及改变神经网络的结构,这就是“深度学习”,深度学习代表了机器学习的最新方向,同时也推动着机器学习的发展。

下面这张图很好的概括了人工智能、机器学习与深度学习三者之间的关系。

图片来源:《Deep Learning》(书籍)

人工智能新时代——AGI与大模型

今年随着ChatGPT、MidJourney和Stable Diffusion等AIGC产品的爆火,人工智能在世界范围内受到前所未有的关注。随之而来的是AI大模型、通用人工智能(AGI)、大语言模型(LLM)等一系列概念走进人们的视野,至今已经演变成“百模大战”。

尤其是GPT犹如惊雷一般的出现刷新了人们对人工智能的认知——创作、翻译、私人教师、变成、润色等等,人们瞬间意识到真的有这样一个“无所不能”先生能实实在在帮助自己提高学习和工作效率。

给大家整理了配套的学习资料

GPT 之所以如此全能,是因为其背后有大模型作为引擎。大模型的独特性(如“涌现”)使得它超越了以往的深度学习方法赋予了人工智能更多的“智慧”和能力。同时也让人们开始对人工智能有了更多的想象和思考。

总体来说,人工智能可以分为三种形态:

  • Artificial Narrow Intelligence (ANI),弱人工智能;
  • Artificial General Intelligence (AGI),通用人工智能;
  • Artificial Super Intelligence (ASI),超级人工智能。

后两者也被统称为“强人工智能”。

各领域人工智能表现水平与人类的对比。图片来源:OurWorldData

严格地讲,我们现在看到的都属于“弱人工智能”——具有特定能力或能完成特定任务的人工智能。例如,赢得国际象棋比赛(RL)或从一系列照片中识别某个物体(CV);包括现在的五花八门的聊天机器人和文生图模型,以及其他各类AIGC产品都应该被划分在ANI范围之内。

而包括AGI和ASI在内的“强人工智能”则更强调具备类似人类的行为能力,例如通过语音文本理解语气和情感的能力。强人工智能的定义是基于其与人类相比的能力。通用人工智能(AGI)的表现将与人类相当,而超级人工智能(ASI),也称为超级智能,将超越人类的智力和能力。

这两种形式的强人工智能尚不存在,但该领域的研究正在进行中。尤其是今年以GPT-4和PaLM-E为代表的多模态大模型的出现,让人们看到了通用人工智能的影子。

两个月前有AI领域的专家曾经提到通用人工智能需具备的4个要素,分别是:

  • 涌现(emergence)
  • 代理(agency)
  • 功能可见性(affordence)
  • 具象(embodiment)

为什么说现在通用人工智能的影子已经初现了呢?

1、首先对于第一点,大模型的“涌现”现象和能力已经被证实。

2、第二点“代理”,意思是AI能够根据用户下达的总任务指令来自动规划并完成一系列子任务以达到最终目标,引入插件功能的ChatGPT,以及前段时间很热门的AutoGPT都属于初步迈进了这个门槛——AI Agent。

3、对于第三点“功能可见性”,它原本是一个认知和行为学领域的概念,描述的是现实世界中某个场景或物体对于人的行为的暗示,告诉人看到某物时应该能联想到它的功能。放到AGI中,其实它的意思就是AGI产品的可用功能应该与用户的需求和操作相匹配。功能可见性更像是在设计AGI系统时应该考虑的产品形态,从而保证人类与人工智能之间更好的进行互动。

4、而第四点“具象”,也称为“具身化”(embodied),则是数字化的人工智能系统与现实世界交流的物理化体现。这个概念听起来有点晦涩,但其实就是指单个AI系统能够接收并理解现实世界中多种模态的信息,比如语音、图像、触觉等等,从而完成复杂的任务。OpenAI的GPT-4模型和谷歌的PaLM-E模型已经初步具备处理多模态信息的能力。

此前谷歌曾在PaLM-E项目中演示过基于该模型的机器人完成“具身推理任务”(embodied reasoning task),比如,对机器人下达“去抽屉里拿一包零食”指令,它能够根据自身搭载的各类传感器感知世界,接收并理解多种模态的信息,然后规划子任务从而完成最终任务。

大模型正在给人工智能带来更多可能,而人工智能同样会给人类带来无限可能。之前有不少人讨论称人工智能将会为人类带来第四次工业革命,虽然我对此种观点持谨慎乐观态度,但是不可否认的是,此前人们不敢想象的一些AI工具和应用,正在出现在我们的生活中,就连看起来离我们很远的AGI也如幽灵一般若隐若现,或许它就隐藏在这些大模型的背后,不时地向我们闪现,预告人类它终将到来。

不管是从业人员,还是普通用户,我都建议大家利用好AI大模型这把火来提升自己的技能和认知。

以我自己为例,我的研究方向是计算机视觉,大(语言)模型原本并不是我关注的重点,但是从今年上半年开始,我补充了很多LLM及相关产品方面的知识。

一方面,作为AI领域的科研人员,当我去了解这些的时候,我发现我学习到的是包括技术路线、数据资源、算力、产品落地等在内的多方面的知识,这对于我提高自身能力和洞悉行业本质都有很大帮助。

另一方面,作为使用AI工具的用户,去了解大模型背后的技术和原理对我更好的使用这些工具也很有帮助,比如,在学习了一些LangChain、提示工程(Prompt Engineering)方面的知识之后,我发现在使用诸如ChatGPT这样的工具时,我可以更高效地让它生成我想要的内容,从而更大限度的发挥AI的能力,同时提高我的学习/工作效率。


如何制定人工智能学习路线

对于那些不仅仅满足于AI大模型,而是希望深耕人工智能领域;以及那些还没怎么接触过人工智能、但有志于以后从事这个行业的知友,我建议应该从两个方面制定学习计划,一是学习专业知识,打实基础;二是及时跟进前沿技术和行业发展动态。

专业基础

专业知识这方面,没有太多的捷径可以走,主要还是要以书籍为主。

上面这两张图是我个人的一部分书单,年头比较多了,有一些是早期仅有电子版的时候下载的。这里重点推荐几本(默认有线性代数、概率论与统计等基础数学知识):

1、《统计学习方法》李航。一直以来都有人(点名马斯克)讽刺人工智能/机器学习就是统计学。

虽有调侃成分,但这一说法也在有它的道理,对统计学的理解很大程度上决定了你在深度学习和人工智能理论方法上的造诣,所以先好好看这本书。

2、《Pattern Recognition and Machine Learning》。如果你基础弱,这本书读起来会有点吃力,而且似乎没有中文版,属于比较难啃的,但好在它理论讲解全面、细致,对于夯实机器学习基础很有帮助。

3、《 Deep Learning: Adaptive Computation and Machine Learning series》,中文名:《深度学习》,这本书不用多说,被称为人工智能圣经,知识新颖、覆盖全面。

4、《Dive into deep learning》,中文名:《动手学深度学习》,适合边学习边实战(实战很重要),有基于不同DL框架的版本。我手里的是一本基于Pytorch的中文版,今年2月份刚出版。

跟踪前沿动态

人工智能是一个技术更新和迭代非常快的领域,及时跟进前沿技术和产品的最新发展动态至关重要。

1、这里以GPT模型为例,第一手资料当然是去阅读原文献,比如GPT-1到GPT-4的论文,以及介绍InstructGPT,RLHF等关键技术细节的论文。

2、考虑到并不是每个人一开始都有扎实的基础以支撑自己读懂原文,这时候可以选择一些专门做技术解读和论文拆解的博客文章或视频进行学习,这类资料通常以一种更通俗的方式讲解技术细节,有利于新手快速掌握关键信息。比如,下面这张图就是别人梳理的GPT模型的发展脉络,一目了然。

https://yaofu.notion.site/GPT-3-5-360081d91ec245f29029d37b54573756

3、如何快速找到某个领域的各类学习资源。

你可以通过类似上文的公开课免费获取到别人已经帮助你整理好的现成资源,但是这种往往是可遇而不可求的。大多数时候还得靠自己去搜索有用的资料。

所以,这里再告诉大家一个很好用的技巧——在谷歌搜索引擎搜索关键词“awesome xxx github”或者直接在GitHub上搜索“awesome xxx”,然后你会发现能搜出来很多项目,里面有各类资源汇总,比如论文列表、开源工具、产品动态跟踪、相关的技术解读的博文列表等等,内容非常全面。这些项目通常有人维护,保证内容及时更新。这是我个人经常使用的查阅资料的方法。

比如在GitHub上搜awesome chatgpt

最后,希望这篇回答对想要了解和学习人工智能的知友有帮助。


以上。打字不易,恳请点赞支持。

学习资料大家自行获取就行!

更多推荐