《深度学习》花书精华理解：引言部分中的几个重要概念

1、人工智能技术要解决的核心问题是什么？答：解决那些多人来说很容易执行、但很难形式化描述的任务（关键是如何把这些非形式化的知识传递给计算机，可理解为非形式化特征提取）。相反，抽象和形式化的任务对人类而言是最困难的脑力任务之一，但对计算机而言是属于最容易的。2、机器学习？模式识别？表示学习？答：机器学习算法的性能很大程度上依赖于给定数据的表示，它具有能够从这些原始数据中提取模式的能力（而模式识别是直

sapienst

226人浏览 · 2021-03-02 22:03:30

sapienst · 2021-03-02 22:03:30 发布

1、人工智能技术要解决的核心问题是什么？

答：解决那些多人来说很容易执行、但很难形式化描述的任务（关键是如何把这些非形式化的知识传递给计算机，可理解为非形式化特征提取）。相反，抽象和形式化的任务对人类而言是最困难的脑力任务之一，但对计算机而言是属于最容易的。

2、机器学习？模式识别？表示学习？

答：机器学习算法的性能很大程度上依赖于给定数据的表示，它具有能够从这些原始数据中提取模式的能力（而模式识别是直接给出描述特征，缺少了从原数据中发现规律的环节）。表示识别是在机器学习的基础上更进一步，不需要人工对对象特征构建表示，直接使用机器学习算法发觉表示本身，分离出能解释观察数据的变差因素。

3、深度学习中的“深度”到底表示的是什么？

答：主要有两种观点。其一，基于评估架构所需执行的顺序指令的数目，像是逻辑回归函数，如果将整个函数视为一个元素，那么模型的深度为1；如果表示为流程图，包括乘法、加法和sigmoid函数，那么这个模型深度为3；其二，将描述概念彼此如何关联的图的深度视为模型深度，比如我们经常在吴恩达的课程中看到CNN网络的一张人脸识别的例图中，由最底层的像素，抽象为纹理，抽象为几何图形、部分器官、整张脸，表示起来似乎是5层，但其实每一次抽象可能不只有1层网络结构，这里的深度计算方式是指所有层的和，个人觉得第二种说法与感官更符合。
PS：花书里有一句话想重点提一下，原书作者的观点：我们坚信机器学习可以构建出复杂实际环境下运行的AI系统，并且是唯一切实可行的方法。

4、简述深度学习的历史

答：“控制论”：20世纪40年代到60年代，因为神经科学的引入而兴起，代表性算法模型包括McCulloch-Pitts 神经元、感知机、自适应线性单元（随机梯度下降法最早的应用），这些模型都是线性模型，因解决不了XOR问题而失败；
“联结主义”（并行式分布处理）：20世纪80年代到90年代，因为认知科学（符号推力模型）的引入而兴起，代表算法包括LSTM、反向传播算法，因当时的硬件设备计算能力有限，无法进行快速的实验，被核方法和图模型等方法取代；
“深度学习”：始于2006年，Hinton在深度信念网络中提出可以使用“贪婪逐层预训练“的方法训练神经网络，促使新一轮浪潮的到来。