1、人工智能技术要解决的核心问题是什么?

答:解决那些多人来说很容易执行、但很难形式化描述的任务(关键是如何把这些非形式化的知识传递给计算机,可理解为非形式化特征提取)。相反,抽象和形式化的任务对人类而言是最困难的脑力任务之一,但对计算机而言是属于最容易的。

2、机器学习?模式识别?表示学习?

答:机器学习算法的性能很大程度上依赖于给定数据的表示,它具有能够从这些原始数据中提取模式的能力(而模式识别是直接给出描述特征,缺少了从原数据中发现规律的环节)。表示识别是在机器学习的基础上更进一步,不需要人工对对象特征构建表示,直接使用机器学习算法发觉表示本身,分离出能解释观察数据的变差因素。

3、深度学习中的“深度”到底表示的是什么?

答:主要有两种观点。其一,基于评估架构所需执行的顺序指令的数目,像是逻辑回归函数,如果将整个函数视为一个元素,那么模型的深度为1;如果表示为流程图,包括乘法、加法和sigmoid函数,那么这个模型深度为3;其二,将描述概念彼此如何关联的图的深度视为模型深度,比如我们经常在吴恩达的课程中看到CNN网络的一张人脸识别的例图中,由最底层的像素,抽象为纹理,抽象为几何图形、部分器官、整张脸,表示起来似乎是5层,但其实每一次抽象可能不只有1层网络结构,这里的深度计算方式是指所有层的和,个人觉得第二种说法与感官更符合。
PS:花书里有一句话想重点提一下,原书作者的观点:我们坚信机器学习可以构建出复杂实际环境下运行的AI系统,并且是唯一切实可行的方法。

4、简述深度学习的历史

答:“控制论”:20世纪40年代到60年代,因为神经科学的引入而兴起,代表性算法模型包括McCulloch-Pitts 神经元、感知机、自适应线性单元(随机梯度下降法最早的应用),这些模型都是线性模型,因解决不了XOR问题而失败;
“联结主义”(并行式分布处理):20世纪80年代到90年代,因为认知科学(符号推力模型)的引入而兴起,代表算法包括LSTM、反向传播算法,因当时的硬件设备计算能力有限,无法进行快速的实验,被核方法和图模型等方法取代;
“深度学习”:始于2006年,Hinton在深度信念网络中提出可以使用“贪婪逐层预训练“的方法训练神经网络,促使新一轮浪潮的到来。

5、数据量和深度学习模型训练效果有没有定量的关系?

答:截至2016年,一个粗略的经验法则是,监督学习在每类给定约5000个标注样本情况下一般将达到可以接受的性能。当至少有1000万个标注样本的数据集用于训练时,将超过人类表现。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐