监督学习、无监督学习、自监督学习和强化学习

监督学习监督学习是目前最常见的机器学习类型。给定一组样本（通常由人工标注），他可以学会将输入数据映射到已知目标。一般来说，近年来过度关注的深度学习应用几乎都属于监督学习，比如光学字符识别、语音识别、图像分类和语言翻译。监督学习主要包括分类和回归，但还有更多的奇特变体，主要包括如下几种：1、序列生成（sequence generation）。给定一张图像，预测描述图像的文字。序列生成有时可...

疯狂的石头_Grace

18101人浏览 · 2019-04-10 11:06:45

疯狂的石头_Grace · 2019-04-10 11:06:45 发布

监督学习
监督学习是目前最常见的机器学习类型。给定一组样本（通常由人工标注），他可以学会将输入数据映射到已知目标。一般来说，近年来过度关注的深度学习应用几乎都属于监督学习，比如光学字符识别、语音识别、图像分类和语言翻译。
监督学习主要包括分类和回归，但还有更多的奇特变体，主要包括如下几种：
1、序列生成（sequence generation）。给定一张图像，预测描述图像的文字。序列生成有时可以被重新表示为一系列分类问题，比如反复预测序列中的单词或标记。
2、语法树预测（syntax tree prediction）。给定一个句子，预测其分解生成的语法树。
3、目标检测（object detection）。给定一张图，在图中特定目标的周围画一个边界框。这个问题也可以表示为分类问题（给定多个候选边界框，对每个框内的目标进行分类）或分类与回归联合问题（用向量回归来预测边界框的坐标）。
4、图像分割（image segmentation）。给定一张图像，在特定物体上画一个像素级的掩模（mask）。
无监督学习
无监督学习是指在没有目标的情况下寻找输入数据的有趣变化，其目的在于数据可视化、数据压缩、数据去噪或更好地理解数据中的相关性。无监督学习是数据分析的必备技能，在解决监督学习之前，它通常是一个必要步骤。降维（dimensionality reduction）和聚类（clustering）都是众所周知的无监督学习方法。
自监督学习
自监督学习是监督学习的一个特例，它与众不同，值得单独分为一类。自监督学习是没有人工标注标签的监督学习，可以将它看作没有人类参与的监督学习。标签仍然存在（因为总要有什么东西来监督学习过程），但它们是从输入数据中生成的，通常使用启发式算法生成的。
强化学习
强化学习一直以来被人们所忽视，但随着google的DeepMind公司将其成功应用于学习玩Atari游戏（以及后来学习下围棋并达到最高水平），机器学习的这一分支开始受到大量关注。在强化学习中，智能体（agent）接收有关环境的信息，并学会选择使某种奖励最大化的行动。例如，神经网络会“观察”视频游戏的屏幕，并输出游戏操作，目的是尽可能得高分，这种神经网络可以通过强化学习来训练。
目前，强化学习主要集中在研究领域，除游戏外还没有取得实践上的重大成功。但是，我们期待强化学习未来能够实现越来越多的实际应该：自动驾驶汽车、机器人、资源管理、教育等。