AI往期系列科普

AI科普(一):什么是人工智能
AI科普(三):什么是算法?
AI科普(四):通俗易懂的机器学习模型


一、结论先行

人工智能要处理的任务多种多样,比如人脸识别、垃圾邮件检测、电源票房预测、降雨量预测等等。但是这些任务背后的根本任务只有两类,就是分类与回归。

分类任务:模型输出是对象的所属类别,数据类型是离散数据。例如预测一封邮件是否是垃圾邮件、预测照片中的人是男性还是女性还是偏中性?这种结果只有两个值或者多个值的问题,我们可以把每个值都当做一类,预测对象到底属于哪一类。对于结果只有两个值的问题,我们一般称为二分类问题,结果有多个值的问题称为多分类问题。

回归任务:模型输出的结果是一个值,数据类型是连续型数据。例如要通过一个人的饮食预测一个人的体重,体重的值可以有无限多个,有的人60kg,有的人61kg,而且在60和61之间也有无限多个数。这种预测结果是某一个确定数,而具体是哪个数有无限多种可能,预测的这个变量(体重)因为有无限多种可能,在数轴上是连续的,所以我们称这种变量为连续变量。

二、分类任务

常见的二分类问题有AI科普(一):什么是人工智能中介绍的垃圾邮件检测与猫狗图像识别,本文就不再赘述,主要介绍两个常见的多分类问题。

棋盘问题
在这里插入图片描述
自动驾驶

自动驾驶车辆上装有多个摄像头和传感器来时刻监视车辆四周的环境信息,可根据这些环境的图像信息让它选择在每种情况下方向盘转动多少角度、油门或刹车踩多深来实现车辆的自动行驶。
在这里插入图片描述
我们可给方向盘设置900个选择方案(普通车的方向盘一般是900度,也就是两圈半),给油门刹车分别设置10个档位。那么整个自动行驶的过程,其实就是在每个时刻根据环境信息来对这三个关键部件进行操作选择,所以我们可以将它看作为分类任务。

三、回归任务

网约车出行流量预测
在这里插入图片描述
可根据上下车地点、时间、天气情况、人流密度以及历史记录等因素,预测此刻某区域的网约车订单数,并以此为依据进行车辆调度,保证供需平衡。因为我们最后的目的是预测需求用车的人数,它是一个连续型数值,所以看可做是一个回归问题。

股价预测

同理,股价预测也可看做为一个回归问题,我们可根据历史走势、利弊政策、公司财报等因素对股价进行预测。大家思考后就能发现,其实分类问题在某种程度上可以看做为一个回归问题。比如我们可以定义若一支股票涨幅会大于5%,我们就把它归为买入类;在-5%至5%之间,我们就将它归为持有类;跌幅大于5%的话我们就将它归为卖出类。

总结
其实在日常生活中,我们人类大脑每日处理的也是分类与回归问题,比如我们会思考晚上吃烧烤还是火锅,会选择出门穿哪件衣服,这些都可看做是分类问题;在称重上秤前我们会先估计自己多重,约会时会预计对方几点到达,这些都可看做是回归问题。

在介绍完AI预测的整体思路与根本任务类型后,大家一定对计算机到底是如何思考并解决问题的十分好奇,之后我会用简明的例子与高中就学过的数学知识来揭开算法的神秘面纱。


本人为NLP算法工程师,更多AI科普系列请关注微信公众号:有温度的算法
在这里插入图片描述

更多推荐