目标导向

机器学习

1.先看是分类问题还是回归问题(分类就先从常用的分类模型里选择)

2.其次,看数据特征的数据类型,然后做一些初步的数据统计,比如是否数据均衡,大致的数据分布是怎样的(不同类别的分布)

3.然后判断用哪个比较合适一些,是树模型还是其他的分类模型。

4.最后查看kaggle比赛有没有相似案例,别人做的方法有没有值得自己学习的地方

深度学习

对于深度学习算法选择也是看任务目标选择合适的模型,图像类首选cnn及各种cnn的变种,时间顺序相关的选rnn ,生成类的选vae或gan,有明确规则的选rl。

分类(Classification)和预测(Prediction)的理解,主要步骤有哪些,以及两者的区别和联系

一、介绍

分类:输入样本数据,输出对应的类别,将样本中每个数据对应一个已知属性。

预测:两种或者两种以上的变量之间相互依赖的函数模型,预测给定自变量对应的因变量的值。

二、步骤

分类算法分为两步:

(1)学习步:通过训练样本数据集,建立分类规则
(2)分类步:用已知的测试样本集评估分类规则的准确率,若准确率可接受,则是使用该规则对除样本以外的数据(待测样本集)进行预测。

预测算法分两步:

(1)我们先要基于一定数量的样本来训练出一个训练模型;
(2)为了判断这个模型训练的如何,我们还要对其进行检测一下;
(3)如果测试的样本数据与我们想象中的差别太大,那么我们就要重新进行训练这个预测模型,但是如果我们的预测模型符合我们的预先的期望,那么我们就可以用这个模型进行预测的操作.

三、区别

特征

1.分类
2.回归预测

输出类型

1.离散数据
2.连续数据

目的

1.寻找决策边界
2.找到最优拟合线

评价方法

1.精度、混淆矩阵
2.SEE(sum of square errors)或拟合优度

四、联系

分类算法可以预测连续值,但是连续值是以类标签的概率的形式。

预测算法可以预测离散值,但离散值以整数形式表示。

原文链接:https://blog.csdn.net/Datawhale/article/details/88316122
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐