机器学习

  • 机器学习可以用来分类
    首先我们先理解两个概念:特征、目标变量、训练样本集、训练样本、。
    在这里插入图片描述

    先提出个问题:上图中的东西是什么?给你四个选项:狗、猫、橘子、桌子。它是一条狗吧?你怎么判断出来这个东西是狗?你为什么不说这个东西是猫、是橘子,是桌子等等?来深入这个问题,仔细思考:首先,狗有四条腿。这样呢,猫也有四条腿,桌子可能也有四条腿。但橘子一定没有腿,那我先可以确定这不是个橘子。再接着,我知道上面这个东西会自己动,能跑能跳。那我现在也能确定这不是个桌子。它可能是只猫或者是条狗,最后呢,我知道它的叫声是“汪汪汪”而不是“喵喵喵”。好啦,根据这些判断我能确定它是一条狗。
    在上述描述中,腿的个数是四条、能动、叫声是“汪汪”,这些称之为特征,是谁的特征呢?是狗的特征,我们把狗称为目标变量,当然,猫、橘子、桌子也是目标变量。下面给个表格就更加清楚。当然,为了更加严谨一些,我们就不用狗、猫、橘子、桌子来举例子。
    表1-1表1-1表1-1是包含六个训练样本的训练集,每一行是一个训练样本,每个训练样本有4种特征、一个目标变量。根据特征我们能预测出来目标变量。比如现在有只鸟,重1KG,翼展125厘米,没有脚蹼,棕色。那么我们几乎可以确定它是红尾鵟。这是我们人为的自己判断,机器学习就是你把上面这个样本集给电脑,让电脑通过一定的规则(算法)进行学习,学习完毕后,给电脑一些特征,电脑能自己预测其目标变量是什么。

    好了,第一篇就到此为止。本文章及后续文章,其目的是为了让自己加深理解。如果文章中有不对的地方,欢迎指正。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐