logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

8.15 机器学习(2)K最近邻算法

1、定义:K 近邻(K-Nearest Neighbor, KNN)用最近的 K 个已知样本代表/决定未知样本的类别。预测X和Y的值,选择最优K值交叉验证,标明范围。适用小规模、低维、类别边界不规则的数据。④ 统计这 K 个邻居中类别出现频率,K 值选择、距离度量方式决定模型效果。练习:导入葡萄酒数据集(为分类问题)① 计算未知点到所有已知点的距离,③ 选前 K 个(K ≤ 20),⑤ 将频率最高

#机器学习#近邻算法#人工智能
8.15 机器学习(2)K最近邻算法

1、定义:K 近邻(K-Nearest Neighbor, KNN)用最近的 K 个已知样本代表/决定未知样本的类别。预测X和Y的值,选择最优K值交叉验证,标明范围。适用小规模、低维、类别边界不规则的数据。④ 统计这 K 个邻居中类别出现频率,K 值选择、距离度量方式决定模型效果。练习:导入葡萄酒数据集(为分类问题)① 计算未知点到所有已知点的距离,③ 选前 K 个(K ≤ 20),⑤ 将频率最高

#机器学习#近邻算法#人工智能
8.12 数据分析(1)

o_cat=i.strip().split('\t')[2:len(catg)]---第二个和以后为2。sub_cat=i.strip().split('\t')[1]----第一个分类为1。main_cat=i.strip().split('\t')[0]----主类别为0。​:Pandas(数据处理)、NumPy(数值计算)、SciPy(统计检验)之后可以运用一些数据库进行数据的分析:例如:可

#数据分析#数据挖掘
到底了