2301_82188844 个人主页

@2301_82188844

2301_82188844

2025-07-16 14:52:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

8.15 机器学习（2）K最近邻算法

1、定义：K 近邻（K-Nearest Neighbor, KNN）用最近的 K 个已知样本代表/决定未知样本的类别。预测X和Y的值，选择最优K值交叉验证，标明范围。适用小规模、低维、类别边界不规则的数据。④ 统计这 K 个邻居中类别出现频率，K 值选择、距离度量方式决定模型效果。练习：导入葡萄酒数据集（为分类问题）① 计算未知点到所有已知点的距离，③ 选前 K 个（K ≤ 20），⑤ 将频率最高

o_cat=i.strip().split('\t')[2:len(catg)]---第二个和以后为2。sub_cat=i.strip().split('\t')[1]----第一个分类为1。main_cat=i.strip().split('\t')[0]----主类别为0。：Pandas（数据处理）、NumPy（数值计算）、SciPy（统计检验）之后可以运用一些数据库进行数据的分析：例如：可

#数据分析 #数据挖掘

到底了