
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
8.15 机器学习(2)K最近邻算法
1、定义:K 近邻(K-Nearest Neighbor, KNN)用最近的 K 个已知样本代表/决定未知样本的类别。预测X和Y的值,选择最优K值交叉验证,标明范围。适用小规模、低维、类别边界不规则的数据。④ 统计这 K 个邻居中类别出现频率,K 值选择、距离度量方式决定模型效果。练习:导入葡萄酒数据集(为分类问题)① 计算未知点到所有已知点的距离,③ 选前 K 个(K ≤ 20),⑤ 将频率最高
8.15 机器学习(2)K最近邻算法
1、定义:K 近邻(K-Nearest Neighbor, KNN)用最近的 K 个已知样本代表/决定未知样本的类别。预测X和Y的值,选择最优K值交叉验证,标明范围。适用小规模、低维、类别边界不规则的数据。④ 统计这 K 个邻居中类别出现频率,K 值选择、距离度量方式决定模型效果。练习:导入葡萄酒数据集(为分类问题)① 计算未知点到所有已知点的距离,③ 选前 K 个(K ≤ 20),⑤ 将频率最高
8.12 数据分析(1)
o_cat=i.strip().split('\t')[2:len(catg)]---第二个和以后为2。sub_cat=i.strip().split('\t')[1]----第一个分类为1。main_cat=i.strip().split('\t')[0]----主类别为0。:Pandas(数据处理)、NumPy(数值计算)、SciPy(统计检验)之后可以运用一些数据库进行数据的分析:例如:可
到底了