dastu 个人主页

@weixin_44467105

dastu

2023-03-10 17:41:22 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

聚类分析（一）-K均值

一.K均值的过程首先，选择K个初始质心，其中K是用户指定的参数，即所期望的簇的个数。每个点指派到最近的质心，而指派到一个质心的点集为一个簇。然后，根据指派到簇的点，更新每个簇的质心。重复指派和更新步骤，直到簇不发生变化，或等价地，直到质心不发生变化。所以根据这个过程，我们需要在这个过程中关注两个问题：1.如何选择初始质心2.怎么决定将点指派到哪个质心 3.怎么计算质心二.K均值需要注意的...

#数据挖掘 #机器学习

聚类分析（二）——二分K均值

一般的K均值，所分成的簇往往是局部最优，而不是全局最优，比如下图，簇也不会再更新了，但显然没达到我们的要求。算法思想：顾名思义，二分k均值就是每次将数据集一分为二，即k均值算法中的k值为2，第一次是在整个数据集上划分，这里没什么异议，从第二次开始，每次划分的时候就要选取使整个数据集误差平方和最小的一个类进行一分为二了，以此进行下去直到分成我们想要的k类。二分k均值的伪代码如下：将所有点看...

#机器学习 #聚类 #算法

一文理清楚，准确率，精度，召回率，真正率，假正率，ROC/AUC

一.混淆矩阵如上图为一个混淆矩阵，True Positive （真正, TP）被模型预测为正的正样本；True Negative（真负 , TN）被模型预测为负的负样本；False Positive （假正, FP）被模型预测为正的负样本；False Negative（假负 , FN）被模型预测为负的正样本；相对应的，True Positive Rate（真正率 , TPR）或灵...

#数据挖掘 #机器学习

到底了