logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习——K-means聚类

K-means是一种基于距离的划分聚类方法,通过迭代将数据划分为K个簇。核心思想是使簇内样本的平方误差最小化。算法流程包括初始化聚类中心、分配样本到最近中心、重新计算中心位置,直到收敛。

#机器学习#kmeans#聚类
机器学习——决策树之回归树

解决回归问题的决策树模型你就是回归树回归树是一种基于决策树的监督学习算法,用于解决回归问题。通过递归地将特征空间划分为多个子区域,并在每个子区域内拟合一个简单的预测值(如均值),实现对连续目标变量的预测。

#机器学习#决策树#回归
Python中的网络爬虫

表示访问网站的搜索引擎,User - agent的值为 * 表示所有类型的搜索引擎;如果User - agent后面加,就表示Wandoujia Spider搜索引擎需要遵守的规则Disallow:表示该搜索引擎不允许访问的url表示该搜索引擎允许访问的urlSitemap:网站地图,用于提供网站中所有可以被爬取的url,方便搜索引擎能够快速爬取到对应网页代表注释,与python的概念相同是说爬虫

#python#爬虫#开发语言
到底了