logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

对数据挖掘应用的一点思考

前面的文章展示了许许多多的算法,但是这些算法哪些能用在实际中呢?对不同的情况,现在有大量的数据挖掘算法供我们选用,分类时是选择决策树,还是贝叶斯或者支持向量机,这要与要处理的情况相匹配。如果是高维数据且训练数据较少时,应当选择支持向量机比较好,或许在处理较简单的分类时,决策树可能效果比较好。可能有的时候根本无法确认哪个好,所以就有人提出集成学习的概念,既然不晓得哪个好,那就投票,通过几轮投票来决定

#数据挖掘#算法#活动 +1
聚类算法总结

讲聚类算法,首先就理解几个聚类里面的专有词,让我们先回顾下这些关键词的定义.一个簇是一组数据对象的集合,在同一个簇中的对象彼此类似,而不同的簇中的对象彼此相异。将一组热处理或者抽象对象分组为类似对象组成的多个簇的过程被称为聚类。聚类分析有很广泛的应用,包括市场或客户模式识别,生物学研究,空间数据分析,web文档分类。聚类算法有很多:具体可以分为划分、层次、基于密度、基于网格、及基于模型

#算法#数据分析#网络
到底了