logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

分布式消息队列kafka系列介绍 — 基本概念

这个应该算是之前比较火热的词了,一直没时间抽出来看看。一个新东西出来,肯定是为了解决某些问题,不然不会有它的市场。先简单看下。官方介绍:分布式、分区、支持复制的日志提交系统适用场景:顾名思义,特别适合用于系统日志的异步记录,对于数据稳定性、一致性、可靠性要求不高的场景,追求的是高吞吐量。非传统的MQ产品!核心模型抽象:topics:某种消息的高层抽象producers:消息的生

文本分类,数据挖掘和机器学习

机器学习的有概率分类器(probabilistic),贝叶斯推理网络(bayesian inference networks) , 决策树分类器(decision tree) ,决策规则分类器(decision rule) ,基于回归的线性最小二乘llsf(regression based on linearleast squares fit ) , 符号规则归纳法( symboli...

#人工智能#数据结构与算法
数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上)

(update 2012.12.28 关于本项目下载及运行的常见问题 FAQ见 newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ )本文要点如下:对newsgroup文档集进行预处理,按照DF法及SVD分解法抽取特征词,实现降维实现了K-Means,MBSAS,DBSCAN三种聚类算法用weka工具进行newsg

数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(下)

本文接数据挖掘-基于Kmeans算法、MBSAS算法及DBSCAN算法的newsgroup18828文本聚类器的JAVA实现(上).(update 2012.12.28 关于本项目下载及运行的常见问题 FAQ见 newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ )本文要点如下:介绍基于LSI(隐性语义索引)中SV

数据挖掘-聚类-K-means算法Java实现

K-Means算法是最古老也是应用最广泛的聚类算法,它使用质心定义原型,质心是一组点的均值,通常该算法用于n维连续空间中的对象。K-Means算法流程step1:选择K个点作为初始质心step2:repeat               将每个点指派到最近的质心,形成K个簇               重新计算每个簇的质心       

数据挖掘-关联分析频繁模式挖掘Apriori、FP-Growth及Eclat算法的JAVA及C++实现

(update 2012.12.28 关于本项目下载及运行的常见问题 FAQ见 newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ )一、Apriori算法       Apriori是非常经典的关联分析频繁模式挖掘算法,其思想简明,实现方便,只是效率很低,可以作为频繁模式挖掘的入门算法。其主要特点是   

数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文本分类器的JAVA实现(下)

本文接 数据挖掘-基于贝叶斯算法及KNN算法的newsgroup18828文档分类器的JAVA实现(上) (update 2012.12.28 关于本项目下载及运行的常见问题 FAQ见 newsgroup18828文本分类器、文本聚类器、关联分析频繁模式挖掘算法的Java实现工程下载及运行FAQ )上文中描述了newsgroup18828文档集的预处理及贝叶斯算法的JAVA实现,下

#算法
如何判断一笔交易是否属于欺诈 数据挖掘算法与现实生活中的应用案例

文|周学春,一个在银行做挖掘的博士,微信公众号:比格堆塔相对于武汉,北京的秋来的真是早,九月初的傍晚,就能够感觉到丝丝丝丝丝丝的凉意。最近两件事挺有感觉的。看某发布会,设计师李剑叶的话挺让人感动的。“**的设计是内敛和克制的…。希望设计成为一种,可以被忽略的存在感”。其次,有感于不断跳Tone的妇科圣手,冯唐,“有追求、敢放弃”是他的标签。“如何分辨出垃...

#人工智能#python#数据结构与算法
数据挖掘:K最近邻(KNN)算法的java实现

版权声明:本文为博主原创文章,未经博主允许不得转载。KNN(K最近邻)算法。给定一些已经训练好的数据,输入一个新的测试数据点,计算包含于此测试数据点的最近的点的分类情况,哪个分类的类型占多数,则此测试点的分类与此相同,所以在这里,有的时候可以复制不同的分类点不同的权重。近的点的权重大点,远的点自然就小点。KNN算法的介绍见上一篇博文:数据挖掘:k最近邻(KNN)

如何判断一笔交易是否属于欺诈 数据挖掘算法与现实生活中的应用案例

文|周学春,一个在银行做挖掘的博士,微信公众号:比格堆塔相对于武汉,北京的秋来的真是早,九月初的傍晚,就能够感觉到丝丝丝丝丝丝的凉意。最近两件事挺有感觉的。看某发布会,设计师李剑叶的话挺让人感动的。“**的设计是内敛和克制的…。希望设计成为一种,可以被忽略的存在感”。其次,有感于不断跳Tone的妇科圣手,冯唐,“有追求、敢放弃”是他的标签。“如何分辨出垃圾邮

    共 70 条
  • 1
  • 2
  • 3
  • 7
  • 请选择