logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

美国最大婚恋交友网站eHarmony的机器学习实践(转载的)

http://www.csdn.net/article/2015-03-19/2824267本文介绍机器学习美国在婚恋交友网站平台eHarmony的应用,eHarmony通过相容性 (compatibility)分级、相似性(affinity)计算和潜在相似性匹配的“三级跳”实现在线婚恋速配。文章也涉及具体特征和算法及相关文献。上周,我去洛杉矶参加了一个机器学习的meetup,一位主讲是e

#数据挖掘
04数据挖掘原理-数据分析 数据描述

    数据描述包括,1:描述统计,2:    数学的统计方法包括,1:描述统计(集中趋势,离散程度,相关性),2:推断统计(参数估计,假设检验)    集中趋势(代表一个数据集的代表值)           1: 众数 ,多次重复出现的数的多个数。           2:中位数,排序后,排在中间位置的多个数。           3:四分数,排序后,

07数据挖掘原理-数据挖掘

数据挖掘的发展过程。 1关系型数据库 -》2数据仓库 -》3数据挖掘-》4大数据挖掘。xx网北京地区2013年1月份的注册数是多少,                                             关系型数据库的解决方案:查询单个数据库,mysql,特点一个数据库。xx网北京地区,上海地区,广州地区2013年1月份的注册数个是多少 ,    数据仓库

02数据挖掘原理-数据分析 数据准备

数据准备包含 ,1:数据获取(来源),2:数据抽样      数据获取的来源包括:1:调研,2:设备采集,3人工输入     ,4 各类文档,5外部数据库      数据抽样方式包括,1:概率抽样(简单随机抽样,分层抽样,整群抽样,等距抽样),2:非概率抽样(便利抽样,判断抽样,配额抽样)。简单随机抽样的基本方法,1:数字特征发,2:矩法,3:最大似然法,4:最小二乘法,5:贝叶斯法

01数据挖掘原理-数据分析

(转载网上图片) 数据挖掘的基础是数据分析,做数据分析,1数据准备 --》2数据处理--》3数据加工

使用Storm实现实时大数据分析

摘要:随着数据体积的越来越大,实时处理成为了许多机构需要面对的首要挑战。Shruthi Kumar和Siddharth Patankar在Dr.Dobb’s上结合了汽车超速监视,为我们演示了使用Storm进行实时大数据分析。CSDN在此编译、整理。简单和明了,Storm让大数据分析变得轻松加愉快。当今世界,公司的日常运营经常会生成TB级别的数据。数据来源囊括了互联网装置可以捕获

#storm
kafka shell 命令

bin/kafka-list-topic.sh --zookeeper 192.168.197.170:2181,192.168.197.171:2181 (列出所有topic的分区情况)bin/kafka-list-topic.sh --zookeeper 192.168.197.170:2181,192.168.197.171:2181 --topic test (查看test的分区情况)

#kafka
电商实时pv和 uv--storm实时方案

1 项目背景 :            做为电子商务的实时统计分析系统,如何对实时产生的日志进行统计和分析,将是目前 云商的一大热点。2 系统流程:            如下表:                                各个类型的的数据日志,包括,点击,点赞,购买,评论等消息生成来源,通过kafka日志收集

#storm
到底了