
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
从设计模式角度来看,zookeeper是一个基于观察者模式设计的分布式服务管理框架。它以类似文件目录式的结构存储和管理大家都关心的数据,并接受观察者的注册,一旦这些数据的状态发生变化,zookeeper就负责通知已经在zookeeper上注册的那些观察者做出相应的反应,从而实现集群中类似Master/Slave方式的管理模式。zookeeper常用算法如下 领导者选举 void f
来自http://blog.csdn.net/lifengzhong/article/details/7737028# 苹果信息推送服务(Apple Push Notification Service),是由苹果官方提供的消息推送服务。推送形式包括顶部消息条、声音以及badge number()有了APNS,应用程序可在任意状态接收到与程序有关的消息(包括运行状态not runnin
2011年08月23日00:05 来源:mdyang的技术博客 作者:mdyang 编辑:胡铭娅 评论:0条 【IT168技术】现在MapReduce/Hadoop以及相关的数据处理技术非常热,因此我想在这里将MapReduce的优势汇总一下,将MapReduce与传统基于HPC集群的并行计算模型做一个简要比较,也算是对前一阵子所学的MapReduce知识做一个总结和梳理。 随着互联网数据量
Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。Adaboost算法的具体步骤如下:1给定训练样本集S,T为训练的最大循环次数;2初始化样本权重为1/n,即为训练样本的初始概率分布3第一次迭代:(1)在当前权重下,训练弱分类器(2)计算弱分类器的错误率(3)选取合
遗传算法试图结合自然进化的思想来得到最优结果。它通常采用二进制串表示解空间,通过二进制串的交换、反转模拟自然界的进化与变异,最终求得一个最优解。举一个简单的例子,假定给定的训练集用两个布尔属性A1和A2描述,并且有两个类C1和C2.规则“IF A1 AND NOT A2 THEN C2”可以用二进制位串“100”编码规则“IF NOT A1 AND NOT A2 THEN C1"可以用
贝叶斯分类是一种统计学分类方法,它利用已知样本的分类统计情况预测未知样本的分类。p(H|X)=p(X|H)p(H)/p(X)朴素贝叶斯分类工作过程:1)每个数据样本用一个n维特征向量X={x1,x2,......xn}表示,分别描述对n个属性A1,A2.....An样本的n个度量。2)假定有m个类C1,C2....Cm。给定一个未知的数据样本X,分类法将预测X属于具有最高后验概率的
数据挖掘原语主要包含以下方面内容:待挖掘的相关数据集要挖掘的数据类型用于发现过程的背景知识模式评估的兴趣度度量和阀值可视化发现模式的期望表示标准的数据挖掘原语对数据挖掘的普及和推广具有重要意义。数据挖掘系统与数据库/数据仓库的关系:不耦合、松散耦合、半紧密耦合和紧密耦合。一个良好设计的数据挖掘系统应当提供与数据库/数据仓库的紧密或半紧密耦合。
数据挖掘功能包括:发现概念/类描述,关联分析,分类和预测,聚类分析,孤立点分析,演变分析
我是腾讯的陈军,我加入腾讯之前在硅谷工作了十几年,我要讲的就是开发平台与腾讯海量业务面对的挑战,重点讲几个比较有意思的话题,网络方面,集群任务调度、分布式同步,还有云存储和数据中心运维,因为腾讯做的东西很多。时间关系,就挑一些重点来讲。 去年12月份腾讯和360事件之后,腾讯就做了一个策略的转变,就是要打造开放平台。目前朋友社区和Qzone平台已经向第三方开放。目的就是营造一
最近邻法基于类比学习,它既可以用于聚类,也可以用于分类K-means是基于最近邻法的聚类方法。算法描述如下:输入:k, data[n];(1) 选择k个初始中心点,例如c[0]=data[0],…c[k-1]=data[k-1];(2) 对于data[0]….data[n], 分别与c[0]…c[k-1]比较,假定与c[i]差值最少,就标记为i;(3) 对于所有标记为i点







