logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MongoDB最佳实践

作者: baiyuzhong分类:云计算,选题策划  阅读:5,396 次添加评论文 / Ines Sombra  译 / 李刚将MongoDB加入到我们的服务支持列表中,是整个团队年初工作计划中的首要任务。但我们感觉如果先添加一项对NoSQL存储的支持,而不是先升级已支持的关系型数据库,可能对用户不太好,毕竟目前的用户都使用关系型数据库。所以我们决定将引入MongoDB这项工

#mongodb#postgresql#nosql +2
分析和优化云集群性能

分析和优化云集群性能使用可配置参数监视和调优 Hadoop 集群的性能Yu Li, 软件工程师, IBMYu Li 是一位中国软件工程师。他是 IBM InfoSphere BigInsight 团队的成员,这个团队的任务是在 Apache Hadoop 上构建分析平台。他的专业领域包括云计算、性能调优、数据挖掘、数据库技术和中间件技术。简介: Hadoop 是一个可

#集群#hadoop#mapreduce +1
配置vm虚拟机的端口转发

此配置方法适用于工作机A 配置CRT访问工作机B上安装vm linux虚拟机服务。     1)安装vm虚拟机,配置该虚拟机的网络方式为NAT     2)打开vm软件的虚拟网络配置:      3)打开后选择NAT选项框:将红色框标记的信息记录下来,待修改linux服务器配置时使用;点击蓝色框标记的按钮        4)将Port Forwarding选项框选中

#虚拟机#linux#网络 +1
基于Hadoop平台的并行数据挖掘算法工具-Dodo

查看原文一 基于云计算的海量数据挖掘2008年7 月,《Communications of the ACM》杂志发表了关于云计算的专辑,云计算因其清晰的商业模式而受到广泛关注,并得到工业和学术界的普遍认可。目前工业界推出的云计算平台有Amazon公司的EC2和S3,Google公司的Google Apps Engine, IBM公司的Blue Cloud,Microsoft

#数据挖掘#算法#hadoop +1
syslog-ng 安装配置

1)下载syslog-ng可执行文件 syslog-ng-3.2.5-linux-glibc2.3.6-amd64.run       2)安装syslog-ng:             chmod +x syslog-ng-3.2.5-linux-glibc2.3.6-amd64.run             ./syslog-ng-3.2.5-linux-glibc2.3.6-

实现字符型进度条(pyton、java)

大家在linux上使用wget时,wget命令会向linux命令行界面输出进度条,但平时也没有太留意这些细节。最近由于需要给产品人员提供后台分析程序,虽然不需要实现界面,但为了让程序更人性化一些,于是计划在dos界面上实现进度条的输出。         实现原理:        在向标准输出输出数据时,可以使用 \r 字符实现回退到该行的头部,如:sys.stdout.write(‘\

消息系统Kafka介绍

作者:Dong |可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明网址:http://dongxicheng.org/search-engine/kafka/1、  概述Kafka是Linkedin于2010年12月份开源的消息系统,它主要用于处理活跃的流式数据。活跃的流式数据在web网站应用中非常常见,这些数据包括网站的pv、用户访问了什么内容,搜索了什么内

#负载均衡#hadoop#集群
linkedin高吞吐量分布式消息系统kafka使用手记

转载自五四陈科学院[http://www.54chen.com]本文链接:http://www.54chen.com/java-ee/linkedin-kafka-usage.htmlkafka是一种高吞吐量的分布式发布订阅消息系统,她有如下特性:通过O(1)的磁盘数据结构提供消息的持久化,这种结构对于即使数以TB的消息存储也能够保持长时间的稳定性能。高吞吐量:即

#数据结构#hadoop
kafka 介绍

1.Why we built this    asd(activity stream data)数据是任何网站的一部分,反映网站使用情况,如:那些内容被搜索、展示。通常,此部分数据被以log方式记录在文件,然后定期的整合和分析。od(operation data)是关于机器性能数据,和其它不同途径整合的操作数据。    在近几年,asd和od变成一个网站重要的一部分,更复杂的基础设施是必须

基于Hadoop平台的并行数据挖掘算法工具-Dodo

查看原文一 基于云计算的海量数据挖掘2008年7 月,《Communications of the ACM》杂志发表了关于云计算的专辑,云计算因其清晰的商业模式而受到广泛关注,并得到工业和学术界的普遍认可。目前工业界推出的云计算平台有Amazon公司的EC2和S3,Google公司的Google Apps Engine, IBM公司的Blue Cloud,Microsoft

#数据挖掘#算法#hadoop +1
到底了