bluekeyv 个人主页

@kirayuan

bluekeyv

2024-08-29 16:06:10 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

hadoop性能调优的一些笔记

1、同构机器表现优于异构，即使在良好集群中添加差的机器也会整个拖慢集群的效率，可能有些方法进行调整，但是作为私有云最好不用异构2、入库机器需要大于datanode节点的数量，实测的数据是单节点100MB/s ，2节点实测数据是136MB/s，由于总共就5台机器，所以无法测3节点入库速率。3、job执行的时候，当跑1.3T的数据时总共耗时3小时40分钟。在5台节点机的情况下相当理想

#hadoop #集群

“云计算”的双刃剑只会出现在中国

刚吃完饭，在cnbeta上就看到一篇文章，名叫“云计算”的双刃剑：FBI探员不必知会嫌犯即可随意搜查嫌犯的谷歌Docs账户。看完之后唯一的感想是，这篇文章是想说明Google守法呢，还是想说明Google其实是作恶的？我不愿妄加揣测说是后一种目的，我们姑且认为文章其实是想提醒读者，Google其实是很守法的，Google不是暴力抗法者。有人要问了，Google前端时间不是就是因为政府审查的原因才推

#云计算

Hadoop 实战之MapReduce链接作业之预处理

环境：Vmware 8.0 和Ubuntu11.04Hadoop 实战之MapReduce链接作业之预处理第一步：首先创建一个工程命名为HadoopTest.目录结构如下图:第二步: 在/home/tanglg1987目录下新建一个start.sh脚本文件，每次启动虚拟机都要删除/tmp目录下的全部文件，重新格式化namenode，代码如下：

虚拟机下linux+java+hadoop+hive环境搭建

最近在接触hadoop的项目，把总结出的配置方法写出来纪念一下，也方便后来人快速玩转hadoop。首先在虚拟机中安装linux，我是用的redhad，然后装jdk：http://yushan.javaeye.com/blog/261148，接下来是关键部分：一、hadoop安装：下载release版本hadoop0.20.1，解压到/home/hadoop/ 。1.命令行下

#hadoop #java #虚拟机 +1

云计算君临天下

云计算时代终于还是来了。移动终端

hadoop 中MapReduce因为文件打开文件数目超过linux限制报错

haoop中mapreduce报错java.io.IOException: All datanodes xxx.xxx.xxx.xxx:xxx are bad. Aborting…at org.apache.hadoop.dfs.DFSClient$DFSOutputStream.processDatanodeError(DFSClient.java:2158)at org.apache.hado

#mapreduce #hadoop #linux

到底了