
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
lost task tracker issue in CDH 4.1.2
今天帮助一个同学解决job运行时间过长的问题, task 被kill后的 error信息是: “Lost task tracker: tracker_xxxxxx”, 从job history可以看到“Stage-2 map = 100%, reduce = 100%” 打印了很长时间,所以怀疑是dump文件的时间过长, 然后查看代码发现她的sql中存在两个大表的join操作(9亿+ * 97
nodejs express template (模版)的使用 (ejs + express)
var app=require("express").createServer();app.set("view engine","ejs");
Beyond MapReduce:谈2011年风靡的数据流计算系统
2011年度的Hadoop China大会刚刚落下帷幕,这次会议的一个热点议题就是数据流计算,在MapReduce计算模型风靡全球之后,Stream Processing将会是下一个研究热点,无论是在工业界还是学术界。本文从深层次对各种典型的数据流计算系统架构及其基于的设计理念进行剖析。背景与动机背景随着当今社会数据量的日益膨胀,普通服务器组成的计算集群用于处理各种数据应用
howdoi源码阅读
#!/usr/bin/env python######################################################## howdoi - instant coding answers via the command line# written by Benjamin Gleitzman (gleitz@mit.edu)# inspired by Ri
到底了







