简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Nutch是一个Java开源项目,拥有近十年的历史,从一开始的搜索引擎演变为如今的网络爬虫。在Nutch的进化过程中,产生了Hadoop、Tika和Gora三个Java开源项目。如今这三个项目都发展迅速,极其火爆,尤其是Hadoop,其已成为大数据和云计算的代名词。 本人拥有多年Nutch相关框架研发经验,顺应大数据云计算的浪潮,推出了国内首套免费的《Nutch相关框架视频教程》。
了解Linux Linux入门——个人感想初入Linux WindowsXP硬盘安装Ubuntu 12.04双系统图文详解 实例讲解虚拟机3种网络模式(桥接、nat、Host-only) 在线求助 man page文件,目录,权限 所有者,群组,其他人 文件的属性 Linux目录规范和含义 改变文件属性与权限 常用的文件和目录操作
按需支付是云计算服务众所周知的优势之一。 以EC2为例,它所提供的三种服务方式中,On—Demond instance提供以Gb/小时为颗粒度的计费单位,无须预付费,也无需承诺试用时长,并可以通过Auto Scaling功能自动增删所租用的虚拟资源,做到了按需支付,我们目前所宣传的也基本上指的是这种模式。 另外一种Reserved Instance收费方式与On-demond in
环境准备1. 操作系统 a. otter为纯java编写,windows/linux均可支持 b. jdk建议使用1.6.25以上的版本,稳定可靠,目前阿里巴巴使用基本为此版本2. 整个otter同步由几部分组成,需要预先进行安装,后续会有专门的篇幅展开介绍managernode3. otter node依赖于zookeeper进行分布式
webbench最多可以模拟3万个并发连接去测试网站的负载能力,个人感觉要比Apache自带的ab压力测试工具好,安装使用也特别方便。 1、适用系统:Linux 2、编译安装:引用wget http://blog.s135.com/soft
1. Lucene Lucene的开发语言是Java,也是Java家族中最为出名的一个开源搜索引擎,在Java世界中已经是标准的全文检索程序,它提供了完整的查询引擎和索引引擎,没有中文分词引擎,需要自己去实现,因此用Lucene去做一个搜素引擎需要自己去架构.另外它不支持实时搜索,但linkedin和twitter有分别对Lucene改进的实时搜素.其中Lucene有一个C++移植
腾讯Web前端 AlloyTeam 推出了新的开源项目:一个基于HTML5技术的专业级图像处理引擎——AlloyImage(简称AI),并在此基础上开发了一个在线Web图像处理平台——AlloyPhoto(简称AP)。 AlloyImage是一个使用Javascript语言开发的,基于Web的在线图像处理引擎,除了核心底层图像处理引擎,还同时集成了一些方便快捷的图像处理API,您可以将它简