简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
map/reduce优化的几点建议
1 选择Mapper的数量 Hadoop处理大量小文件的性能比较逊色,主要由于生成的每个分片都是一整个文件,Map操作时只会处理很少的输入数据,但是会产生很多Map任务,每个Map任务的运行都包括产生、调度和结束时间,大量的Map任务会造成一定的性能损失。可以通过Java虚拟机(JVM)重用来解决这个问题。hadoop默认每个JVM只运行一个任务。使用JVM重用后,一个JVM可以
Tesseract-ocr的安装
在此专门地讲解linxu平台下的具体安装过程。1.安装前必备的包sudo apt-get installlibpng12-devsudo apt-get installlibjpeg62-devsudo apt-get installlibtiff4-devsudo apt-get install libgif-dev(或者sudo yum in
到底了