logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

国内首套免费的《Nutch相关框架视频教程》(1-16)

转自:http://yangshangchuan.iteye.com/blog/1837935 Nutch是一个Java开源项目,拥有近十年的历史,从一开始的搜索引擎演变为如今的网络爬虫。在Nutch的进化过程中,产生了Hadoop、Tika和Gora三个Java开源项目。如今这三个项目都发展迅速,极其火爆,尤其是Hadoop,其已成为大数据和云计算的代名词。    本人拥有多年Nutch

#搜索引擎#开源
中断处理之RTC

Linux对中断的支持在Linux中,中断处理程序看起来就是普普通通的C函数。只不过这些函数必须按照特定的类型声明,以便内核能够以标准的方式传递处理程序的信息,在其他方面,它们与一般的函数看起来别无二致。中断处理程序与其它内核函数的真正区别在于,中断处理程序是被内核调用来响应中断的,而它们运行于我们称之为中断上下文的特殊上下文中。关于中断上下文,我们将在后面讨论。中断可能随时发生,

#操作系统
linux grep和find命令

grep功能说明:查找文件里符合条件的字符串。语  法:grep [-abcEFGhHilLnqrsvVwxy][-A][-B][-C][-d][-e][-f][--help][范本样式][文件或目录...]补充说明:grep 指令用于查找内容包含指定的范本样式的文件,如果发现某文件的内容符合所指定的范本样式,预设grep指令会把含有范本样式的那一列显示出来。若不指定任何文件名称,

Linux下文本的高效处理

1 引言所谓的文本处理是指对文本进行查找、替换、删除、排序等操作, linux在文本处理方面提供了大量优秀的工具, 使得在linux下进行文本处理极其的方便. 我们平常的工作中, 经常会用到文本处理, 比如日志分析, 比如文本抽取, 等等, 所以掌握好文本处理, 将会对我们的工作起到极大的作用. 下面我就来逐个介绍下这些强大的工具, 对于我觉得大家可能比较熟知的工具及用

#搜索
9种排序算法总结

排序算法可以说是计算机专业学生要学习的最基础的算法,但其实也是最重要的,现在大部分互联网公司笔试面试也都会涉及到排序算法的知识。除了了解思想之外,还应该动手写一写,分析一些具体思路、时间复杂度、空间复杂度和稳定性等。我们面试讨论小分队也简单讨论了一下排序算法,为了加深记忆,我自己也动手写了一些代码(Linux平台写的,自己测试是通过了),并做一些分析(由于水平较水,代码可能有误!)。9种排

#算法
献给写作者的完美工具介绍!

一 理想的写作环境:Git+Github+Markdown+Jekyll理想的写作环境,受各类干扰小、清理废话及版本管理容易。曾花费较长时间寻找,最后还是找到了。2010年开始,采取Git+Github+Markdown+Jekyll,完成一些作品。暖色调灯光,黑暗的背景色,全屏的写作状态,很有氛围。这种搭配,符合心理学原理,背后有着相应理念。分享如下:Git

到底了