logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CWSS是一个开源的中文分词系统

CWSS是一个开源的中文分词系统,其中它有两个版本。一个是提供对lucene3.0的支持。一个是纯中文分词,主要是为了方便大家使用。 :wink:[b]CWSS1.0由来[/b]一个星期疯狂啃读中科院和paoding分词过程中,突然想开发一套中文分词。[b]CWSS1.0的特性:[/b]1、采用了中科院的做法,断句处理,原子处理。2、基于“词库”切词。...

#lucene#活动
nginx

nginx是什么?[quote]Nginx ("engine x") 是一个高性能的 HTTP 和 反向代理 服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,它已经在该站点运行超过两年半了。Igor 将源代码以类BSD许可证的形式发布。尽管还是测试版,但是,Nginx

#nginx#.net
课题背景概述

文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的自然语言,缺乏计算机可理解的语义。传统数据挖掘所处理的数据是结构化的,而文档(web)

#数据挖掘#算法#数据结构
android 程序能在什么手机上运行

http://blog.csdn.net/flywalker/archive/2009/07/20/4364686.aspx

#.net
    共 11 条
  • 1
  • 2
  • 请选择