logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

开源中文分词FudanNLP

推荐FudanNLP,这是一个复旦大学计算机学院开发的开源中文自然语言处理(NLP)工具包Fudan NLP里包含中文分词、关键词抽取、命名实体识别、词性标注、时间词抽取、语法分析等功能,对搜索引擎、文本分析等极为有价值。开源项目地址为:http://code.google.com/p/fudannlp/ DEMO地址为:http://jkx.f

#中文分词#自然语言处理#开源
文本特征提取方法研究

一、课题背景概述文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的自然语言,缺乏计算机可理解的语义。传统数据挖掘所处理的数据是结构化

#数据挖掘#机器学习#人工智能
到底了