logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

文本切分及jieba分词应用(1)

中文分词是指将连续的中文文本切分成有意义的符合语言习惯的词汇序列的过程。由于中文写作时不像英文那样在单词之间有明显的空格分隔,中文分词成为中文自然语言处理中的一项基础且关键的技术。正确的分词结果对于后续的文本处理任务,如词性标注句法分析情感分析等,都有着至关重要的影响。目前中文分词还是一个难题——对于需要上下文区别的词以及新词(人名、地名等)很难完美的区分。

#python#中文分词
到底了