logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据清洗实例

在自然语言处理中,往往我们拿到一份数据,不能直接使用,需进行预操作,把数据转化成我们需要的样子。下面介绍一下基本的数据清洗操作:代码:import refrom nltk.corpus import stopwordss = 'RT @Amila #Test\nTom\'s newly listed Co & Mary\'s unlistedGroup to supply tech

文章图片
#python#自然语言处理#知识图谱 +2
spacy进行命名实体识别

英文文本:import spacynlp = spacy.load('en_core_web_sm')doc_2 = nlp('Weather is good, very windy and sunny.We have no classes in afternoon')for ent in doc_2.ents:print('{}--{}'.format(ent,ent.label_))from

#python#自然语言处理#nlp
Hanlp工具安装问题解决(windows)

1.电脑需先安装配置好jdk,版本>=1.82.安装JPype 命令:pip install jpype13.安装pyhanlp pip install pyhanlp如出现报错Miscrosoft Visual C++ 14.0 is required...则安装vsC++链接:https://pan.baidu.com/s/1JP4Ahb4A3rLXDsomptQ9kg...

文章图片
#python#知识图谱#深度学习 +2
自然语言处理-关键字提取(1)-TF-IDF算法

1.算法简介TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF是词频(Term Frequency),IDF是逆文本频率指数(Inverse Document Frequency)。广泛用于Lucene,Solr,Elasticserach等搜索引擎,以及自然语言处理,文本关键字的提取。2.算法分析以以

文章图片
#python#自然语言处理
Windows下Pycharm中引入CRFPP出错解决

1.错误信息import CRFPPModuleNotFoundError: No module named 'CRFPP'显示没有名为CRFPP的模块,此处需要自己编译得到2.解决办法此处需使用Linux下的crf++0.58和Windows下crf++0.58分别下载下来解压进入到Linux版目录下的python目录下目录如下:此时需要从Windows版crf++中复制几个文件到此目录下在安装

文章图片
#python#自然语言处理#知识图谱 +1
自然语言处理(1)- NLP简介

1.概念自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研

文章图片
#python#自然语言处理#深度学习
自然语言处理(1)- NLP简介

1.概念自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研

文章图片
#python#自然语言处理#深度学习
到底了