logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

自然语言处理库——NLTK

NLTK(www.nltk.org)是在处理预料库、分类文本、分析语言结构等多项操作中最长遇到的包。其收集的大量公开数据集、模型上提供了全面、易用的接口,涵盖了分词、词性标注(Part-Of-Speech tag, POS-tag)、命名实体识别(Named Entity Recognition, NER)、句法分析(Syntactic Parse)等各项 NLP 领域的功能。...

#自然语言处理
文本查重:difflib.SequenceMatcher

参考:SequenceMatcher in PythondifflibSequenceMatcher的基本思想是找到不包含“垃圾”元素的最长连续匹配子序列(LCS)。这不会产生最小的编辑序列,但是会产生对人“看起来正确”的匹配。

#自然语言处理
距离度量:闵氏、欧式、马氏、余弦、汉明等

目录1. 闵氏距离(Minkowski Distance)2. 欧式距离(Euclidean Distance)3. 标准化欧式距离(Standardized Euclidean distance)4 马氏距离(Mahalanobis Distance)1. 闵氏距离(Minkowski Distance)闵氏距离又叫做闵可夫斯基距离,是欧氏空间中的一种测度,被看做是欧氏距离的一种推广,欧氏距离是

#机器学习
碰撞检测算法之GJK算法

碰撞检测算法之GJK算法

文章图片
#算法
BERT:代码解读、实体关系抽取实战

目录前言一、BERT的主要亮点1. 双向Transformers2.句子级别的应用3.能够解决的任务二、BERT代码解读1. 数据预处理1.1 InputExample类1.2 InputFeatures类1.3 DataProcessor 重点1.4 convert_single_example1.5 file_based_conver...

ZooKeeper的Java API客户端异常:org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorC

log4j:WARN No appenders could be found for logger (org.apache.zookeeper.ZooKeeper).log4j:WARN Please initialize the log4j system properly.Exception in thread "main" org.apache.zookeeper.KeeperExc...

TensorFlow:常用函数介绍

学习网址:Tensorflow中文社区http://www.tensorfly.cn/一、tensorflow框架笔记1.Variable一个Variable代表一个可修改的张量,存在在TensorFlow的用于描述交互性操作的图中。它们可以用于计算输入值,也可以在计算中被修改。对于各种机器学习应用,一般都会有模型参数,如w、b,可以用Variable表示。2. s...

#tensorflow
句法分析:依存分析(Dependency Parsing)

句法分析(syntactic parsing)是自然语言处理中的关键技术之一,它是对输入的文本句子进行分析以得到句子的句法结构的处理过程。对句法结构进行分析,一方面是语言理解的自身需求,句法分析是语言理解的重要一环,另一方面也为其它自然语言处理任务提供支持。例如句法驱动的统计机器翻译需要对源语言或目标语言(或者同时两种语言)进行句法分析;语义分析通常以句法分析的输出结果作为输入以便获得更多的指示信

#自然语言处理
R语言:ts() 时间序列的建立

ts() 函数:通过一向量或者矩阵创建一个一元的或多元的时间序列(time series),为ts型对象。调用格式:ts(data = NA, start = 1, end = numeric(0), frequency = 1, deltat = 1, ts.eps = getOption("ts.eps"), class, names)说明:...

语言模型常用评价方法:perplexity、bleu

1. perplexity(困惑度、复杂度)语言模型效果好坏的常用评价指标是perplexity,简单说,perplexity值刻画的是语言模型预测一个语言样本的能力。在一个测试集上得到的perplexity值越低,说明建模效果越好。计算公式如下:其中,为word数量在语言模型的训练中,通常使用perplexity的对数形式:将每个位置上的概率取对数再平均对数使用加法的形式,可以加速...

#深度学习#nlp
    共 24 条
  • 1
  • 2
  • 3
  • 请选择