logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

nlp--常用分词方法

前言本文以介绍 nlp 常见分词方法为目的,具体效果请大家自行辨别中文分词jieba代码jieba.enable_paddle()# 启动paddle模式。 0.40版之后开始支持,早期版本不支持seg_list = jieba.cut(data, use_paddle=True)# 使用paddle模式print("Paddle Mode: " + '/'.join(list(seg_list)

#自然语言处理#paddlepaddle#python
transformers库中的.from_pretrained()

Transformers库中的预训练模型加载函数.from_pretrained()

#深度学习#自然语言处理#人工智能
Dropout & Batch Normolization

Regularization无正则项的模型结果training Accuracy:0.9478text Accuracy:0.915可以看到测试集的准确度小于训练集的准确度(https://s3.bmp.ovh/imgs/2021/10/cc65ea6438bb6f94.png#pic_center)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-v0BbO7yv-

#python#深度学习
【论文阅读】Language Models are Few-Shot Learners(GPT-3)

本文简要介绍了GPT-3的背景,模型架构,训练数据以及训练方式部分。具体训练细节,实验结果很多,可以在用到的时候再看。

文章图片
#论文阅读#语言模型#r语言
uni-gram与bi-gram语言模型

实验内容用python编程实践语言模型(uni-gram和bi-gram),加入平滑技术。计算test.txt中句子的PPL,对比uni-gram和bi-gram语言模型效果。遇到和解决的问题问题1问题:列表和字典作为实参传入函数时,在函数体内部改变形参,会导致实参也发生改变解决:一维列表传入使用list.copy(),二维字典传入使用copy.deepcopy(dict)详情可见:Python中

#nlp#python
山东大学nlp实验--CRF环境配置

前言按照实验指导中的方式配出来的环境,是跑不通代码的!!!python-3.6 + tensorflow=1.14 + keras=2.2.5亲测有效!!!缺点是可能不能启动gpu,即使下载的是tesorflow-gpu=1.14,因为和硬件可能不匹配按实验指导执行一遍pip install keras-preprocessing==1.0.9。这个版本的貌似找不到了,直接pip install

#自然语言处理#keras#tensorflow
Pytorch model.train()

文章目录1.前言2.作用及原因2.1.Batch Normalization2.1.1训练时的BN层2.1.2测试时的BN层2.2.Dropout3.总结1.前言在使用Pytorch进行模型的训练和测试时,我们总能在训练部分的最前面看到model.train(),在测试部分最前面看到model.eval()。这两种语法起到什么作用呢?对BN 和 Dropout 的介绍,可参考 Dropout &a

#pytorch
如何计算文本的困惑度perplexity(ppl)

本文关注在Pytorch中如何计算困惑度ppl, 为什么能用cross-entropy loss 代表ppl。

文章图片
#人工智能
    共 49 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择