logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RoBERTa 详解

文章目录0. 背景1. 介绍2. 背景3. 实验设置3.1 配置3.2 数据3.3 评估4. 训练过程分析4.1 Static vs Dynamic Masking4.2 Model Input Format and NSP4.3 Training with large batches4.4 Text Encoding5. RoBERTa5.1 GLUE上的结果5.2 SQuAD上的结果5.3 R

#自然语言处理#pytorch#深度学习
GPT2详解

GPT-2详解

GPT详解

目录1. 导读2. 引言3. 论文动机与创新点4. GPT模型5. Pre train6. Fine-tuning7. Task-specific input transformations8. 实验结果1. 导读今天阅读的是 OpenAI 2018 年的论文《Improving Language Understanding by Generative Pre-Training》,截止目前共有 6

Python 文件读取的4种方式

python读文件的4种方式1.直接打开就读with open('filepath','r') as f:for line in f:print(line)print('一行数据')虽然f是一个文件实例,但可以通过以上方式对每一行进行循环处理了,处理时每一行是一个字符串str,而且这个是速度最快最简洁的方法2.用read()打开with open('filepath','r') as f:ff=f

#python
Pytorch torch.optim.Adam() torch.optim.AdamW()

torch.optim优化算法理解之optim.Adam()torch.AdamW优化算法+超级收敛

暂无文章信息