logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

transformers Trainer自定义optimizer和scheduler

我自定义了一个evaluate方法,想在每一轮训练过后都执行一次。如果只是在TrainingArguments里设置warmup_steps=100,那么每轮都会重置学习率,可以通过自定义optimizers的方法来解决

文章图片
#深度学习#人工智能
distinct指标计算

distinct-n多样性指标介绍及举例计算

#python#深度学习#自然语言处理
Huggingface报错

data_collator要对dataset中的所有列做填充,对于input_ids, attention_mask, labels 模型知道如何pad(因为他们是列表或者张量),但是对于text和label来说,他们是字符串,模型不知道该怎么填充。

文章图片
#python#机器学习#深度学习
到底了