logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

transformers.generator_utils函数源码解析之RepetitionPenaltyLogitsProcessor

主要记录源码中解决文本生成中词组重复出现的问题,代码中有具体操作解析。class RepetitionPenaltyLogitsProcessor(LogitsProcessor):r""":class:`transformers.LogitsProcessor` enforcing an exponential penalty on repeated sequences.Args:repetit

#python#自然语言处理#机器翻译
transformers.generator_utils函数源码解析之beam_search

#beam_search主体函数while True:model_inputs = self.prepare_inputs_for_generation(input_ids, **model_kwargs) #整理下一步decoder所需数据outputs = self(**model_inputs,return_dict=True,output_attentions=output_attenti

#python#ide
transformers.generator_utils函数源码解析之sample生成(包括temperature、TopK、TopP函数解析)

sample函数相较于beam_search函数要简单的多,但是需要注意的一点是,sample需要搭配logits_warper处理器列表使用,相应的处理器函数在下面。sample函数的源码解释如下,比较浅显易懂。# auto-regressive generationwhile True:# prepare model inputsmodel_inputs = self.prepare_inpu

#python#pytorch
python h5py详解

1. h5py 文件介绍一个h5py文件是 “dataset” 和 “group” 二合一的容器。1. dataset : 类似数组组织的数据的集合,像 numpy 数组一样工作2. group : 包含了其它 dataset 和 其它 group ,像字典一样工作看下图:通过上图,我们可以知道 h5py 文件就像是文件夹一样,里面很放文件还有文件夹,主文件夹以 ‘/’ 开始,这又像Linux的树

python importlib详解

题外话很多Python源码中,会有一句if __name__ == '__main__':,其中__name__为python的一个内置类属性,存在于每一个python程序中,不同运行方式会出现不同的结果。直接运行当前程序,文件中的__name__的值为“__main__”。其他程序导入当前python程序,原文件中__name__的值为“原文件的名字”。python的importlib模块作用动

#python#pycharm#开发语言
T5模型总结

T5(Transfer Text-to-Text Transformer)模型:一个统一框架,靠着大力出奇迹,将所有 NLP 任务都转化成 Text-to-Text (文本到文本)任务。比如英德翻译,只需将训练数据集的输入部分前加上“translate English to German(给我从英语翻译成德语)” 就行。假设需要翻译"That is good",那么先转换成 "translate

#python
torch.scatter函数详解

#torch.scatter函数官方解释scatter(output, dim, index, src) → TensorWrites all values from the tensor src into self at the indices specified in the index tensor. For each value in src, its output index is sp

#python#pytorch
到底了