溯源006 个人主页

@l963852k

溯源006

2022-07-15 11:40:57 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

transformers 的Trainer的用法

Trainer 自动处理以下任务：训练循环：自动实现 epoch 迭代、批次加载优化器&学习率调度：内置 AdamW 并支持自定义分布式训练：自动支持单机多卡（DataParallel/DistributedDataParallel）混合精度训练：通过 fp16=True 启用日志记录：集成 TensorBoard、Weights & Biases 等模型保

#人工智能 #transformer #python

stable diffusion系列（1）------概述

讲最经典的DDPM。

deepseek问答记录：请讲解一下hugingface transformers中的AutoProcessor

Hugging Face Transformers库中的AutoProcessor是一个自动化工具，用于加载与预训练模型配套的处理器，简化了多模态模型（如文本、图像、音频）的预处理流程。它能够根据模型名称或路径自动推断并加载相应的处理器（如分词器、特征提取器等），支持多种输入类型，并兼容Hugging Face模型库中的各类模型。AutoProcessor通过from_pretrained()方法

#人工智能 #深度学习 #python

tokenizer的apply_chat_template

摘要：tokenizer.apply_chat_template是Hugging Face Transformers库中处理对话数据的方法，将聊天消息转换为模型输入格式。当参数设置为tokenize=False, add_generation_prompt=True时，会输出格式化字符串并在末尾添加模型生成标记（如Mistral模型的\n<|im_start|>assistant\n）

#深度学习

Huggingface transformers库使用教程（翻译）--------GetStarted（1）

你可以修改模型的配置类来改变模型的构建方式。配置指明了模型的属性，比如隐藏层或者注意力头的数量。当你从自定义的配置类初始化模型时，你就开始自定义模型构建了。模型属性是随机初始化的，你需要先训练模型，然后才能得到有意义的结果。通过导入 AutoConfig 来开始，之后加载你想修改的预训练模型。查阅创建一个自定义结构指南获取更多关于构建自定义配置的信息。

#人工智能 #深度学习

【论文翻译】RT-1: ROBOTICS TRANSFORMER FOR REAL-WORLD CONTROL AT SCALE【未完待续】

这种模型成功的关键在于。

#transformer #深度学习 #人工智能

habitat模型训练总结（一）：点导航PPO

PPO是actor_critic结构，需要两个网络一个actor网络，一个critic网络。这两个网络可以共享参数也可以不共享参数。habitat中的ppo在特征提取阶段采用了参数共享，然后分出了两个头。"""agent: PPO上面的代码可以看出self.actor_critic是NetPolicy类型，而NetPolicy类在中定义。在中的方法中......定义了self.actor_crit

【DeepSeek问答记录】请结合实例，讲解一下pytorch的DataLoader的使用方法

PyTorch的DataLoader是处理批量数据、并行加载和自动打乱的核心工具。本文通过实例详细讲解了DataLoader的基础使用流程，包括自定义数据集类、创建DataLoader实例以及遍历数据。结合实际场景，展示了如何在图像分类任务中使用DataLoader加载CIFAR10数据集，并进行训练循环。文章还深入解析了关键参数如batch_size、shuffle、num_workers等，并

#pytorch #人工智能 #python

台大李宏毅自注意力机制和Transformer详解（续）！

1）Transformer是变形金刚的意思，与BERT有很强的关联。2）Transformer是一个sequence-to-sequence（seq2seq）的模型，输出长度由模型自己决定3）encoder部分主要是self-attention，另外采用了残差网络构架和layer normalization4）decoder由AT和NAT两种方式。需要定义BEGIN和END特殊符号。AT的方式一开

#transformer #深度学习 #人工智能

Huggingface transformers库使用教程（翻译）--------微调预训练模型

使用预训练模型有许多显著的好处。它降低了计算成本，减少了碳排放，同时允许您使用最先进的模型，而无需从头开始训练一个。🤗 Transformers 提供了涉及各种任务的成千上万的预训练模型。当您使用预训练模型时，您需要在与任务相关的数据集上训练该模型。这种操作被称为微调，是一种非常强大的训练技术。

#深度学习 #人工智能 #python

共 30 条

请选择