logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Qwen2-VL视觉大模型微调实战:LaTex公式OCR识别任务(完整代码)

SwanLab机器学习实战教程是一个主打「开箱即用」的AI训练系列教程,我们致力于提供手把手帮助你跑起训练。Qwen2-VL是通义千问团队最近开源的大语言模型,由阿里云通义实验室研发。以Qwen2-VL作为基座多模态大模型,通过的方式实现特定场景下的OCR,是学习的入门任务。本文我们将简要介绍基于 transformers、peft 等框架,使用 Qwen2-VL-2B-Instruct 模型在上

文章图片
#机器学习#python#深度学习 +1
BERT-IMDB电影评论情感分类实战(完整代码、数据集、实验过程)

基于BERT模型的IMDB电影评论情感分类,是NLP经典的Hello World任务之一。这篇文章我将带大家使用SwanLab、transformers、datasets三个开源工具,完成从数据集准备、代码编写、可视化训练的全过程。观察了一下,中文互联网上似乎很少有能直接跑起来的BERT训练代码和教程,所以也希望这篇文章可以帮到大家。

文章图片
#分类#人工智能#数据可视化 +4
Stable Diffusion文生图模型训练入门实战(完整代码)

(SD1.5)是由Stability AI在2022年8月22日开源的文生图模型,是SD最经典也是社区最活跃的模型之一。以SD1.5作为预训练模型,在火影忍者数据集上微调一个火影风格的文生图模型(非Lora方式),是学习的入门任务。显存要求 22GB左右在本文中,我们会使用模型在数据集上做训练,同时使用监控训练过程、评估模型效果。

文章图片
#深度学习#机器学习
PyTorch音频分类实战(完整代码)

PyTorch音频分类实战,完整代码+数据集+实验日志。音频分类任务是指将音频信号按照其内容的类别归属进行划分。例如,区分一段音频是音乐、语音、环境声音(如鸟鸣、雨声、机器运转声)还是动物叫声等。其目的是通过自动分类的方式,高效地对大量音频数据进行组织、检索和理解。

文章图片
#pytorch#音视频#分类 +2
DQN深度强化学习:CartPole倒立摆任务(完整代码)

🚀 DQN实战:3分钟极速训练倒立摆控制模型 | 附完整代码+可视化训练;📌 核心技术亮点:DQN双剑合璧:融合深度神经网络与Q-Learning,通过经验回放打破数据关联性,目标网络稳定训练过程,解决高维状态空间难题;CartPole极简环境:4维状态空间+2个离散动作,完美契合入门级深度强化学习实战(附环境配置指南)

文章图片
#深度学习#人工智能
基于Bert模型的美团外卖评论文本情感分类(附完整代码与训练过程)

基于Bert模型的美团外卖评论数据集的文本情感分类,是自然语言处理领域的经典案例之一。这篇文章我将带大家使用 SwanLab、Transformers、datasets 三个开源工具,完成从数据集准备、代码编写、可视化训练的全过程。观察了一下,中文互联网上似乎很少有能直接跑起来的Bert训练代码和教程,所以也希望这篇文章可以帮到大家。

文章图片
#bert#分类#人工智能 +4
Qwen2大模型微调入门实战(完整代码)

是通义千问团队的开源大语言模型,由阿里云通义实验室研发。以Qwen2作为基座大模型,通过指令微调的方式实现高准确率的文本分类,是学习的入门任务。指令微调是一种通过在由(指令,输出)对组成的数据集上进一步训练LLMs的过程。其中,指令代表模型的人类指令,输出代表遵循指令的期望输出。这个过程有助于弥合LLMs的下一个词预测目标与用户让LLMs遵循人类指令的目标之间的差距。在这个任务中我们会使用模型在数

文章图片
#自然语言处理#深度学习#机器学习
最实战的Qwen2微调入门:从文本分类开始

以Qwen2作为基座大模型,通过指令微调的方式实现高准确率的文本分类,是学习的入门任务。指令微调是一种通过在由(指令,输出)对组成的数据集上进一步训练LLMs的过程。其中,指令代表模型的人类指令,输出代表遵循指令的期望输出。这个过程有助于弥合LLMs的下一个词预测目标与用户让LLMs遵循人类指令的目标之间的差距。在这个任务中我们会使用模型在数据集上进行指令微调任务,同时使用SwanLab进行监控和

文章图片
#AIGC#人工智能#深度学习
Qwen3大模型微调入门实战(完整代码)

阿里最新开源的Qwen3大模型登顶HuggingFace开源LLM榜首,成为开发者首选。本文手把手教你用​​全参数微调​​技术,基于Qwen3-1.7B和医学数据集打造能进行深度推理的医疗对话助手。通过transformers和SwanLab工具链,实现带思考链(类似DeepSeek R1)的专业回复生成,完整公开32GB显存适配代码、数据集处理技巧及过拟合解决方案。附实战训练日志可视化分析、模型

文章图片
SwanLab x EasyR1:多模态大模型强化学习可视化训练

EasyR1是基于veRL的一个高效、可扩展、多模态强化学习LLM训练框架,由LLaMA Factory作者hiyouga打造,很很短的时间内获得了1.8k Star。EasyR1 受益于 veRL 的 HybridEngine 和 vLLM 0.7 的 SPMD mode,并适配了 Qwen2.5-VL 模型,在多模态几何题任务 Geometry3k 上通过 30 个 batch 的 GRPO

文章图片
#人工智能#自然语言处理#机器学习 +3
    共 88 条
  • 1
  • 2
  • 3
  • 9
  • 请选择