社区云

LoRA

知来者逆来自 DeepSeek技术社区

deepseek.csdn.net · 2025-03-20 16:40:29

DeepSeek-R1私有化部署——DeepSeek-R1模型微调原理与代码实现

在微调大语言模型（LLM）的过程中，开发者常常会面临一系列技术挑战。显存不足？如果显存资源有限，可以采用 LoRA（低秩适配）技术结合 4-bit 量化，显著降低显存占用，同时保持模型性能。此外，云端训练也是一个不错的选择，借助强大的云服务资源，可以轻松应对大规模模型的训练需求。数据集太小？当数据集规模较小时，模型容易出现过拟合现象，导致无法泛化到新的数据。此时，可以运用数据增强技术，如同义词替换

#深度学习 #LoRA #RAG

684 

13 
网安福宝来自尧米AI

yourmi.csdn.net · 2024-05-24 10:37:45

stable diffusion 常用LoRA模型推荐（持续更新ing）

今天我要跟大家推荐一些常用的LoRA模型。LoRA属于微调模型，但是有很强烈的风格化倾向，因此有LoRA和没有LoRA，差别非常大。下面介绍几个最为流行的LoRA。LoRA的使用方法有直接使用和插件使用两种，前面的系列文章中已经介绍过，不再赘述。

#人工智能 #LoRA #AI作画 +1

3421 

24 
Andy_shenzl 来自 DeepSeek技术社区

deepseek.csdn.net · 2025-02-25 15:50:38

15、DeepSeek R1高效微调实战

将重点介绍如何使用主流微调框架unsloth，围绕DeepSeek R1 Distill 7B模型进行高效微调，并详细介绍专门用于推理大模型高效微调的COT数据集的创建和使用方法，并在一个医学数据集上完成高效微调实战，并最终达到问答风格优化+知识灌注目的，让模型在微调过程中掌握复杂医学问题的专业推理过程，并提高疾病诊断的准确率。尽管全量微调可以对模型的能力进行深度改造，但要带入模型全部参数进行

#LoRA

876 

10 
Cc不爱吃洋葱来自智源数据社区

baaidata.csdn.net · 2025-01-09 20:45:12

不是大模型全局微调不起，只是LoRA更有性价比，教程已经准备好了

由于 GPU 内存的限制，在训练过程中更新模型权重成本高昂。例如，假设我们有一个 7B 参数的语言模型，用一个权重矩阵 W 表示。在反向传播期间，模型需要学习一个 ΔW 矩阵，旨在更新原始权重，让损失函数值最小。权重更新如下：W_updated = W + ΔW。如果权重矩阵 W 包含 7B 个参数，则权重更新矩阵 ΔW 也包含 7B 个参数，计算矩阵 ΔW 非常耗费计算和内存。由 Edward

#深度学习 #人工智能 #自然语言处理 +1

1035 

26 
datian1234 来自智源数据社区

baaidata.csdn.net · 2024-11-07 11:14:39

大模型微调实战：基于 LLaMAFactory 通过 LoRA 微调修改模型自我认知

本文主要分享如何使用 LLaMAFactory 实现大模型微调，基于 Qwen1.5-1.8B-Chat 模型进行 LoRA 微调，修改模型自我认知。本文的一个目的：基于 `Qwen1.5-1.8B-Chat` 模型进行微调，修改模型自我认证。修改前对于 `Qwen1.5-1.8B-Chat` 模型，用户问`你是谁？`时模型一般会回答`我是阿里云自主研发的超大规模语言模型，我叫通义千问。`

#人工智能 #语言模型 #LoRA

1029 

27 
二分掌柜的来自智源数据社区

baaidata.csdn.net · 2024-12-11 17:58:05

基于Qwen2-VL模型针对LaTeX OCR任务进行微调训练 - 数据处理

flyfish

#transformer #LoRA

1122 

18 
AGI大模型老王来自智源数据社区

baaidata.csdn.net · 2024-12-24 09:30:00

【实战精讲】大模型微调系列（七）：基于LoRA微调多模态大模型的详细步骤

BLIP-2通过利用预训练的视觉模型和语言模型来提升多模态效果和降低训练成本，预训练的视觉模型能够提供高质量的视觉表征，预训练的语言模型则提供了强大的语言生成能力。如下图所示，由一个预训练的，一个预训练的和一个可学习的Q-Former组成。：负责从输入图片中提取视觉特征。：负责文本生成。Q-Former：负责弥合视觉和语言两种模态的差距，由和两个子模块构成，它们共享相同自注意力层，如下图所示。

#人工智能 #语言模型 #LoRA

1002 

22 
姜君泽来自智源数据社区

baaidata.csdn.net · 2023-11-23 17:14:40

探索稳定扩散技术中的LoRA权重激活：从模型微调到动漫风格图像生成的全过程

低秩适应（LoRA）技术是一种创新的方法，用于解决微调扩散器和大型语言模型（LLMs）的问题。在稳定扩散微调中，LoRA可应用于图像表示的交叉注意层，其中包含描述的潜在信息。为了理解模型微调的基本概念和方法，您可以参考Hugging Face扩散器的文档在这篇博客中，我们旨在介绍如何使用OpenVINO™优化构建Stable Diffusion + ControlNet管道，并启用LoRA权重，以

#人工智能 #LoRA

1414 

1 
虾米记来自智源数据社区

baaidata.csdn.net · 2024-09-16 21:55:15

【AI小项目5】使用 KerasNLP 对 Gemma 模型进行 LoRA 微调

本项目使用 KerasNLP 对 Gemma 模型进行 LoRA 微调，为了快速验证微调的效果，仅在数据集的一个小子集上进行了一个周期的微调，并使用了较低的 LoRA 秩值。取得了显著的改进效果。

#人工智能 #nlp #LoRA

1938 

9 
虾米记来自智源数据社区

baaidata.csdn.net · 2024-09-19 21:06:14

【AI小项目6】QLoRA针对资源受限设备上的大模型微调和文本分类任务的推理

本项目使用QLoRA技术（即结合了量化和 LoRA 技术），旨在在资源有限的情况下对预训练大模型进行高效微调，如移动设备或嵌入式设备，并将微调后的模型用在了一个文本分类任务的推理上。包含了完整的训练和推理过程。

#人工智能 #nlp #机器学习 +1

1171 

30 
Hopeton.J 来自智源数据社区

baaidata.csdn.net · 2024-10-01 14:58:38

用 LoRA 微调 Stable Diffusion：拆开炼丹炉，动手实现你的第一次 AI 绘画

总得拆开炼丹炉看看是什么样的。这篇文章将带你从代码层面一步步实现 AI 文本生成图像（Text-to-Image）中的 LoRA 微调过程，你将：- 了解 **Trigger Words**（触发词）到底是什么，以及它们如何影响生成结果。- 掌握 LoRA 微调的基本原理。- 学习数据集的准备与结构，并知道如何根据需求定制自己的数据集。- 理解 Stable Diffusion 模型的微调步骤。-

#LoRA #人工智能 #AIGC

7215 

31 
obullxl 来自智源数据社区

baaidata.csdn.net · 2024-07-20 00:27:50

基于 Qwen2 大模型微调技术详细教程（LoRA 参数高效微调和 SwanLab 可视化监控）

本教程详细介绍了 LoRA 参数高效微调技术，包括数据集准备和处理、模型加载、参数设置等，然后以 Qwen2-0.5B 预训练模型实践，进行了文本分类能力微调，微调过程通过 SwanLab 可视化界面查看，最终微调模型进行测试数据评估……

#AI #LoRA #人工智能

3451 

20 
Hopeton.J 来自智源数据社区

baaidata.csdn.net · 2024-09-22 18:02:20

PEFT微调：在大模型中快速应用 LoRA

你将了解到：peft 和 lora 之间有什么关系？get_peft_model 怎么使用？如何知道应用 LoRA 后模型的参数变化量？如何使用 `merge_and_unload()` 合并 LoRA 权重？认识报错：`TypeError: Expected state_dict to be dict-like...`

#机器学习 #人工智能 #AIGC +2

2259 

18 
llm_way 来自 DeepSeek技术社区

deepseek.csdn.net · 2025-02-20 08:15:00

利用 DeepSeek-R1 蒸馏模型结合 LoRA 和COT数据集进行高效微调

DeepSeek-R1 的出现，为大语言模型领域带来了新的活力。其采用的大规模强化学习技术，是一大技术亮点。仅需少量标注数据，就能显著提升模型性能。通过构建智能训练场，动态生成题目和实时验证解题过程，模型的推理能力得到了有效锻炼。在世界大模型排名 arena 上，DeepSeek-R1 (Paper Review: DeepSeek-R1——强化学习驱动的大语言模型推理能力提升。

#人工智能 #LoRA

1007 

31 
弹丸小姐来自智灵弹性算力系统

datastone.csdn.net · 2025-01-23 15:46:01

混元视频

智灵训练器支持了混元视频 LoRA 训练，可以在训练页中选择进行混元视频进行训练，步骤和 Flux 训练差不多，先上传图片素材 --> 打标 --> 配置 LoRA 训练参数 --> 开始训练 --> 训练完成。数据集打标上传图片素材切换到混元视频训练页，我们在第 2 步：训练用的数据找到数据集目录，选择我们需要上传文件的目录，如果没有可以手动创建。手动创建可以

## 人工智能 #LoRA模型 #LoRA +2

27 
二分掌柜的来自腾讯云开发者社区

tencentcloud.csdn.net · 2024-12-13 16:49:42

模型训练中梯度累积步数（gradient_accumulation_steps）的作用

flyfish

#transformer #LoRA

1195 

8 
V红太阳来自智灵弹性算力系统

datastone.csdn.net · 2024-06-01 10:13:09

[机器学习]GPT LoRA 大模型微调，生成猫耳娘

在深度学习和自然语言处理领域，大规模预训练模型（如GPT-3、BERT等）已经展示了强大的能力。然而，训练这些模型需要大量的计算资源和数据，这对于许多组织和个人来说并不现实。LoRA（Low-Rank Adaptation）作为一种轻量级的微调方法，提供了一种高效且经济的解决方案。本文将详细介绍LoRA的工作原理、应用场景、以及其在大模型微调中的优势和挑战。

#LoRA #人工智能 #深度学习

1.7w 

147 

标签介绍

LoRA

——LoRA

热门标签

本周

历史

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net