只需四步，完成基于Llama-factory的模型微调过程

Llama-factory是一种常用的模型微调框架，之前一直知道有这样一款产品，但是没有尝试过。本文记录了本地基于Llama-factory的模型微调过程，方便后续进行复盘。因为只是初次尝试，算是把流程跑通了，没有任何优化调整。

Langchain

386人浏览 · 2026-03-09 15:12:21

Langchain · 2026-03-09 15:12:21 发布

一、Llama-factory安装

1、通过github下载最新版本的llama-factory代码包

2、在GPU服务器上解压


unzip Llama-factory-main.zip

3、创建一个虚拟环境


conda create -n llama-factory --offline --clone base

4、安装llama-factory依赖包


cd Llama-factory-main pip install -e “.[torch, metrics]”

5、安装过程中可能存在报错，根据报错信息进行解决，例如：


import _soundfile_data # ImportError if this doesn’t exist 解决方案： yum install libsndfile

6、检查llama-factory是否安装成功


llamafactory-cli version

显示内容如下，说明llama-factory安装成功。


---------------------------------------

二、数据集及训练模型准备

1、数据集准备

这里使用测试团队提供的训练数据集，共计477条数据。该数据集由测试团队自行整理，内容为“测试用例生成脚本”的数据集，期望微调后模型能够根据“测试指令”生成相应的“测试脚本”。其中“input”为输入，“output”为期望输出。

这里将数据进行3:7分，其中137条作为评估数据集，340条作为训练数据集。
将训练及测试数据上传至：./Llama-factory/data目录，并修改目录下面的dataset_info.json文件，增加以下内容（方便后续llama-factory识别到新增数据集）：


“testcase_pred”: { “file_name”: “data_json_0710_pred.json” }, “testcase_train”: { “file_name”: “data_json_0710_train.json” },

2、训练模型准备

我们使用的基础模型为qwen3-8b，直接从魔搭社区（modelscope）下载对应的模型（safetensors格式），下载模型放置到服务器的目录，例如：

/data/1/models/Qwen/qwen3-8b。

三、基于llamfa-factory webui进行微调

Llama-factory支持命令行直接训练，并提供webui进行可视化操作。这里在对微调过程及命令行不熟悉的情况下，新手使用webui进行微调训练即可，非常简单。webui启动命令如下：


cd /data/1/models/Llama-factory CUDA_VISIBLE_DEVICES=2,3 GRADIO_SERVER_PORT=9582 llamafactory-cli webui # 使用2、3号GPU进行模型训练，webui端口号为9852

启动成功后，登陆http://IP:9852查看web页面，后续可基于此页面进行模型微调。

模型训练整个过程包含了：训练**/****微调、评估、对话、导出**四个主要内容。

1、模型微调

1) 对页面内容进行配置如下（这里选择本地模型作为基础模型，并选择testcase_train作为训练数据集）：

2）这里优化方案暂时未配置，使用默认方式（后续需进一步学习，这里面涉及到一些训练优化算法的配置）。

3）点击预览命令，可查看本次的训练完整命令；

4）点击保存训练参数，可将本次配置参数保存至本地；

5）点击开始按钮，启动模型微调

6）模型训练启动成功后，可查看模型训练进度以及损失函数降低情况:

7）训练完毕后，页面有明显的提示信息

2、模型评估

1）切换到Evaluate&Predict页面，选择之前准备的评估数据集，启动模型评估过程

2）同样有进度条，可查看任务进度

3）当前评估结果如下所示（指标项很差）：


{ “predict_bleu-4”: 4.891540000000001, “predict_model_preparation_time”: 0.0064, “predict_rouge-1”: 7.424934285714286, “predict_rouge-2”: 2.1897800000000003, “predict_rouge-l”: 4.195487857142858, “predict_runtime”: 725.8749, “predict_samples_per_second”: 0.189, “predict_steps_per_second”: 0.048 }

3、模型对话

1）切换至Chat，选择之前训练的检查点，点击加载模型

2）模型加载完成后，输入部分内容，查看输出结果是否满足预期

3）此时可以看到，微调后的模型能够针对特定的对话，给出期望的输出结果

4、模型导出

1）切换到Export页面，

2）输入导出目录，点击开始导出，此时llama-factory将合并基础模型与微调检查点内容，并输出完整模型。

3）导出完成后，页面会有明显提示信息

4）此时进入到对应的服务器目录，可查看当前训练完成的完整模型。

四、写在最后

至此，完成一次完整的模型微调过程。从操作上来说已经非常简化了，至少能够完整地跑通一遍微调过程。虽然从模型评估数值结果来看，模型微调效果较差，需要进一步研究与调整模型微调方法。

如果你觉得这篇文章对你有所帮助，不妨点击右下角的点赞、分享、推荐，让更多朋友看到，也欢迎留言互动交流。

想入门 AI 大模型却找不到清晰方向？备考大厂 AI 岗还在四处搜集零散资料？别再浪费时间啦！2025 年 AI 大模型全套学习资料已整理完毕，从学习路线到面试真题，从工具教程到行业报告，一站式覆盖你的所有需求，现在全部免费分享！

👇👇扫码免费领取全部内容👇👇

一、学习必备：100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT，帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例？大模型电子书？这份资料帮你站在 “行业高度” 学 AI：

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告：覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容，涵盖：

职业趋势：《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》；
商业落地：《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》；
领域细分：《AGI 在金融领域的应用报告》《AI GC 实践案例集》；
行业监测：《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT：听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会，包含百度、腾讯、字节等企业的一线实践：

在这里插入图片描述

安全方向：《端侧大模型的安全建设》《大模型驱动安全升级（腾讯代码安全实践）》；
产品与创新：《大模型产品如何创新与创收》《AI 时代的新范式：构建 AI 产品》；
多模态与 Agent：《Step-Video 开源模型（视频生成进展）》《Agentic RAG 的现在与未来》；
工程落地：《从原型到生产：AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看：大厂 AI 岗面试 “弹药库”，300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗？这份面试资料帮你提前 “押题”，拒绝临场慌！

1. 107 道大厂面经：覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景，包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题，每道题都附带思路解析：

2. 102 道 AI 大模型真题：直击大模型核心考点

针对大模型专属考题，从概念到实践全面覆盖，帮你理清底层逻辑：

3. 97 道 LLMs 真题：聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案，比如让很多人头疼的 “复读机问题”：

三、路线必明： AI 大模型学习路线图，1 张图理清核心内容

刚接触 AI 大模型，不知道该从哪学起？这份「AI大模型学习路线图」直接帮你划重点，不用再盲目摸索！

在这里插入图片描述

路线图涵盖 5 大核心板块，从基础到进阶层层递进：一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

四、资料领取：全套内容免费抱走，学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型，还是有基础想冲刺大厂、了解行业趋势，这份资料都能满足你！
现在只需按照提示操作，就能免费领取：

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口？别犹豫，这份免费资料就是你的 “起跑线”！

加入AMD AI开发者计划！

免费领 100 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

云GPU环境配置：PyTorch/TensorFlow安装避

AMD开发者中国社区

【大模型推理】KVDrive: A Holistic Multi-Tier KV Cache Management System for Long-Context LLM Inference

如图 6 所示，KVDrive 旨在支持高吞吐量的长上下文 LLM 推理，即使在 GPU 内存紧张的情况下也是如此。当 KV 缓存超过 GPU 容量时，它会被卸载到主机 DRAM 或 SSD，并且系统在预填充阶段在 GPU 内存中构建一个索引。在解码期间，每个新 token 都遵循一个三阶段的工作流程：通过索引识别关键 KV 条目（❶）；将选定的条目从 DRAM 或 SSD 获取到 GPU HBM

AMD开发者中国社区

调用多个AI 模型时，如何实现一个简单的熔断机制

文章摘要：AI模型服务熔断机制的轻量级实现本文介绍了一种为AI模型服务设计的轻量级熔断机制实现方案。当调用Chat、Embedding等AI模型服务时，常会遇到超时、限流等问题，熔断机制可避免持续调用故障服务。方案采用三个状态（CLOSED、OPEN、HALF_OPEN）管理模型健康度，通过记录连续失败次数、熔断时间和半开探测标记，实现自动熔断和恢复。核心逻辑包括：调用前检查状态、成功时重置健康