LLaMA-Factory的概念与搭建

北上ing

504人浏览 · 2025-03-31 16:40:36

北上ing · 2025-03-31 16:40:36 发布

LLaMA-Factory是一个大型语言模型（Large Language Model）的训练与微调框架（Factory）。提供了基于Gradio的网页版工作台。

笔者在2025.3.30对其进行了解和部署，根据后续需要进行更新。

#1.环境搭建

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

cd LLaMA-Factory

conda create --name LLaMA-Factory python=3.10
conda activate LLaMA-Factory
pip install -e ".[torch,metrics]"

llamafactory-cli version	# 验证安装成功

#2.启动Gradio WebUI界面

llamafactory-cli webui		# `whereis llamafactory`看看执行文件在哪
# or
python src/webui.py

Tip：基于Gradio的WebUI代码位于src/llamafactory/webui

Bug处理：启动webui报错

File "/home/jin/anaconda3/envs/LLaMA-Factory/lib/python3.10/site-packages/gradio_client/utils.py", line 898, in get_type
 if "const" in schema:
TypeError: argument of type 'bool' is not iterable

解决：pip install pydantic==2.10.6

#3.WebUI的训练设置（待补充）

设置项：`Model name`

对于XX-YY-ZZ，如Baichuan-13B-Base。

XX：模型名称
YY：参数量
ZZ：Base表示预训练模型，Chat表示基于Base微调的适应聊天的模型

设置项：`Finetuning method`

full

freeze

lora

#4.相关概念（待补充）

Q-LoRA

一种在消费级硬件上微调大型语言模型的微调方法。

加入AMD AI开发者计划！

免费领 200 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

白嫖48GB显存跑DeepSeek！AMD云GPU私有化部署实战

AMD开发者中国社区

PyTorch性能分析终极指南：从新手到专家的完整调试流程

你是否曾经遇到过这样的困境：PyTorch模型训练速度缓慢，内存占用过高，却不知道问题出在哪里？或者花费大量时间调整超参数，但效果甚微？在深度学习开发中，性能瓶颈往往是阻碍模型部署和产品化的最大障碍。本文将为你提供一套完整的PyTorch性能分析和优化指南，帮助你快速定位问题、提升模型效率，让你的深度学习项目跑得更快、更稳。## 痛点分析：为什么你的PyTorch模型跑得慢？在开始技术细节

AMD开发者中国社区

PyTorch性能优化终极指南：Profiler与TensorBoard实战应用

你是否曾经遇到过这样的困扰？🤔 模型训练速度慢如蜗牛，却不知道问题出在哪里；内存消耗飙升，却无法定位具体原因；模型精度不达标，却难以分析问题根源。在深度学习开发中，性能瓶颈就像隐形的敌人，让你花费大量时间却收效甚微。今天，让我们一起探索PyTorch性能优化的两大神器——Profiler和TensorBoard，让你的模型开发效率提升10倍以上！PyTorch作为当前最流行的深度学习框架之一