360-LLaMA-Factory安装与配置指南

洪淼征

1228人浏览 · 2025-04-07 09:50:37

洪淼征 · 2025-04-07 09:50:37 发布

360-LLaMA-Factory安装与配置指南

1. 项目基础介绍

360-LLaMA-Factory 是一个开源项目，基于 LLaMA-Factory 框架，增加了序列并行性（Sequence Parallelism，简称 SP）支持。该项目主要用于大型语言模型（LLM）的后续训练，如 Soft Prompt Tuning（SFT）和 Dynamic Personalization of Objectives（DPO）等。主要编程语言为 Python。

2. 关键技术和框架

序列并行性（SP）: 通过序列并行性技术，可以在多个 GPU 上并行处理单个序列的数据，从而提升训练效率。
深度学习框架: 基于 PyTorch 和 Huggingface 的 Transformers。
分布式训练框架: 使用 DeepSpeed 进行多 GPU 分布式训练。
优化技术: 集成了 ring-flash-attention 和其他优化技术，以提高训练性能。

3. 安装与配置

准备工作

在开始安装之前，请确保您的系统中已经安装了以下依赖：

Python 3.11（推荐版本）
Git
Conda 或其他 Python 环境管理工具

安装步骤

步骤 1：创建 Python 环境

打开命令行，创建一个新的 Python 环境（推荐使用 Conda）：

conda create -n 360-llama-factory python=3.11 -y

步骤 2：激活环境

激活刚刚创建的环境：

conda activate 360-llama-factory

步骤 3：克隆项目

从 GitHub 克隆项目到本地：

git clone https://github.com/Qihoo360/360-LLaMA-Factory.git

步骤 4：安装依赖

进入项目目录，安装项目依赖：

cd 360-LLaMA-Factory
pip install -e ".[torch,metrics,deepspeed]"

如果您的环境中已经安装了 LLaMA-Factory 和其他相关依赖，可以选择增量安装：

# 安装 ring-flash-attn 和 flash-attn
pip install --no-deps ring-flash-attn
pip install flash-attn
# 如果之前安装了原始的 LLaMA-Factory，需要卸载
pip uninstall llamafactory
# 安装 360-LLaMA-Factory
pip install --no-deps -e .

步骤 5：配置参数

在开始训练之前，需要配置 .yaml 文件中的 sequence_parallel_size 和 cutoff_len 参数，以启用序列并行性。

例如，在配置文件中设置：

sequence_parallel_size: 4
cutoff_len: 128000

或者在命令行中设置这些参数：

deepspeed --hostfile=8nodes.host src/train.py \
--sequence_parallel_size 4 \
--cutoff_len 128000 \
...

完成以上步骤后，您就可以开始使用 360-LLaMA-Factory 进行模型训练了。

注意：以上步骤为基本的安装和配置过程，具体的使用方法请参考项目的官方文档。

加入AMD AI开发者计划！

免费领 200 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

调查研究-202 SGLang 深度解析：为什么大模型推理框架不只是“把模型跑起来“

AMD开发者中国社区

Qwen2.5-Coder-32B-Instruct-AWQ模型部署

AMD开发者中国社区

在 AMD 云平台上微调 Gemma 4 做「AI 梦境日志」，我替你把 ROCm 这些坑踩完了（附完整流程）

AMD开发者中国社区

所有评论(0)

查看更多评论

洪淼征

@gitblog_00884

已为社区贡献1条内容

360-LLaMA-Factory安装与配置指南

洪淼征

360-LLaMA-Factory安装与配置指南

1. 项目基础介绍

2. 关键技术和框架

3. 安装与配置

准备工作

安装步骤

步骤 1：创建 Python 环境

步骤 2：激活环境

步骤 3：克隆项目

步骤 4：安装依赖

步骤 5：配置参数

所有评论(0)

温馨提示：您尚未绑定手机号

洪淼征