LLaMA-Factory环境搭建与运行示例

莽夫搞战术

3121人浏览 · 2024-11-16 14:14:30

莽夫搞战术 · 2024-11-16 14:14:30 发布

LLaMA-Factory环境搭建与运行示例

一、LLaMA-Factory
二、LLaMA-Factory环境搭建
- 1.基础环境搭建
- 2.安装 LLaMA-Factory依赖
三、LLaMA-Factory运行示例

一、LLaMA-Factory

LLaMA-Factory项目

二、LLaMA-Factory环境搭建

1.基础环境搭建

基础环境需要

环境	推荐版本
CUDA	12.1
Python	3.11
PyTorch	2.4.0

具体安装可参考我的另一篇文章fairseq-0.12.2多机训练环境搭建。

2.安装 LLaMA-Factory依赖

下载LLaMA-Factory项目：

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

安装torch版本

pip3 install -e ".[torch]" -i https://pypi.tuna.tsinghua.edu.cn/simple

修改不正确的环境

pip3 install torch==2.4.0 torchvision==0.19.0 torchaudio==2.4.0 --index-url https://download.pytorch.org/whl/cu121 -i https://pypi.tuna.tsinghua.edu.cn/simple

三、LLaMA-Factory运行示例

1.使用命令行接口

配置文件llama3.yaml

model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
template: llama3

说明：

model_name_or_path为模型路径

运行命令行接口

CUDA_VISIBLE_DEVICES=0 llamafactory-cli chat examples/inference/llama3.yaml

说明：

CUDA_VISIBLE_DEVICES为指定运行显卡号

运行效果

2.使用浏览器界面

配置文件llama3.yaml

model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct
template: llama3

说明：

model_name_or_path为模型路径

使用浏览器界面

CUDA_VISIBLE_DEVICES=0 GRADIO_SERVER_PORT=8123 llamafactory-cli chat examples/inference/llama3.yaml

说明：

CUDA_VISIBLE_DEVICES为指定运行显卡号
GRADIO_SERVER_PORT为方位的端口

后台显示效果
浏览器效果
浏览器输入ip:port，port替换为GRADIO_SERVER_PORT的端口

3.使用训练方式批量推理

配置文件llama3.yaml

### model
model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct 

### method
stage: sft
do_predict: true
finetuning_type: full

### dataset
eval_dataset: test
template: llama3
cutoff_len: 4096
overwrite_cache: true
preprocessing_num_workers: 16

### output
output_dir: output
overwrite_output_dir: true

### eval
per_device_eval_batch_size: 1
predict_with_generate: true
do_sample: true
temperature: 0.6
top_p: 0.9
num_beams: 5

说明：

model_name_or_path为模型路径
eval_dataset为测试数据集名称
output_dir为输出文件路径
per_device_eval_batch_size为batch，一次批处理的数据数量
do_sample为使用sample推理
num_beams为beam大小

测试数据集准备
data/dataset_info.json

 {
  "test": {
    "file_name": "test.json"
  },
  "test1": {
    "file_name": "test1.json"
  }
}

说明：

key为数据名称，eval_dataset使用该字段
file_name为数据文件路径

使用训练方式批量推理

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train llama3.yaml

说明：

CUDA_VISIBLE_DEVICES为指定运行显卡号

运行效果

加入AMD AI开发者计划！

免费领 200 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

VLLMService Operator 开发第五篇：部署 Operator 并验证模型服务

存储准备完成后，就可以创建 VLLMService 资源了。metadata:spec:labels:port: 8000resources:requests:cpu: "2"limits:cpu: "4"storage:这里需要明确一点：VLLMService 本身只是用户声明的期望状态，它并不会直接运行模型。真正运行模型的是 Operator 根据这个 VLLMService 自动创建出来的

AMD开发者中国社区

VLLMService Operator 开发第六篇：给模型服务增加 Service 自动创建能力

做到这里，VLLMService Operator 已经不只是创建 Deployment 了，它开始具备完整服务编排的雏形。-> Pod-> Pod-> Service这一步非常关键，因为 Service 是后续接入流量入口的基础。没有 Service，HTTPRoute 就没有稳定的后端目标；-> Pod-> Service-> Gateway也就是说，Service 是从“模型 Pod 能跑起