OpenClaw（ClawdBot）实战指南：如何在 AMD开发者云上用 vLLM 免费部署你的专属 Agent

AMD开发者小助手

405人浏览 · 2026-04-24 18:05:05

AMD开发者小助手 · 2026-04-24 18:05:05 发布

OpenClaw（ClawdBot）实战指南：如何在 AMD开发者云上用 vLLM 免费部署你的专属 Agent

原文作者：Mahdi Ghodsi

过去一周，OpenClaw（之前叫 ClawdBot 和 MoltBot）的活跃度明显提升。很多用户在展示自己的项目，也在分享如何把它当作个人助理来用。与此同时，围绕成本和安全性的讨论也越来越多。

本文将带你实操：如何在AMD Developer Cloud 上，借助企业级数据中心 GPU，AMD GPU（单卡 192GB 显存），免费运行一个强大的开源大模型，让你摆脱消费级 GPU 的限制。

通过AMD AI 开发者计划获取免费云资源

加入AMD AI 开发者计划 [1] 后，你可以获得：

50小时开发者云GPU算力（单卡）免费额度，足够你完成模型验证和一次完整项目跑通。

- 如果你能做出有价值的应用并公开分享项目，还可以申请额外额度。

- 另外还包含：

- 一个月 DeepLearning.AI Premium 会员

有机会定期参与每月 AMD 硬件抽奖

- AMD 训练课程的免费访问权限

快速上手流程概览

Step 1：注册 AMD AI 开发者计划

访问AMD AI 开发者计划页面[1]，完成注册和加入：

- 已有 AMD 账号：直接登录后，加入该 Program 即可。

- 新用户：在登录页选择 “Create an account”，创建 AMD 账号后同步加入计划。

Step 2：激活云端额度

加入开发者计划后，进入成员站点（member-site），可以看到你的免费额度激活码，按页面提示进行激活。

Figure 1: AMD AI 开发者计划成员站点首页示例

在AMD Developer Cloud 上创建AMD GPU Droplet

Step 3：创建 GPU Droplet

激活额度后，会进入Create a GPU Droplet 页面，你可以在顶部看到当前可用的积分（Credit）。

按如下配置创建Droplet：

1. 选择硬件：选择单卡实例。

2. 选择镜像（Image）：选择ROCm Software镜像。

3. 配置访问方式：在页面相应区域添加你的 SSH 公钥（页面会提供生成 SSH key 的说明）。

Figure 2: 在 AMD Developer Cloud 中创建GPU Droplet

Droplet 创建完成后，你可以：从本地终端通过 SSH 登录，或在控制台 UI 中点击Web Console按钮进入。

SSH 方式示例：

ssh root@<YOUR_DROPLET_IP>

使用vLLM 在AMD GPU上运行大模型

我们将使用vLLM 这个目前非常流行的LLM 推理框架来运行模型。下面的所有步骤，都需要在你上一节已经创建好的 Droplet 上完成。

Step 1：环境准备

示例使用Python虚拟环境 + pip搭建环境：

apt install python3.12-venvpython3 -m venv .venvsource .venv/bin/activate

然后安装ROCm 优化版本 vLLM：

pip install vllm==0.15.0+rocm700 --extra-index-url https://wheels.vllm.ai/rocm/0.15.0/rocm700

Step 2：开放端口并启动 vLLM

本例将通过vLLM 从 Hugging Face 拉取并部署一个适配 MiniMax-M2.1 的 pruned 模型。

首先，开放8090 端口，以便外部请求可以访问你的模型服务：

ufw allow 8090

接下来，在Droplet 上执行下面这条命令，从 HuggingFace 拉取经过剪枝的 MiniMax-M2.1 模型。该模型采用 FP8、参数规模约 139B，在 AMD GPU 的 192GB 显存中可以比较从容地完整加载并运行。

注意：将命令中的 abc-123 替换为你自定义的、随机且安全的 API Key。

VLLM_USE_TRITON_FLASH_ATTN=0 vllm serve cerebras/MiniMax-M2.1-REAP-139B-A10B \    --served-model-name MiniMax-M2.1 \    --api-key abc-123 \    --port 8090 \    --enable-auto-tool-choice \    --tool-call-parser minimax_m2 \    --trust-remote-code \    --reasoning-parser minimax_m2_append_think \    --max-model-len 194000 \    --gpu-memory-utilization 0.99

这条命令将会：下载模型权重，将权重加载到AMD GPU 上，启动一个 OpenAI API 兼容的推理端点。

启动完成后，模型会通过如下URL 提供服务：http://:8090/v1

将OpenClaw 接入你的 vLLM 模型

接下来，我们把本地/ 浏览器里的OpenClaw配置为使用你刚刚部署的 vLLM 模型。

Step 1：安装 OpenClaw

如果还没有安装OpenClaw，可以在 Mac / Linux 上执行：

curl -fsSL https://openclaw.ai/install.sh | bash

安装过程中会有一个提示：“How do you want to hatch your bot?”，此时选择：“Open the Web UI”，然后根据提示在浏览器中打开OpenClaw Web 应用。

Step 2：配置 Provider（模型服务提供方）

在OpenClaw Web UI 中，进入：Settings → Config。新增一个模型 Provider，填写如下字段：

Name：vllm
API：选择openai-completions
API Key：填写前面 vLLM 启动命令中配置的 key（示例为 abc-123）
Base URL：http://:8090/v1

Figure 3: 在 OpenClaw 中配置 vLLM Provider

Figure 4：OpenClaw 中 MiniMax-M2.1 的模型定义

Figure 5：OpenClaw 中 MiniMax-M2.1 的模型 ID 与推理配置定义

Step 3：配置模型（Models）

接下来在OpenClaw 中定义具体模型信息：

1. 在 Models区域新增一条配置：

API：选择 openai-completions
Context Window：设置为 194000（需与max-model-len设置一致）
ID：设置为 MiniMax-M2.1（需与served-model-name设置一致）

2. 点击 Apply 保存。

Step 4：为 Agent 选择主模型

最后一步，将这个vLLM 模型绑定到你的主 Agent：

1. 进入 Agents 页面。

2. 将该 Agent 的 Primary Model设置为：vllm/MiniMax-M2.1（这个字符串由前面配置的Provider Name (vllm)和 Model ID (MiniMax-M2.1) 组合而成。

3. 点击Apply保存。

Figure 6: 在 OpenClaw 中为 Agent 选择 Primary Model

总结与下一步建议

至此，你已经完成了：

- 在 AMD Developer Cloud 上开通 AMD GPU 实例并激活免费额度；

- 使用 ROCm 优化 vLLM 在 AMD GPU上部署 MiniMax-M2.1-REAP-139B-A10B 模型；

- 将 OpenClaw 连接到这个 OpenAI 兼容的本地 / 远程模型服务端点。

现在，你可以在浏览器中，与运行在企业级GPU 上的 Agent 进行高上下文、高吞吐量的对话。

同样的流程也可以扩展到Hugging Face 上其他开源模型。

如果你在AMD 开发者云上做出有代表性的 Demo 或应用，不妨：

- 在社区、GitHub 或社交平台分享你的项目；

- 申请额外的免费 GPU 额度，持续优化和扩展你的智能体能力。

参考链接

[1] AMD AI 开发者计划（加入以获取免费额度等福利）：

https://www.amd.com/en/developer/ai-dev-program.html?utm_source=referral&utm_medium=social&utm_campaign=mahdi-ghodsi&utm_content=adp-aig

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

2026最新AI培训推荐榜单：AI企业内训与智能体培训机构排名解析

随着AI大模型技术进入商业落地的“深水区”，企业对员工的AI能力要求已从“了解概念”升级为“能开发智能体、能解决业务问题”。但对于绝大多数迫切希望“用AI降本增效、解决实际业务卡点”的企业而言，海芯智训凭借其“岗位场景定制+智能体实战开发+企业资产沉淀”的全链路闭环模式，无疑是本次AI培训推荐中最具实效价值的落地首选。其“14周进阶训练营”构建了从“指挥Agent”到“固化Skill”，再到“接入