WSL2 环境下部署 OpenClaw，AMD 显卡多代理并发教程

小助手

149人浏览 · 2026-06-12 14:30:00

小助手 · 2026-06-12 14:30:00 发布

WSL2 环境搭建与驱动调优

要在 Windows 上获得接近原生的 Linux 开发体验并充分释放 AMD 显卡的 AI 算力，WSL2（Windows Subsystem for Linux）是必经之路。对于 Ryzen AI Max+ 或搭载 Radeon GPU 的设备，第一步并非直接安装软件，而是底层驱动的“解锁”。

打开 AMD Software: Adrenalin Edition，进入“性能”->“调优”选项卡。找到“可变显存”（Variable VRAM）设置，将其手动拉满至 96GB（针对 128GB 内存机型）或最大可用值。这一步至关重要，它打破了传统集成显卡仅能调用少量系统内存的限制，让大模型权重能完整驻留在高速统一内存中。设置完成后重启系统。

接下来配置 WSL2。以管理员身份运行 PowerShell，执行以下命令安装 Ubuntu 24.04 并启用 systemd 支持（OpenClaw 依赖此特性管理后台服务）：

wsl --install -d Ubuntu-24.04

安装完成后，先不要急着进入终端。我们需要修改 WSL 配置文件以开启 systemd。在 PowerShell 中执行：

wsl --shutdown
echo "[boot]" | Out-File -FilePath $env:USERPROFILE\.wslconfig -Encoding utf8
echo "systemd=true" | Out-File -FilePath $env:USERPROFILE\.wslconfig -Encoding utf8 -Append

再次启动 WSL 并验证状态：

wsl
ps -p 1 -o comm=

若输出 systemd，说明环境就绪。此时建议顺便更新源并安装基础构建工具：sudo apt update && sudo apt install -y build-essential curl git。

LM Studio 后端配置与显存优化

OpenClaw 本身是一个代理编排框架，它需要一个稳定的推理后端来承载大模型。在 AMD 平台上，LM Studio 目前是对 Vulkan 和 ROCm 支持最友好的图形化工具，尤其适合处理长上下文和多并发请求。

启动 LM Studio，进入开发者模式（Developer Mode）。在模型搜索栏输入 Qwen3.5-35B-A3B（或其他适配 Agent 任务的量化模型），下载 GGUF 格式版本。加载模型时，点击右侧的齿轮图标进入高级设置，这里有几个关键参数直接决定成败：

Context Length（上下文窗口）：设置为 190000。Ryzen AI 的统一内存优势在此体现，能够轻松容纳近 200k 的上下文，这对于需要阅读长篇文档或维持复杂对话历史的 Agent 至关重要。
GPU Offload（显卡卸载）：务必拉至 MAX。确保所有计算层都交由 GPU/NPU 处理，避免 CPU 介入导致推理速度断崖式下跌。
Max Concurrent Predictions（最大并发预测数）：这是多代理并发的核心。公式为 [主代理数] + [主代理数 × 子代理数]。若计划运行 2 个主代理且每个带 2 个子代理，此处应填 6。
Unified Key-Value Cache：保持勾选。这允许所有代理共享同一块显存缓存区，显著降低多任务时的内存峰值占用。

完成设置后，点击"Start Server"，并确保勾选"Serve on LAN"以便 WSL2 内部访问。默认端口通常为 1234。此时，后端已准备就绪，状态应显示为"READY"。

OpenClaw 部署与多代理并发实战

回到 WSL2 终端，开始部署 OpenClaw 核心。通过官方脚本或 pip 安装后，我们需要编辑配置文件 ~/.openclaw/openclaw.json 来对接本地后端。

{
  "models": {
    "providers": {
      "lmstudio": {
        "baseUrl": "http://host.docker.internal:1234/v1",
        "apiKey": "lmstudio",
        "api": "openai-responses",
        "models": [
          {
            "id": "qwen3.5-35b-a3b",
            "contextWindow": 190000,
            "maxTokens": 8192
          }
        ]
      }
    }
  },
  "agents": {
    "defaults": {
      "model": { "primary": "lmstudio/qwen3.5-35b-a3b" },
      "concurrency": 6
    }
  },
  "browser": {
    "enabled": true,
    "headless": false
  }
}

注意 baseUrl 的地址，WSL2 访问 Windows 宿主需使用 host.docker.internal。配置中的 browser.enabled 设为 true 将激活 OpenClaw 的浏览器控制功能，允许 Agent 自主操作 Chrome 进行网页交互，这是实现自动化工作流的关键。

保存配置后，运行 openclaw gateway restart 启动服务。通过 openclaw models list 验证模型连接状态。此时，你可以尝试创建一个包含多个子任务的场景，例如：“读取本地 PDF 技术文档，总结核心观点，并在浏览器中搜索最新的相关新闻进行对比”。

性能实测：RyzenClaw vs RadeonClaw

在实际跑通流程后，不同硬件配置的表现差异明显。基于 Qwen3.5-35B 模型的测试数据显示：

RyzenClaw 方案（Ryzen AI Max+ 128GB 统一内存）：得益于超大带宽和容量，系统能稳定维持 45 tokens/s 的生成速度。其最大优势在于“容量换并发”，能够同时支撑 6 个 活跃代理而不爆显存，适合复杂的、需要大量上下文记忆的多智能体协作任务。处理 10k 输入令牌仅需约 19.5 秒。
RadeonClaw 方案（独立 Radeon GPU）：在纯推理吞吐量上表现更激进，速度可达 120 tokens/s，响应几乎实时。但受限于独立显存大小（通常小于统一内存池），其并发能力略受限，推荐同时运行 2 个 重型代理以保证稳定性。处理同等输入仅需 4.4 秒。

对于大多数进阶开发者，Ryzen AI 平台的统一内存架构提供了更均衡的“容错率”，让你在调试复杂 Agent 逻辑时无需时刻担心 OOM（内存溢出）。而独立显卡方案则更适合对延迟极其敏感的单一高频任务。无论哪种组合，本地化部署带来的隐私安全与零网络延迟，都已让端侧 AI 具备了替代云端服务的硬实力。

200小时GPU算力已就位，快来领取：https://marketing.csdn.net/questions/Q2604140858304426315?utm_source=AIpaper

在这里插入图片描述

加入AMD AI开发者计划！

免费领 200 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

FlagOS Day 0 跨芯适配 GLM-5.2：发布即覆盖四款芯片，支持 vLLM + SGLang双插件

同时，FlagGems 新增 6 大领域算子库——FlagDNN、FlagBlas、FlagSparse、FlagFFT、FlagTensor、FlagAudio，覆盖科学计算与信号处理场景，共计 102 个领域算子，从"大模型专用"走向全领域覆盖。厂商目录放置后由插件自动发现加载，vLLM-Plugin-FL、SGLang-Plugin-FL、Megatron-LM-FL、Transformer