WSL2 环境搭建与驱动调优

要在 Windows 上获得接近原生的 Linux 开发体验并充分释放 AMD 显卡的 AI 算力,WSL2(Windows Subsystem for Linux)是必经之路。对于 Ryzen AI Max+ 或搭载 Radeon GPU 的设备,第一步并非直接安装软件,而是底层驱动的“解锁”。

打开 AMD Software: Adrenalin Edition,进入“性能”->“调优”选项卡。找到“可变显存”(Variable VRAM)设置,将其手动拉满至 96GB(针对 128GB 内存机型)或最大可用值。这一步至关重要,它打破了传统集成显卡仅能调用少量系统内存的限制,让大模型权重能完整驻留在高速统一内存中。设置完成后重启系统。

接下来配置 WSL2。以管理员身份运行 PowerShell,执行以下命令安装 Ubuntu 24.04 并启用 systemd 支持(OpenClaw 依赖此特性管理后台服务):

wsl --install -d Ubuntu-24.04

安装完成后,先不要急着进入终端。我们需要修改 WSL 配置文件以开启 systemd。在 PowerShell 中执行:

wsl --shutdown
echo "[boot]" | Out-File -FilePath $env:USERPROFILE\.wslconfig -Encoding utf8
echo "systemd=true" | Out-File -FilePath $env:USERPROFILE\.wslconfig -Encoding utf8 -Append

再次启动 WSL 并验证状态:

wsl
ps -p 1 -o comm=

若输出 systemd,说明环境就绪。此时建议顺便更新源并安装基础构建工具:sudo apt update && sudo apt install -y build-essential curl git

LM Studio 后端配置与显存优化

OpenClaw 本身是一个代理编排框架,它需要一个稳定的推理后端来承载大模型。在 AMD 平台上,LM Studio 目前是对 Vulkan 和 ROCm 支持最友好的图形化工具,尤其适合处理长上下文和多并发请求。

启动 LM Studio,进入开发者模式(Developer Mode)。在模型搜索栏输入 Qwen3.5-35B-A3B(或其他适配 Agent 任务的量化模型),下载 GGUF 格式版本。加载模型时,点击右侧的齿轮图标进入高级设置,这里有几个关键参数直接决定成败:

  1. Context Length(上下文窗口):设置为 190000。Ryzen AI 的统一内存优势在此体现,能够轻松容纳近 200k 的上下文,这对于需要阅读长篇文档或维持复杂对话历史的 Agent 至关重要。
  2. GPU Offload(显卡卸载):务必拉至 MAX。确保所有计算层都交由 GPU/NPU 处理,避免 CPU 介入导致推理速度断崖式下跌。
  3. Max Concurrent Predictions(最大并发预测数):这是多代理并发的核心。公式为 [主代理数] + [主代理数 × 子代理数]。若计划运行 2 个主代理且每个带 2 个子代理,此处应填 6
  4. Unified Key-Value Cache:保持勾选。这允许所有代理共享同一块显存缓存区,显著降低多任务时的内存峰值占用。

完成设置后,点击"Start Server",并确保勾选"Serve on LAN"以便 WSL2 内部访问。默认端口通常为 1234。此时,后端已准备就绪,状态应显示为"READY"。

OpenClaw 部署与多代理并发实战

回到 WSL2 终端,开始部署 OpenClaw 核心。通过官方脚本或 pip 安装后,我们需要编辑配置文件 ~/.openclaw/openclaw.json 来对接本地后端。

{
  "models": {
    "providers": {
      "lmstudio": {
        "baseUrl": "http://host.docker.internal:1234/v1",
        "apiKey": "lmstudio",
        "api": "openai-responses",
        "models": [
          {
            "id": "qwen3.5-35b-a3b",
            "contextWindow": 190000,
            "maxTokens": 8192
          }
        ]
      }
    }
  },
  "agents": {
    "defaults": {
      "model": { "primary": "lmstudio/qwen3.5-35b-a3b" },
      "concurrency": 6
    }
  },
  "browser": {
    "enabled": true,
    "headless": false
  }
}

注意 baseUrl 的地址,WSL2 访问 Windows 宿主需使用 host.docker.internal。配置中的 browser.enabled 设为 true 将激活 OpenClaw 的浏览器控制功能,允许 Agent 自主操作 Chrome 进行网页交互,这是实现自动化工作流的关键。

保存配置后,运行 openclaw gateway restart 启动服务。通过 openclaw models list 验证模型连接状态。此时,你可以尝试创建一个包含多个子任务的场景,例如:“读取本地 PDF 技术文档,总结核心观点,并在浏览器中搜索最新的相关新闻进行对比”。

性能实测:RyzenClaw vs RadeonClaw

在实际跑通流程后,不同硬件配置的表现差异明显。基于 Qwen3.5-35B 模型的测试数据显示:

  • RyzenClaw 方案(Ryzen AI Max+ 128GB 统一内存):得益于超大带宽和容量,系统能稳定维持 45 tokens/s 的生成速度。其最大优势在于“容量换并发”,能够同时支撑 6 个 活跃代理而不爆显存,适合复杂的、需要大量上下文记忆的多智能体协作任务。处理 10k 输入令牌仅需约 19.5 秒。
  • RadeonClaw 方案(独立 Radeon GPU):在纯推理吞吐量上表现更激进,速度可达 120 tokens/s,响应几乎实时。但受限于独立显存大小(通常小于统一内存池),其并发能力略受限,推荐同时运行 2 个 重型代理以保证稳定性。处理同等输入仅需 4.4 秒。

对于大多数进阶开发者,Ryzen AI 平台的统一内存架构提供了更均衡的“容错率”,让你在调试复杂 Agent 逻辑时无需时刻担心 OOM(内存溢出)。而独立显卡方案则更适合对延迟极其敏感的单一高频任务。无论哪种组合,本地化部署带来的隐私安全与零网络延迟,都已让端侧 AI 具备了替代云端服务的硬实力。

200小时GPU算力已就位,快来领取:https://marketing.csdn.net/questions/Q2604140858304426315?utm_source=AIpaper

在这里插入图片描述

Logo

免费领 200 小时云算力,进群参与显卡、AI PC 幸运抽奖

更多推荐