Strix Halo 能效比实测，笔记本跑 AI 到底省不省电

2600_96323197

1人浏览 · 2026-06-17 21:00:00

2600_96323197 · 2026-06-17 21:00:00 发布

拔掉电源后的真实表现：Strix Halo 能效实测

对于经常带着笔记本到处跑的开发者来说，本地跑大模型一直是个“奢侈品”。以前要么依赖云端 API，要么就得背着像砖头一样的游戏本，还得时刻找插座。最近拿到一台搭载 AMD Strix Halo 芯片的工程机，最吸引我的不是它的峰值性能，而是官方宣传的“高能效比”。到底在移动办公场景下，它能不能真的脱离电源跑 AI？我花了一周时间，模拟了真实的出差环境，从电池续航到发热噪音，做了一次彻底的“压力测试”。

电池模式 vs 插电模式：功耗曲线大揭秘

测试环境设定为典型的商务出差场景：屏幕亮度 50%，开启 Wi-Fi，后台仅保留必要的通讯软件。模型选用的是量化后的 Llama 3 8B，通过 Ollama 部署，这也是目前本地代码辅助和文档总结最常用的规格。

首先看插电模式。在性能模式下，Strix Halo 的 CPU 与 NPU 协同工作非常积极。运行生成任务时，整机功耗瞬间攀升至 65W 左右，随后稳定在 45W-50W 区间。此时风扇转速较高，能听到明显的风噪，但键盘区域温度控制在 42℃左右，手感尚可。推理速度非常快，Token 生成速率能维持在 45 tokens/s 以上，完全满足实时代码补全的需求。

真正的考验是电池模式。为了模拟真实续航，我关闭了“最佳性能”选项，让系统自动调度。

前 15 分钟：功耗控制在 25W 以内，NPU 承担了大部分推理负载，CPU 仅做轻量调度。此时 Token 速率下降至 28 tokens/s 左右，但对于阅读文档总结来说，这个速度完全无感延迟。
30 分钟后：随着电量降至 70%，系统进一步限制频率，功耗稳定在 18W-20W。有趣的是，发热量显著降低，C 面几乎感觉不到温热，风扇也进入了“静音旋转”状态，噪音几乎不可闻。
续航结果：在持续进行间歇性推理（模拟写写停停的工作流）的情况下，电池从 100% 用到 20%，坚持了约 3.5 小时。相比传统独显笔记本动辄 1 小时就没电的表现，Strix Halo 确实做到了“全天候”的底线。

CPU 与 NPU 的协同：不只是简单的分工

很多用户担心拔掉电源后 NPU 会“罢工”，或者效率极低。在这次测试中，我特意监控了硬件资源占用。Strix Halo 的架构优势在于其统一内存架构和高带宽，这让数据在 CPU、GPU 和 NPU 之间的搬运成本极低。

在使用 LM Studio 加载 14B 参数模型时，可以观察到明显的动态调度策略：

预填充阶段（Prompt Processing）：CPU 多核并行处理能力强，快速消化输入的大段文档。
解码阶段（Token Generation）：一旦进入生成环节，负载迅速平滑地转移到 NPU 上。

这种切换在任务管理器里看得很清楚，没有出现过剧烈的功耗抖动。特别是在电池模式下，NPU 的低功耗特性被充分释放。我尝试了一个长文档总结任务（输入约 1.5 万字），全程未插电。整个过程机器非常冷静，没有出现因过热导致的降频卡顿。这说明 AMD 在这代芯片上的电源管理策略非常成熟，不再是单纯堆算力，而是真正考虑了移动端的能耗平衡。

真实办公场景下的体验评估

理论数据再好，也得落地到实际工作流。我重点测试了两个高频场景：

1. 离线文档总结 在高铁或飞机上，网络不稳定是常态。我将几十页的技术 PDF 扔给本地模型，让它提取核心观点。Strix Halo 在处理长上下文时，内存带宽的优势体现出来了。即使在电池模式下，生成摘要的速度也足够流畅，不需要像以前那样盯着进度条发呆。更重要的是，整机没有变成“暖手宝”，放在小桌板上使用完全没问题。

2. 代码辅助生成 作为开发者，我最关心的是写代码时的延迟。在 VS Code 中配置本地 Copilot 插件连接 Ollama 服务。插电时，代码补全几乎是瞬时的；而在电池模式下，会有大约 0.5 秒的感知延迟，但在可接受范围内。关键在于，它让我摆脱了“必须插电源才能高效工作”的心理束缚。以前为了跑本地模型，我不得不寻找咖啡厅的插座，现在可以在会议室、机场候机厅甚至公园长椅上随时开工。

选购建议：性能与便携的平衡点

经过这一周的深度使用，如果你是一名经常出差的商务人士或独立开发者，Strix Halo 架构的笔记本确实是一个值得考虑的选择。

适合人群：需要在无网环境下处理敏感数据、运行本地大模型、对续航有硬性要求（至少 3 小时重度 AI 负载）的用户。
注意事项：虽然能效比出色，但它毕竟不是桌面级显卡。如果你需要训练大模型或进行高精度的科学计算，依然建议连接电源或使用云端算力。此外，长时间高负载下，虽然发热可控，但建议还是保持通风良好。

总的来说，Strix Halo 并没有试图在所有指标上碾压桌面端，而是精准地切中了“移动 AI"的痛点：在有限的电池容量下，提供可用的、稳定的推理能力。它让本地大模型从“实验室玩具”真正变成了“生产力工具”。

200 小时 GPU 算力已就位，快来领取：https://marketing.csdn.net/questions/Q2604140858304426315?utm_source=AIpaper