Strix Halo 能效比实测,笔记本跑 AI 到底省不省电
拔掉电源后的真实表现:Strix Halo 能效实测
对于经常带着笔记本到处跑的开发者来说,本地跑大模型一直是个“奢侈品”。以前要么依赖云端 API,要么就得背着像砖头一样的游戏本,还得时刻找插座。最近拿到一台搭载 AMD Strix Halo 芯片的工程机,最吸引我的不是它的峰值性能,而是官方宣传的“高能效比”。到底在移动办公场景下,它能不能真的脱离电源跑 AI?我花了一周时间,模拟了真实的出差环境,从电池续航到发热噪音,做了一次彻底的“压力测试”。
电池模式 vs 插电模式:功耗曲线大揭秘
测试环境设定为典型的商务出差场景:屏幕亮度 50%,开启 Wi-Fi,后台仅保留必要的通讯软件。模型选用的是量化后的 Llama 3 8B,通过 Ollama 部署,这也是目前本地代码辅助和文档总结最常用的规格。
首先看插电模式。在性能模式下,Strix Halo 的 CPU 与 NPU 协同工作非常积极。运行生成任务时,整机功耗瞬间攀升至 65W 左右,随后稳定在 45W-50W 区间。此时风扇转速较高,能听到明显的风噪,但键盘区域温度控制在 42℃左右,手感尚可。推理速度非常快,Token 生成速率能维持在 45 tokens/s 以上,完全满足实时代码补全的需求。
真正的考验是电池模式。为了模拟真实续航,我关闭了“最佳性能”选项,让系统自动调度。
- 前 15 分钟:功耗控制在 25W 以内,NPU 承担了大部分推理负载,CPU 仅做轻量调度。此时 Token 速率下降至 28 tokens/s 左右,但对于阅读文档总结来说,这个速度完全无感延迟。
- 30 分钟后:随着电量降至 70%,系统进一步限制频率,功耗稳定在 18W-20W。有趣的是,发热量显著降低,C 面几乎感觉不到温热,风扇也进入了“静音旋转”状态,噪音几乎不可闻。
- 续航结果:在持续进行间歇性推理(模拟写写停停的工作流)的情况下,电池从 100% 用到 20%,坚持了约 3.5 小时。相比传统独显笔记本动辄 1 小时就没电的表现,Strix Halo 确实做到了“全天候”的底线。
CPU 与 NPU 的协同:不只是简单的分工
很多用户担心拔掉电源后 NPU 会“罢工”,或者效率极低。在这次测试中,我特意监控了硬件资源占用。Strix Halo 的架构优势在于其统一内存架构和高带宽,这让数据在 CPU、GPU 和 NPU 之间的搬运成本极低。
在使用 LM Studio 加载 14B 参数模型时,可以观察到明显的动态调度策略:
- 预填充阶段(Prompt Processing):CPU 多核并行处理能力强,快速消化输入的大段文档。
- 解码阶段(Token Generation):一旦进入生成环节,负载迅速平滑地转移到 NPU 上。
这种切换在任务管理器里看得很清楚,没有出现过剧烈的功耗抖动。特别是在电池模式下,NPU 的低功耗特性被充分释放。我尝试了一个长文档总结任务(输入约 1.5 万字),全程未插电。整个过程机器非常冷静,没有出现因过热导致的降频卡顿。这说明 AMD 在这代芯片上的电源管理策略非常成熟,不再是单纯堆算力,而是真正考虑了移动端的能耗平衡。
真实办公场景下的体验评估
理论数据再好,也得落地到实际工作流。我重点测试了两个高频场景:
1. 离线文档总结 在高铁或飞机上,网络不稳定是常态。我将几十页的技术 PDF 扔给本地模型,让它提取核心观点。Strix Halo 在处理长上下文时,内存带宽的优势体现出来了。即使在电池模式下,生成摘要的速度也足够流畅,不需要像以前那样盯着进度条发呆。更重要的是,整机没有变成“暖手宝”,放在小桌板上使用完全没问题。
2. 代码辅助生成 作为开发者,我最关心的是写代码时的延迟。在 VS Code 中配置本地 Copilot 插件连接 Ollama 服务。插电时,代码补全几乎是瞬时的;而在电池模式下,会有大约 0.5 秒的感知延迟,但在可接受范围内。关键在于,它让我摆脱了“必须插电源才能高效工作”的心理束缚。以前为了跑本地模型,我不得不寻找咖啡厅的插座,现在可以在会议室、机场候机厅甚至公园长椅上随时开工。
选购建议:性能与便携的平衡点
经过这一周的深度使用,如果你是一名经常出差的商务人士或独立开发者,Strix Halo 架构的笔记本确实是一个值得考虑的选择。
- 适合人群:需要在无网环境下处理敏感数据、运行本地大模型、对续航有硬性要求(至少 3 小时重度 AI 负载)的用户。
- 注意事项:虽然能效比出色,但它毕竟不是桌面级显卡。如果你需要训练大模型或进行高精度的科学计算,依然建议连接电源或使用云端算力。此外,长时间高负载下,虽然发热可控,但建议还是保持通风良好。
总的来说,Strix Halo 并没有试图在所有指标上碾压桌面端,而是精准地切中了“移动 AI"的痛点:在有限的电池容量下,提供可用的、稳定的推理能力。它让本地大模型从“实验室玩具”真正变成了“生产力工具”。
200 小时 GPU 算力已就位,快来领取:https://marketing.csdn.net/questions/Q2604140858304426315?utm_source=AIpaper
更多推荐



所有评论(0)