logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

为什么我的 Radeon 显卡在跑 AI 时风扇不转,揭秘能效比真相

本文揭秘 AMD Strix Halo 平台在运行本地大模型时风扇不转的真相。通过统一内存架构与 Vulkan 后端调度,Radeon GPU 实现了卓越能效比,大幅降低功耗与发热。文章提供 LM Studio 及 Ollama 配置建议,助开发者在静音环境下高效完成 AI 推理任务。

#Strix Halo#Radeon GPU
从安装到起飞,AMD 新机部署本地 AI 的一小时极速指南

本文详解 AMD Strix Halo 架构笔记本部署本地 AI 的一小时极速指南。通过更新驱动、配置 LM Studio 的 Vulkan 后端及设置关键环境变量,充分释放 128GB 统一内存优势,实现 Qwen2.5 等模型的高效 GPU 加速推理,打造隐私安全的离线 AI 工作站。

#LM Studio
不用云服务器,我在咖啡馆用 Strix Halo 跑完了十万字小说分析

本文实测 AMD Strix Halo 架构笔记本,利用其统一内存优势,在离线环境下成功运行 Qwen2.5-14B 模型完成十万字小说分析。文章详解了长上下文配置技巧与隐私保护价值,展示了端侧 AI 处理复杂任务的强大能力,为本地大模型部署提供实战参考。

#Strix Halo
不用云服务器,我在咖啡馆用 Strix Halo 跑完了十万字小说分析

本文实测 AMD Strix Halo 架构笔记本,利用其统一内存优势,在离线环境下成功运行 Qwen2.5-14B 模型完成十万字小说分析。文章详解了长上下文配置技巧与隐私保护价值,展示了端侧 AI 处理复杂任务的强大能力,为本地大模型部署提供实战参考。

#Strix Halo
7B 还是 32B,Ryzen AI 本子上不同体量模型的真实体感

本文基于 AMD Strix Halo 架构 Ryzen AI 笔记本,实测 7B、14B 及 32B 大语言模型的性能差异。通过 Vulkan 后端调优,展示不同参数量模型在响应速度与逻辑推理上的真实体感,为开发者提供本地部署的最佳量化策略与场景选型指南。

本地大模型总崩溃,可能是你的 BIOS 和量化等级没设对

针对 AMD Strix Halo 笔记本本地大模型崩溃问题,本文详解 BIOS 设置与量化等级优化方案。通过开启 Resizable BAR、调整显存分配及选用 Q5_K_M 量化版本,有效解决闪退与卡顿,助您打造稳定高效的私有 AI 工作站。

手把手教你配 OpenClaw,把 Strix Halo 变成私有智能工作站

本文详解如何在 AMD Strix Halo 架构笔记本上,利用 LM Studio 与 OpenClaw 搭建私有智能工作站。通过配置 Vulkan 后端与 128k 上下文窗口,充分发挥统一内存优势,实现大模型本地高效推理与长文档处理,打造安全、离线的开发环境。

#Strix Halo#LM Studio
Windows 下跑 AI 别死磕 ROCm,Vulkan 才是 AMD 显卡的最优解

本文解析 Windows 下 AMD 显卡运行本地大模型的最优方案,指出 ROCm 适配不足,推荐切换至 Vulkan 后端。通过 LM Studio 配置与环境变量优化,充分释放 Strix Halo 统一内存优势,实现稳定高效的 AI 推理体验。

告别显存焦虑,128GB 统一内存让本地大模型随便跑

本文解析 AMD Strix Halo 架构如何凭借 128GB 统一内存打破显存瓶颈,实现本地大模型自由部署。通过优化 BIOS 设置,用户可轻松运行 70B 满血模型并共存向量数据库,兼顾高性能与数据隐私,开启端侧 AI 新体验。

从 BF16 到 FP8,一键切换 vLLM 推理精度提升吞吐量

本文详解在 AMD MI300X 上利用 ROCm 7.x 与 vLLM 实现从 BF16 到 FP8 的一键切换。通过 FP8 量化实战,显存占用减半且吞吐量提升超 40%,有效解决高并发瓶颈。文章提供 Docker 部署方案及压测数据,助开发者低成本优化大模型推理效率。

    共 24 条
  • 1
  • 2
  • 3
  • 请选择