logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ryzen AI 笔记本跑通本地 Agent,Ollama 配置避坑实录

本文详解 Ryzen AI 笔记本在 Windows 下部署本地 Agent 的实战技巧。通过强制 Vulkan 后端、对齐上下文窗口及配置 HSA_OVERRIDE_GFX_VERSION 环境变量,解决 ROCm 兼容性与 GPU 利用率低的问题,助开发者打造高效稳定的私有化 AI 平台。

#Ollama
锐龙 AI 配合 OpenClaw 打造私有化自动化文档代理

本文详解如何利用 AMD Strix Halo 架构与 OpenClaw 框架,在本地构建私有化自动化文档代理。通过配置 LM Studio 的 Vulkan 后端及 128k 上下文窗口,实现敏感数据零上传的安全处理流程,为开发者提供高效、可控的 AI 知识库解决方案。

解锁 Vulkan 后端与超大上下文,释放端侧 AI 全部潜能

本文详解如何在 Ryzen AI Max+ 设备上通过 Vulkan 后端释放端侧 AI 潜能,解决 GPU 调用难题。结合 128GB 统一内存优势,突破 128k 超大上下文瓶颈,并演示 OpenClaw 自动化工作流配置。助开发者打造高效、安全的本地大模型应用,实现数据物理隔绝与流畅推理。

Strix Halo 实战,让本地大模型真正长出执行手脚

本文详解如何利用 Strix Halo 架构的超大内存优势,结合 Vulkan 后端与 OpenClaw 框架,打造高效本地 Agent。通过配置 128k 上下文窗口及优化量化模型,解决长文档处理痛点,实现安全、隐私可控的自动化工作流,让大模型真正具备本地执行力。

#Strix Halo
AMD Instinct GPU 与 ROCm 7.x 大模型推理实战效果全景

在构建高性能 AI 推理服务的过程中,开发者常常面临硬件选型迷茫与软件栈适配复杂的双重挑战。尤其是当项目从单卡验证走向多卡集群部署时,如何确保算力线性增长、显存高效利用以及框架无缝迁移,直接决定了业务落地的成败。许多团队在引入新型加速卡时,往往耗费大量时间在环境配置和算子兼容性调试上,却忽略了架构层面的核心参数与软件特性的深度结合。对于专注于大模型落地的一线工程师而言,理解底层硬件的算力构成与上层

#服务器#网络#大数据
AMD Instinct GPU 与 ROCm 7.x 大模型推理实战效果全景

在构建高性能 AI 推理服务的过程中,开发者常常面临硬件选型迷茫与软件栈适配复杂的双重挑战。尤其是当项目从单卡验证走向多卡集群部署时,如何确保算力线性增长、显存高效利用以及框架无缝迁移,直接决定了业务落地的成败。许多团队在引入新型加速卡时,往往耗费大量时间在环境配置和算子兼容性调试上,却忽略了架构层面的核心参数与软件特性的深度结合。对于专注于大模型落地的一线工程师而言,理解底层硬件的算力构成与上层

#服务器#网络#大数据
到底了