logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

把实验室搬回家,打造高性价比 Radeon AI 创意工坊心得

本文分享如何利用二手 Radeon RX 6800 XT 打造高性价比 AI 创意工坊。通过 Docker 部署 ROCm 环境,成功运行 Qwen 3.6 大模型与视频生成任务。文章详解硬件选型、散热优化及本地 Agent 实战,助开发者以低成本实现隐私安全的本地化 AI 创作。

拒绝云评测,我在 Radeon 上调优 Qwen 3.6 的真实数据分享

本文分享在 Radeon RX 7900 XTX 上调优 Qwen 3.6 的实战数据。通过 ROCm 环境搭建与 INT8 量化技术,成功解决显存瓶颈,实现高效微调与推理。文章打破 CUDA 依赖,验证了 AMD 显卡运行大语言模型的可行性与高性价比。

大显存真香现场,用 Radeon 一机兼顾游戏与 AI 视觉创作

本文分享利用 Radeon 大显存显卡兼顾游戏与 AI 视觉创作的实战经验。通过 ROCm 环境搭建与 Docker 部署,实现本地视频超分及大模型推理。低成本高显存方案打破品牌偏见,为极客提供高效的双栖创作与工作流。

新手也能搞定,Radeon 显卡配置 ROCm 环境的保姆级教程

本文提供 Radeon 显卡配置 ROCm 环境的保姆级教程,助新手将游戏卡变身 AI 引擎。涵盖 Ubuntu 系统清理、核心组件安装及 PyTorch 环境搭建,避开常见兼容坑,轻松实现本地大模型推理与部署。

别只拿来打游戏,Radeon 显卡跑 Qwen 3.6 的本地部署实录

本文实录 Radeon 显卡本地部署 Qwen 3.6 的全过程。通过优化 ROCm 环境与 Linux 配置,成功在 RX 7900 XT 上实现流畅推理。文章打破 A 卡仅限游戏的刻板印象,为开发者提供高性价比的本地 AI 解决方案。

模型量化全攻略,利用 INT4 技术在笔记本上跑得更快

本文详解模型量化全攻略,聚焦 INT4 技术在 AMD Ryzen AI Strix Halo 笔记本上的实战应用。通过对比 QAT 与 PTQ 范式及工具链选型,展示 INT4 如何将大模型推理速度提升 4 倍并降低内存占用,助开发者在端侧高效部署 AI。

新手必看,Ryzen AI 上运行 Llama 模型的保姆级步骤

本文详解在 Ryzen AI 平台部署 Llama 模型的保姆级步骤。涵盖驱动更新、环境配置及 INT4 量化模型选择,指导新手利用 NPU 加速实现高效本地推理。通过实战代码与排错指南,助您快速构建隐私安全的端侧 AI 助手,释放硬件潜力。

96GB 显存有什么用,Strix Halo 本地开发体验深度解析

本文深度解析 AMD Strix Halo 架构下 96GB 显存对本地 AI 开发的变革意义。通过支持大语言模型全参数加载、多模型并发及高带宽推理,彻底打破硬件瓶颈。文章探讨如何利用该配置构建隐私安全的 RAG 系统与高效 AI Agent,实现服务器级本地开发体验。

96GB 显存有什么用,Strix Halo 本地开发体验深度解析

本文深度解析 AMD Strix Halo 架构下 96GB 显存对本地 AI 开发的变革意义。通过支持大语言模型全参数加载、多模型并发及高带宽推理,彻底打破硬件瓶颈。文章探讨如何利用该配置构建隐私安全的 RAG 系统与高效 AI Agent,实现服务器级本地开发体验。

笔记本跑大模型,AMD Ryzen AI Strix Halo 实测指南

本文实测 AMD Ryzen AI Strix Halo 在笔记本运行大模型的突破表现。凭借 96GB 统一显存,本地可流畅部署 70B 参数模型,解决显存瓶颈。结合 NPU 加速与低功耗优势,打造隐私安全的本地 AI Agent,推动端侧 AI 创新落地。

    共 17 条
  • 1
  • 2
  • 请选择