Ryzen Al + Radeon GPU· 端侧 AI专栏

Ryzen Al + Radeon GPU· 端侧 AI

基于Ryzen AI NPU 和 Radeon GPU 的端侧 AI 开发平台。支持本地大模型部署、NPU推理加速、工作站级GPU算力，覆盖从笔记本到桌面全场景。

529篇内容

Hermes Agent 2026最新安装教程：全平台一键部署+避坑指南

Hermes Agent 以极致简化的部署体验和强大的智能体核心能力脱颖而出，它支持 Windows、macOS、Linux 全主流操作系统通过单行命令一键完成安装，无需繁琐的环境配置，安装后跟随内置交互式配置向导即可快速接入大模型，即刻拥有一款具备持续自主学习能力、能调用各类工具、执行复杂长程任务的智能工作伙伴；

95 

2 

C资讯 · 2026-05-27 15:18:32

私有化大模型成本骤降40%！2024最新Llama 3+RAG+量化推理架构实测：中小企业部署ChatGPT级能力的3步极简路径

中小企业低成本部署ChatGPT级能力！基于Llama 3+RAG+量化推理新架构，私有化大模型成本直降40%，实测支持本地知识库问答与轻量推理。本文结合ChatGPT行业趋势预测，提供可落地的3步极简部署路径，值得收藏。

34 

LearnFlow · 2026-05-27 15:15:36

Ryzen AI Max+ 395和 RTX 5070 Ti算力对比

主流大模型推理框架开源协议汇总核心推理引擎中，llama.cpp（MIT）和ONNX Runtime（MIT）协议最宽松，vLLM、TGI等采用Apache 2.0也可商用。本地工具如Ollama（MIT）适合快速部署，但KoboldCpp（AGPL-3.0）具有开源传染性。服务框架多采用Apache 2.0（如BentoML）。协议宽松度对比显示：MIT/BSD最自由，Apache 2.0含专

163 

zhangfeng1133 · 2026-05-27 08:27:58

#架构 #开源协议 #人工智能 +2

全网最稳！WSL/Ubuntu 环境下部署 Ollama 的踩坑实录与避坑指南

然后问："我按教程一步步来的，为什么还是不行？因为教程只告诉你"应该怎么做"，没告诉你"会在哪里出错"。本文是真实踩坑记录，按照从安装到推理的顺序，把每一个可能卡住你的点全部列出来，并给出经过验证的解决方案。配置 Ollama 最容易卡住的三个地方：1.GPU 不工作→ 99% 是 Windows 驱动版本问题2.服务启不来→ 端口冲突或 systemd 未启用3.磁盘不足→ 迁移模型目录到大分区

614 

22 

Mr.Daozhi · 2026-05-26 21:15:08

#ubuntu #linux #运维

基于Whisper与Ollama构建本地语音控制AI代理实战指南

语音识别与自然语言处理是人工智能领域的基础技术，它们使机器能够理解和响应人类语言。其核心原理是通过深度学习模型将音频信号转化为文本，再通过大语言模型解析语义并生成合理反馈。在工程实践中，本地化部署成为保障数据隐私和降低使用成本的关键需求。结合开源语音识别模型Whisper与本地大语言模型管理框架Ollama，开发者可以构建完全离线运行的智能代理系统。这类系统能够将口语化指令转化为精确的文本命令，并

333 

3 

Lord Diplock · 2026-05-26 16:57:50

#语音识别

Claude Code + Ollama + Obsidian + Windows 实现本地大模型及知识库

本文详细介绍了在Windows环境下构建本地知识库的技术方案，整合了Claude Code、Ollama和Obsidian三大工具。系统采用三层架构设计：知识存储层（Obsidian管理Markdown笔记）、AI推理层（Ollama运行本地大语言模型）和智能交互层（Claude Code作为AI Agent）。通过MCP协议实现组件间通信，支持自然语言指令处理、笔记内容分析和智能问答等功能。文章

445 

千江明月 · 2026-05-26 16:47:45

#windows

基于Ollama与AST-RAG构建本地智能代码搜索系统

代码搜索是软件开发中的基础需求，其核心原理是从海量源代码中快速定位目标片段。传统的关键词匹配技术难以理解代码的语义和结构，导致查准率和查全率低下。检索增强生成（RAG）技术通过结合向量检索的效率和大型语言模型的推理能力，为语义搜索提供了新的技术价值。它首先将文档（或代码）切分为片段并向量化存储，检索时根据查询语义召回最相关的片段，再交由大模型生成精准答案。在代码搜索这一特定应用场景中，结合抽象语法

180 

7 

不想不见 · 2026-05-26 16:26:10

#RAG

Linux内核里Radeon显卡驱动是如何“活”起来的？从drm_get_pci_dev到radeon_driver_load_kms的完整流程解析

本文深入解析了Linux内核中Radeon显卡驱动的初始化流程，从硬件识别到驱动加载的完整过程。详细介绍了从drm_get_pci_dev到radeon_driver_load_kms的关键步骤，包括PCI设备匹配、DRM框架介入、Radeon专属初始化等核心环节，帮助开发者理解GPU驱动的工作原理和调试方法。

184 

7 

为了晴子 · 2026-05-26 15:20:03

#GPU

基于Ollama与AST感知RAG构建本地智能代码搜索系统

在大型软件开发中，代码库的复杂性和规模常常使其成为难以理解的“黑盒”，开发者面临定位特定功能或逻辑的挑战。传统文本搜索基于字符串匹配，难以应对代码重构、语义模糊及深层嵌套等问题。检索增强生成（RAG）技术通过结合信息检索与大型语言模型的生成能力，为代码理解提供了新思路。其核心原理是将非结构化数据（如代码）转化为向量表示，通过语义相似度匹配实现精准检索，再结合上下文生成答案。该技术能显著提升代码导航

121 

4 

董云舟 · 2026-05-26 15:16:28

#RAG

现在不重做AI工具选型，2026年Q1将面临API停服、许可证锁死、推理成本飙升三重断崖——附迁移倒计时表

规避2026年AI工具停服与成本危机，本《2026年AI工具选型指南》提供API兼容性评估、许可证迁移路径及推理成本测算三步法，覆盖企业级AI应用全场景。含精准迁移倒计时表与厂商替代清单，助团队平稳过渡，值得收藏。

208 

QuickProceed · 2026-05-26 14:03:36