
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
今天这篇,我要把它升级成真正的 Agent:能定时执行任务、能主动推送消息、能自动化处理工作流,而且所有数据都留在本地。
在问答和对话的场景下,通常可以通过检索和生成两种方式得到一个回复。检索式回复是在外部知识库中检索出满意的回复,较为可靠和可控,但回复缺乏多样性;而生成式回复则依赖于强大的语言模型中储存的内部知识,不可控,解释性差,但能生成更丰富的回复。

MiniMind这个开源仓库很适合学习,也有小伙伴私信要求讲一下这个开源项目的架构设计,今天分享给大家.

上一篇我们跑通了一个最小 RAG:文档入库 → 向量搜索 → 喂给模型 → 得到回答。能用了,但离"好用"还差得远。
上一篇我们给 bot 装了 Memory,它终于能记住"刚聊过什么"。但还有一类问题它照样答不上来:你公司的事、你电脑里的文档、你脑子里的业务知识——它全不知道。
MindSpeed LLM作为昇腾AI生态的重要技术支撑,专为大规模语言模型设计,具有超强的计算能力和灵活的开发支持。
模型微调通常来说,虽然可以提高任务的效果,但通常来说,微调的成本远大于提示词调优,模型微调相对来说复杂性高、资源需求大而且成本高。

我看过很多 LangChain 教程,大多数上来就是"什么是 Agent""什么是 RAG",看完脑子里全是词,手上什么都没有。

整体来看,这一讲的核心结论是:AI Agent 时代,比拼的不只是模型本身,而是上下文管理、任务组织和人类设定目标与边界的能力。

本文以纯文字干货形式,拆解从 “环境准备” 到 “模型落地” 的全流程,帮你从 “不敢碰微调” 到 “做出专属 AI”,真正把大模型变成 “自己人”。







