
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
这篇文章就为你准备了一条 从概念 → 动手 → 项目实战 → 进阶体系 的完整学习路径,让你从零开始掌握 AI Agent。
随着AI Agent市场的越发火爆,为了让用户全面了解AI Agent并积极参与生态构建,一些公司相继推出了官方智能体相关的解读及白皮书。

此篇重点记录下小白在开发过程中可能产生的一些问题和疑问的解答(含代码~),部分内容如messages该如何组织适配agent应用因篇幅原因会在下一文联合上下文处理一起介绍。

本文将深入探讨,如何有效利用包括文本、表格、图像等多模态数据,构建多模态知识库,打造大模型的数据引擎,从而解决深度应用大模型技术的主要难点。

有时候单一的提示词模版无法满足复杂的任务需求,因此需要结合选择器使大模型有更加准确的判断,尤其是在高度上下文依赖性的对话或生成任务时,动态的选择最合适的示例或者提示词时尤其重要。
最近读到一篇让我重新审视整个AI行业的论文。这篇来自伦敦大学学院和西班牙SciTheWorld的白皮书,标题叫《Advances in Agentic AI: Back to the Future》。作者花了十年时间,从算法交易这个极端复杂的领域出发,推导出一套关于AI落地的完整框架。读完之后,我对很多之前想不通的问题,突然有了答案。比如:为什么各大厂都在喊AI Agent,但真正跑通的案例那么少
我在这个项目中使用 Gemma3 + Mistral OCR + RAG 创建了一个能够支持包含表格、发票、文本和图表的多模态 PDF 文档问答系统。

《Build a Large Language Model (From Scratch)》是机器学习和 AI 研究员、畅销书《 Python 机器学习》的作者Sebastian Raschka 所著的一本新书,旨在为读者揭示从零开始构建大型语言模型(LLM)的全过程。

大语言模型(LLM)能够执行各种自然语言任务,例如文本生成、语言翻译、文本摘要、问答等。然而,使用 LLM 的一个显著局限是 LLM 幻觉。

纯写业务CRUD的岗位会被AI大幅替代,但懂技术、懂业务、懂工程化的人会更值钱。下面按“技术延伸型、技术+业务型、非技术转型型”三大类,做深度分析与路径建议。







