logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

LLM - 从 MCP 到 Skills:2025 年 AI Agent 的工程实践全景解析

摘要: AI Agent技术正从概念走向落地,通用Agent虽功能全面但成功率低,垂直场景Agent(如Coding Agent)表现更优。MCP协议解决了Agent与工具/数据的连接问题,而Skills层通过可复用的“技能包”提升了任务执行的稳定性。上下文工程通过精准控制信息输入(写入、选择、压缩、隔离)优化决策质量。未来Agent将演变为以LLM为核心、工具为外设的云端计算环境,需结合工程化方

文章图片
#人工智能#MCP
LLM - 单Agent和多Agent 架构的需求思考和实现路径

AI系统正从单体智能转向多智能体协作架构。早期Copilot主要完成简单任务,而现代Agent系统已能深入业务流程,承担专业角色。单体智能架构简单但面临职责过载等问题,多智能体通过角色拆分实现模块化协作,但需解决通信与调试难题。关键设计包括记忆体系(短期/长期、共享/私有)和护栏系统(行为边界、安全过滤)。建议项目初期采用单体验证核心价值,逐步拆分为多智能体并关注产业协议标准。产品设计应从&quo

文章图片
#架构
LLM - 单Agent和多Agent 架构的需求思考和实现路径

AI系统正从单体智能转向多智能体协作架构。早期Copilot主要完成简单任务,而现代Agent系统已能深入业务流程,承担专业角色。单体智能架构简单但面临职责过载等问题,多智能体通过角色拆分实现模块化协作,但需解决通信与调试难题。关键设计包括记忆体系(短期/长期、共享/私有)和护栏系统(行为边界、安全过滤)。建议项目初期采用单体验证核心价值,逐步拆分为多智能体并关注产业协议标准。产品设计应从&quo

文章图片
#架构
LLM - 生产级 AI Agent 设计手册:从感知、记忆到决策执行的全链路架构解析

本文提出构建生产级智能体AI系统的7层架构方法论,旨在解决企业场景下智能体系统可控、可观测、可演进的需求。7个核心层级包括:目标与价值对齐层(定义业务目标与约束)、感知与数据接入层(多源数据统一接入)、记忆与知识管理层(长期知识与短期记忆管理)、规划与决策层(任务分解与策略编排)、行动执行层(工具调用与系统集成)、反馈与优化层(多维度反馈采集与持续优化)、安全与监控层(风险控制与合规审计)。文章详

文章图片
#人工智能#架构
Vibe Coding - 告别上下文长度焦虑:Claude Context 让 AI 读懂你的整个代码库

摘要: Claude Context 是一款开源 MCP 插件,通过语义搜索技术突破 AI 编码助手的上下文窗口限制。它能智能解析代码库(支持多种语言),利用 AST 分块和向量数据库(如 Zilliz Cloud)建立索引,在用户提问时精准检索相关代码片段注入上下文,而非全量加载。相比传统方式可降低 40% Token 消耗,兼容 Claude Code、VS Code 等主流工具,并提供核心库

文章图片
LLM - AI智能体(AI Agent)设计实战全解:核心要素、架构剖析与落地实践

本文系统阐述了AI智能体的设计原理与实现方法。首先指出AI智能体的核心价值在于业务流程自动化、个性化决策支持和复杂环境适应能力。接着详细解析了智能体架构的四大核心模块:认知引擎(模型选型与参数配置)、任务规划器(目标拆解)、工具集成(外部能力增强)和记忆模块(上下文管理)。文章提供了技术选型建议,并以旅游助手为例展示了开发流程,包括意图识别、任务拆解、工具调用和记忆编排。最后总结了常见误区,并展望

文章图片
大模型开发 - 24 Embeddings Model API:深入解析 Spring AI Embeddings Model API_构建语义理解的基石

Spring AI Embeddings API 实战指南:语义向量生成与智能应用 摘要 本文介绍了Spring AI中Embeddings API的核心功能,该API提供统一接口实现文本语义向量生成,支持跨平台模型切换。主要内容包括:Embeddings技术原理(将文本转换为保留语义的浮点数向量)、Spring AI的设计哲学(可移植性和简洁性)、核心接口EmbeddingModel的功能解析,

文章图片
大模型开发 - 29 Tool Calling:大模型与业务系统集成的利器 _Tool Calling 实战指南

本文介绍了大模型开发中的Tool Calling功能及其在智能票务场景下的应用。Tool Calling允许大模型主动调用外部函数,实现业务操作和信息增强。文章以Spring AI框架为例,展示了如何通过@Tool和@ToolParam注解将业务方法注册为大模型工具,并给出了具体代码实现。该技术解决了大模型无法访问私有数据和执行操作的问题,使其能够完成退票等实际业务需求,同时保证安全可控。

文章图片
大模型开发 - 04 QuickStart_DeepSeek 模型调用流程源码解析:从 Prompt 到远程请求

本文深入解析了Spring AI框架调用DeepSeek大语言模型的完整流程。从最简入口chatModel.call("Hello")开始,通过封装Prompt对象、构建API请求体,最终通过RestClient发起远程调用。文章重点剖析了三个核心环节:(1)Prompt消息结构化处理,(2)Spring Retry的容错重试机制,(3)响应结果的反序列化封装。整体架构采用统一

文章图片
LLM -理解LLM、RAG、AI Agent:三层架构的本质、工程落地与应用范式

本文探讨了LLM(大型语言模型)、RAG(知识增强检索生成)和Agent(AI智能体)三者在AI系统中的协同关系。LLM作为AI大脑提供自然语言理解与生成能力;RAG通过外部知识检索增强AI的事实准确性;Agent则赋予AI多步骤决策和任务执行能力。文章分析了各层级的工程挑战与优化方案,如RAG的混合检索策略和Agent的防死循环机制,并提供了企业客服、智能出行等实际案例。核心观点认为三者并非替代

文章图片
#人工智能#RAG
    共 323 条
  • 1
  • 2
  • 3
  • 33
  • 请选择