小小工匠个人主页

@yangshangwei

小小工匠

2022-06-24 21:21:52 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LLM - 从 MCP 到 Skills：2025 年 AI Agent 的工程实践全景解析

摘要： AI Agent技术正从概念走向落地，通用Agent虽功能全面但成功率低，垂直场景Agent（如Coding Agent）表现更优。MCP协议解决了Agent与工具/数据的连接问题，而Skills层通过可复用的“技能包”提升了任务执行的稳定性。上下文工程通过精准控制信息输入（写入、选择、压缩、隔离）优化决策质量。未来Agent将演变为以LLM为核心、工具为外设的云端计算环境，需结合工程化方

#人工智能 #MCP

LLM - 单Agent和多Agent 架构的需求思考和实现路径

AI系统正从单体智能转向多智能体协作架构。早期Copilot主要完成简单任务，而现代Agent系统已能深入业务流程，承担专业角色。单体智能架构简单但面临职责过载等问题，多智能体通过角色拆分实现模块化协作，但需解决通信与调试难题。关键设计包括记忆体系（短期/长期、共享/私有）和护栏系统（行为边界、安全过滤）。建议项目初期采用单体验证核心价值，逐步拆分为多智能体并关注产业协议标准。产品设计应从&quo

#架构

LLM - 单Agent和多Agent 架构的需求思考和实现路径

#架构

LLM - 生产级 AI Agent 设计手册：从感知、记忆到决策执行的全链路架构解析

本文提出构建生产级智能体AI系统的7层架构方法论，旨在解决企业场景下智能体系统可控、可观测、可演进的需求。7个核心层级包括：目标与价值对齐层（定义业务目标与约束）、感知与数据接入层（多源数据统一接入）、记忆与知识管理层（长期知识与短期记忆管理）、规划与决策层（任务分解与策略编排）、行动执行层（工具调用与系统集成）、反馈与优化层（多维度反馈采集与持续优化）、安全与监控层（风险控制与合规审计）。文章详

#人工智能 #架构

Vibe Coding - 告别上下文长度焦虑：Claude Context 让 AI 读懂你的整个代码库

摘要： Claude Context 是一款开源 MCP 插件，通过语义搜索技术突破 AI 编码助手的上下文窗口限制。它能智能解析代码库（支持多种语言），利用 AST 分块和向量数据库（如 Zilliz Cloud）建立索引，在用户提问时精准检索相关代码片段注入上下文，而非全量加载。相比传统方式可降低 40% Token 消耗，兼容 Claude Code、VS Code 等主流工具，并提供核心库

LLM - AI智能体(AI Agent)设计实战全解：核心要素、架构剖析与落地实践

本文系统阐述了AI智能体的设计原理与实现方法。首先指出AI智能体的核心价值在于业务流程自动化、个性化决策支持和复杂环境适应能力。接着详细解析了智能体架构的四大核心模块：认知引擎（模型选型与参数配置）、任务规划器（目标拆解）、工具集成（外部能力增强）和记忆模块（上下文管理）。文章提供了技术选型建议，并以旅游助手为例展示了开发流程，包括意图识别、任务拆解、工具调用和记忆编排。最后总结了常见误区，并展望

大模型开发 - 24 Embeddings Model API：深入解析 Spring AI Embeddings Model API_构建语义理解的基石

Spring AI Embeddings API 实战指南：语义向量生成与智能应用摘要本文介绍了Spring AI中Embeddings API的核心功能，该API提供统一接口实现文本语义向量生成，支持跨平台模型切换。主要内容包括：Embeddings技术原理（将文本转换为保留语义的浮点数向量）、Spring AI的设计哲学（可移植性和简洁性）、核心接口EmbeddingModel的功能解析，

大模型开发 - 29 Tool Calling：大模型与业务系统集成的利器 _Tool Calling 实战指南

本文介绍了大模型开发中的Tool Calling功能及其在智能票务场景下的应用。Tool Calling允许大模型主动调用外部函数，实现业务操作和信息增强。文章以Spring AI框架为例，展示了如何通过@Tool和@ToolParam注解将业务方法注册为大模型工具，并给出了具体代码实现。该技术解决了大模型无法访问私有数据和执行操作的问题，使其能够完成退票等实际业务需求，同时保证安全可控。

大模型开发 - 04 QuickStart_DeepSeek 模型调用流程源码解析：从 Prompt 到远程请求

本文深入解析了Spring AI框架调用DeepSeek大语言模型的完整流程。从最简入口chatModel.call("Hello")开始，通过封装Prompt对象、构建API请求体，最终通过RestClient发起远程调用。文章重点剖析了三个核心环节：(1)Prompt消息结构化处理，(2)Spring Retry的容错重试机制，(3)响应结果的反序列化封装。整体架构采用统一

LLM -理解LLM、RAG、AI Agent：三层架构的本质、工程落地与应用范式

本文探讨了LLM（大型语言模型）、RAG（知识增强检索生成）和Agent（AI智能体）三者在AI系统中的协同关系。LLM作为AI大脑提供自然语言理解与生成能力；RAG通过外部知识检索增强AI的事实准确性；Agent则赋予AI多步骤决策和任务执行能力。文章分析了各层级的工程挑战与优化方案，如RAG的混合检索策略和Agent的防死循环机制，并提供了企业客服、智能出行等实际案例。核心观点认为三者并非替代

#人工智能 #RAG

共 323 条

请选择