logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

AI 基础概念

本文系统分析了大型语言模型(LLM)及其关键技术体系。LLM以超大规模参数和海量训练数据为基础,具备跨领域通用能力和涌现特性,但存在高算力需求。围绕LLM的三大关键技术包括:1)RAG通过检索外部知识库解决模型知识过时和幻觉问题;2)记忆机制分为短期会话记忆和长期知识记忆,实现交互连贯性和个性化;3)智能体(Agent)通过工具调用(MCP)和多智能体协作(A2A)形成自主任务处理能力。这些技术共

文章图片
#人工智能
一文看懂 Claude Skills 原理

Claude Skills 是 Anthropic 推出的模块化AI能力扩展方案,通过"文件系统封装+渐进式披露"机制,为智能体注入标准化领域知识。其核心特点包括:1) 模块化封装元数据、指令和资源三要素;2) 分层加载机制显著降低token消耗;3) 与MCP工具调用协议形成"知识+工具"协同;4) 支持快速构建智能导购等专业应用。该方案解决了传统智能体知

文章图片
#人工智能
MCP 实现

MCP(Model Context Protocol)是一种标准化的大语言模型工具调用交互协议,旨在实现AI工具安全高效地调用本地/远程资源。该协议定义了5个核心角色(主机、客户端、服务器、本地/远程数据源),支持两种实现方式:基于stdio的嵌入式本地调用和基于SSE的远程服务调用。MCP通过@Tool注解封装工具方法,实现与FunctionCall类似但更标准化的功能,特别强调通信协议标准化和

文章图片
#人工智能
Spring AI MCP Server Starter:快速构建MCP服务器

SpringAIMCPServerStarter是为SpringBoot应用提供MCP(模型上下文协议)服务器自动配置的组件,支持SYNC/ASYNC两种服务器类型和STDIO、WebMVCSSE、WebFluxSSE三种传输协议。它内置工具、资源、提示词、补全四大核心功能,支持变更通知、上下文传递等特性,能无缝集成SpringAI工具框架。通过自动注册SpringBean规范,开发者可以快速搭建

文章图片
#java#spring
上下文工程

上下文工程是优化大语言模型(LLM)动态上下文管理的系统性方法,旨在解决智能体在长时运行中的上下文爆炸和性能衰减问题。核心策略包括卸载、缩减、检索、隔离和缓存上下文,通过外部存储、智能摘要、语义搜索等技术降低Token消耗,提升响应效率。典型应用涵盖研究助手、多模态系统和企业自动化场景。多智能体架构通过任务分解和上下文隔离显著提升性能,但面临注意力分散、工具调用复杂等挑战。未来将聚焦自动化管理、多

文章图片
#人工智能#语言模型
一文看懂 Claude Skills 原理

Claude Skills 是 Anthropic 推出的模块化AI能力扩展方案,通过"文件系统封装+渐进式披露"机制,为智能体注入标准化领域知识。其核心特点包括:1) 模块化封装元数据、指令和资源三要素;2) 分层加载机制显著降低token消耗;3) 与MCP工具调用协议形成"知识+工具"协同;4) 支持快速构建智能导购等专业应用。该方案解决了传统智能体知

文章图片
#人工智能
MCP 实现

MCP(Model Context Protocol)是一种标准化的大语言模型工具调用交互协议,旨在实现AI工具安全高效地调用本地/远程资源。该协议定义了5个核心角色(主机、客户端、服务器、本地/远程数据源),支持两种实现方式:基于stdio的嵌入式本地调用和基于SSE的远程服务调用。MCP通过@Tool注解封装工具方法,实现与FunctionCall类似但更标准化的功能,特别强调通信协议标准化和

文章图片
#人工智能
Chain-of-Thought Prompting(CoT, 管道模式)

摘要:提示链(PromptChain)是大语言模型处理复杂任务的核心方法,通过"分而治之"将任务拆解为独立子问题,构建模块化工作流。其核心价值在于降低认知负荷、提升可解释性和可控性,突破单一提示的局限性。关键技术包括结构化输出、步骤粒度控制和错误重试机制,适用于信息处理、复杂问答、内容生成等场景。未来将向自适应、多智能体和多模态方向发展,成为构建高级AI系统的基础框架。掌握提示

#人工智能#设计模式
Reasoning-Acting(ReAct)

摘要:ReAct(推理-行动)是大语言模型智能体实现自主决策的核心范式,通过"思考→行动→反馈"闭环机制,使AI系统具备动态决策、工具集成和适应反馈的能力。该范式包含观察、思考、行动、反馈、状态更新五个步骤,解决了传统LLM在幻觉、工具集成和动态适应等方面的痛点。ReAct适用于复杂问答、任务规划、故障排查等场景,其落地需要合理设计推理Prompt、明确工具参数、设置终止条件和

#人工智能#设计模式
AI 基础概念

本文系统分析了大型语言模型(LLM)及其关键技术体系。LLM以超大规模参数和海量训练数据为基础,具备跨领域通用能力和涌现特性,但存在高算力需求。围绕LLM的三大关键技术包括:1)RAG通过检索外部知识库解决模型知识过时和幻觉问题;2)记忆机制分为短期会话记忆和长期知识记忆,实现交互连贯性和个性化;3)智能体(Agent)通过工具调用(MCP)和多智能体协作(A2A)形成自主任务处理能力。这些技术共

#人工智能
到底了