
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章摘要:作者在使用AI IDE开发个人项目时,发现AI经常忘记按要求重启后端服务。通过实践发现,仅将规则写入长期记忆文件效果不稳定,关键问题在于规则表达不够工程化。作者提出分层解决方案:1)在记忆文件中只保留简洁明确的入口指令;2)将复杂流程封装到可复用的脚本中;3)建立健康检查机制。最终形成"AI判断+脚本执行+检查验收"的工作模式,显著提升了稳定性。核心启示是:AI开发需要将自然语言规则转化
RAG 不是简单的“上传文档让 AI 聊天”。用户提问→ 系统从外部资料中检索相关内容→ 大模型基于这些资料生成答案模型不知道私有资料模型知识可能过时模型容易编造长文档不能全部塞进上下文如果只是想先体验 RAG,不需要一开始就研究向量数据库和开发框架。DifyRAGFlowOpen WebUIFastGPT上传资料后,AI 怎么基于资料回答什么问题能答准什么问题容易答错为什么引用来源重要为什么文档
摘要: MCP(Model Context Protocol)是一种标准化协议,旨在解决AI调用外部工具的碎片化问题。不同于Function Calling或Plugin等方案,MCP通过统一工具接入、发现和调用方式,构建了AI与外部能力的"接口标准层"。其核心包含Client(LLM)、Server(能力提供方)和Tool(执行单元)三个角色,形成"LLM→MCP
这篇文章深入解析了MCP工具调用的底层机制。核心观点是:MCP本质是一个工具调度协议,而非AI能力本身。整个流程分为四个关键步骤:1)工具通过Schema声明注册到MCP Server;2)Client通过发现机制获取工具列表;3)LLM基于工具描述自主决策调用哪个工具;4)MCP系统执行具体调用并返回结果。文章特别强调,LLM仅负责决策"做什么",MCP负责"怎么做
本文深入解析了LLM(大语言模型)调用工具(Tool)的工作原理,澄清了三个核心问题:1)工具能被调用是因为其描述被转化为文本并注入提示词(Prompt),而非模型直接感知;2)模型调用工具的行为是通过训练学习在特定场景生成结构化调用格式;3)严格的JSON参数输出是训练数据、Schema约束、提示词限制和解码策略共同作用的结果。文章强调,LLM本质上只是处理文本输入和生成,所有"智能&
本文介绍了如何用Python开发一个最小MCP Server并模拟Client调用MCP的过程。作者从MCP的认知和底层原理出发,强调理解协议思想比语言更重要。文章详细拆解了MCP Server和Client的开发步骤,包括Tool注册、Schema生成、请求路由等核心机制,并类比Java开发者熟悉的SpringBoot和RPC概念。最终指出MCP本质是连接函数调用与自然语言的翻译层,通过结构化协
DeepSeek API最新推出的上下文缓存功能引发关注。该功能并非缓存最终回答结果,而是缓存模型处理重复输入前缀时的中间计算状态,包括重复提示词、长上下文中间结果等。与传统缓存不同,它不固定输出内容,仍受温度参数等影响保持随机性。该技术特别适合多轮对话、长文档问答等场景,能显著降低重复处理相同上下文的计算成本。开发者可通过优化提示词结构(稳定内容前置)来提高缓存命中率,并通过API返回的缓存命中
本文介绍了作者开发的一个"Claude Web"项目,旨在解决Claude Code工具在移动端使用不便的问题。该项目通过Web界面将原本只能在终端使用的Claude Code功能迁移到浏览器,并利用Cloudflare Tunnel实现内网穿透,让用户可以通过手机浏览器远程操作本地电脑上的代码项目。文章详细阐述了项目的设计思路、技术架构和关键功能点,包括访问控制、工作目录设置、代理配置、API对
摘要: Agent Learning Lab 是一个专注于AI应用开发学习的实验项目,通过模块化设计拆解Prompt、结构化输出、RAG等核心能力,提供可观察、可调试的白盒化实验环境。项目定位为开发者学习平台,强调过程展示(如模型原始输出、检索来源、耗时等)和技术文档沉淀。目前已实现基础模块,未来计划扩展联网搜索、Function Call、Workflow Agent等功能,逐步构建完整的Age
DeepSeek API最新推出的上下文缓存功能引发关注。该功能并非缓存最终回答结果,而是缓存模型处理重复输入前缀时的中间计算状态,包括重复提示词、长上下文中间结果等。与传统缓存不同,它不固定输出内容,仍受温度参数等影响保持随机性。该技术特别适合多轮对话、长文档问答等场景,能显著降低重复处理相同上下文的计算成本。开发者可通过优化提示词结构(稳定内容前置)来提高缓存命中率,并通过API返回的缓存命中







