logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

构建 Claude Code 的经验:Prompt Caching 就是一切

Prompt caching 是前缀匹配。前缀里任何一处改动都会让后面全部失效。把整个系统围绕这个约束来设计,顺序对了,大部分缓存就是"免费"的。用消息更新,而不是改 prompt。日期变化、模式切换、状态更新——全部走消息流,别去碰系统提示词。不要中途换模型或工具。把状态变化(比如 Plan Mode)建模成"工具调用",而不是"工具集变更"。需要"隐藏"工具时用 defer_loading 而

文章图片
构建 Claude Code 的经验:Prompt Caching 就是一切

Prompt caching 是前缀匹配。前缀里任何一处改动都会让后面全部失效。把整个系统围绕这个约束来设计,顺序对了,大部分缓存就是"免费"的。用消息更新,而不是改 prompt。日期变化、模式切换、状态更新——全部走消息流,别去碰系统提示词。不要中途换模型或工具。把状态变化(比如 Plan Mode)建模成"工具调用",而不是"工具集变更"。需要"隐藏"工具时用 defer_loading 而

文章图片
实习生项目架构导读skill

像带教导师一样,用「先全局后局部、先业务后代码、先主干后分支」的策略,帮新入职实习生在 1-2 周内系统掌握复杂架构项目。实习生面对复杂项目的核心困境不是"看不懂语法",而是"不知道从哪看起"和"看了局部但拼不出全貌"。本 Skill 采用。

文章图片
#架构
MCP是什么?

MCP 起源于 2024 年 11 月 25 日 Anthropic 发布的文章: Introducing the Model Context Protocol。MCP (Model Context Protocol,模型上下文协议) 定义了应用程序和 AI 模型之间交换上下文信息的方式。这使得开发者能够以一致的方式将各种数据源、工具和功能连接到 AI 模型(一个中间协议层),就像 USB-C 让

文章图片
#服务器#网络#运维
关于Agent的一些思考

向量就是一组数字,比如[0.8,0.2,-0.5]就是一个三维向量(三个数字,所以是三维)—在三维空间里,这个点的位置就是 (0.8, 0.2,-0.5)低维的向量(1到3维)我们可以在坐标轴上画出来,但实际使用中,Embedding模型生成的向量维度非常高,可能有几百甚至上千维。虽然我们没法想象一个1000维的空间长什么样,但 维度越高,能表达的信息就越丰富,对文本特征的刻画就越细腻。意思相近的

文章图片
#pycharm#python
Agent 设计范式:ReAct 与 Plan-Execute-Replan

推理 + 行动它的核心思想是:Agent 一边思考,一边行动,根据工具返回的结果继续思考。你可以把 ReAct 理解成一个人解决问题的过程。比如用户问:今天北京天气怎么样?适合穿什么?思考:用户想知道北京天气和穿衣建议行动:调用天气查询工具观察:天气工具返回,北京 12℃,多云,有风思考:天气偏凉,需要穿外套回答:今天北京多云,温度较低,建议穿外套思考 → 调用工具 → 观察结果 → 再思考 →

文章图片
#python#java#个人开发 +1
AI 名词大扫盲--总结简化版

Prompt 是 Agent 的控制面板在 Agent 开发中,你能控制大模型行为的核心手段只有一个:Prompt。System Prompt 定义了 Agent 的"身份和边界",它是谁、能做什么、不能做什么、必须以什么格式输出User Prompt 和注入的内容是 Agent 的"任务输入",每次要处理的具体数据、具体问题Function Calling:本质是让大模型按精确格式输出"工具调用

文章图片
#机器学习#人工智能#数据挖掘
AI 名词大扫盲--总结简化版

Prompt 是 Agent 的控制面板在 Agent 开发中,你能控制大模型行为的核心手段只有一个:Prompt。System Prompt 定义了 Agent 的"身份和边界",它是谁、能做什么、不能做什么、必须以什么格式输出User Prompt 和注入的内容是 Agent 的"任务输入",每次要处理的具体数据、具体问题Function Calling:本质是让大模型按精确格式输出"工具调用

文章图片
#机器学习#人工智能#数据挖掘
到底了