
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章摘要:AI模型服务熔断机制的轻量级实现 本文介绍了一种为AI模型服务设计的轻量级熔断机制实现方案。当调用Chat、Embedding等AI模型服务时,常会遇到超时、限流等问题,熔断机制可避免持续调用故障服务。方案采用三个状态(CLOSED、OPEN、HALF_OPEN)管理模型健康度,通过记录连续失败次数、熔断时间和半开探测标记,实现自动熔断和恢复。核心逻辑包括:调用前检查状态、成功时重置健康
文章摘要:AI模型服务熔断机制的轻量级实现 本文介绍了一种为AI模型服务设计的轻量级熔断机制实现方案。当调用Chat、Embedding等AI模型服务时,常会遇到超时、限流等问题,熔断机制可避免持续调用故障服务。方案采用三个状态(CLOSED、OPEN、HALF_OPEN)管理模型健康度,通过记录连续失败次数、熔断时间和半开探测标记,实现自动熔断和恢复。核心逻辑包括:调用前检查状态、成功时重置健康
这篇文章总结了GitHub高赞项目learn-claude-code的学习笔记,系统梳理了Claude Code的工作原理。笔记从S01到S12逐章解析核心知识点: S01基础骨架:展示最核心的4步循环结构(调用模型、检查工具需求、执行工具、返回结果) S02新增工具分发表:从单一工具扩展到可扩展工具系统 S03新增TodoManager:在基础loop上增加内存级任务规划功能 S04引入子age
这几个步骤解决后 基本上就没有问题了。

Claude Code 等主流 Agent 工具为何不用 RAG? 核心原因:代码场景需要精确匹配而非语义相似,传统 RAG 会引入噪声干扰 替代方案:采用 Agentic Search(智能体搜索): 实时工具:Glob查路径、Grep查内容、Read读文件 无需预处理索引,像工程师一样动态探索代码库 RAG 缺陷:准确性不足、索引易过时、安全风险、运维复杂 RAG 适用场景: 大规模静态文档(

本文总结了治理大模型+RAG系统幻觉问题的系统性方案。核心观点是:不能仅依赖Prompt解决幻觉问题,而应从完整链路进行治理,包括文档源治理、文本切分优化、检索召回质量提升、上下文合理组装、Prompt约束、拒答机制、答案校验等9个层面。文章详细分析了RAG幻觉的4种常见来源,并针对每个环节提出了具体优化建议,如文档版本管理、混合检索策略、reranker重排序、生成参数控制等。最终强调需要建立评
本文总结了治理大模型+RAG系统幻觉问题的系统性方案。核心观点是:不能仅依赖Prompt解决幻觉问题,而应从完整链路进行治理,包括文档源治理、文本切分优化、检索召回质量提升、上下文合理组装、Prompt约束、拒答机制、答案校验等9个层面。文章详细分析了RAG幻觉的4种常见来源,并针对每个环节提出了具体优化建议,如文档版本管理、混合检索策略、reranker重排序、生成参数控制等。最终强调需要建立评
这篇文章总结了GitHub高赞项目learn-claude-code的学习笔记,系统梳理了Claude Code的工作原理。笔记从S01到S12逐章解析核心知识点: S01基础骨架:展示最核心的4步循环结构(调用模型、检查工具需求、执行工具、返回结果) S02新增工具分发表:从单一工具扩展到可扩展工具系统 S03新增TodoManager:在基础loop上增加内存级任务规划功能 S04引入子age
当上下文超过阈值后,会调用模型生成结构化摘要,把多轮历史压缩成一条摘要消息。已完成的操作当前项目结构用户核心需求尚未完成的任务关键修改的前后值用户消息 + AI 回复 + thinking + 工具请求 + 工具结果 + 多轮文件修改记录 ...[对话已压缩,完整记录保留在事件日志中]1) 已完成的操作- 创建了 package.json、vite.config.js、index.html、src

当上下文超过阈值后,会调用模型生成结构化摘要,把多轮历史压缩成一条摘要消息。已完成的操作当前项目结构用户核心需求尚未完成的任务关键修改的前后值用户消息 + AI 回复 + thinking + 工具请求 + 工具结果 + 多轮文件修改记录 ...[对话已压缩,完整记录保留在事件日志中]1) 已完成的操作- 创建了 package.json、vite.config.js、index.html、src








