代码丰个人主页

@qq_44716086

代码丰

2023-07-16 11:22:56 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

调用多个AI 模型时，如何实现一个简单的熔断机制

文章摘要：AI模型服务熔断机制的轻量级实现本文介绍了一种为AI模型服务设计的轻量级熔断机制实现方案。当调用Chat、Embedding等AI模型服务时，常会遇到超时、限流等问题，熔断机制可避免持续调用故障服务。方案采用三个状态（CLOSED、OPEN、HALF_OPEN）管理模型健康度，通过记录连续失败次数、熔断时间和半开探测标记，实现自动熔断和恢复。核心逻辑包括：调用前检查状态、成功时重置健康

#人工智能

调用多个AI 模型时，如何实现一个简单的熔断机制

#人工智能

Github高赞项目50K learn-claude-code 的学习笔记总结

这篇文章总结了GitHub高赞项目learn-claude-code的学习笔记，系统梳理了Claude Code的工作原理。笔记从S01到S12逐章解析核心知识点： S01基础骨架：展示最核心的4步循环结构（调用模型、检查工具需求、执行工具、返回结果） S02新增工具分发表：从单一工具扩展到可扩展工具系统 S03新增TodoManager：在基础loop上增加内存级任务规划功能 S04引入子age

#github #学习

Claude Code 终端死活登录不上的踩坑总结

这几个步骤解决后基本上就没有问题了。

为什么 Claude Code 等主流 Agent 工具不使用 RAG，以及 RAG 的适用场景

Claude Code 等主流 Agent 工具为何不用 RAG？核心原因：代码场景需要精确匹配而非语义相似，传统 RAG 会引入噪声干扰替代方案：采用 Agentic Search（智能体搜索）：实时工具：Glob查路径、Grep查内容、Read读文件无需预处理索引，像工程师一样动态探索代码库 RAG 缺陷：准确性不足、索引易过时、安全风险、运维复杂 RAG 适用场景：大规模静态文档（

大模型 + RAG 幻觉治理方案总结

本文总结了治理大模型+RAG系统幻觉问题的系统性方案。核心观点是：不能仅依赖Prompt解决幻觉问题，而应从完整链路进行治理，包括文档源治理、文本切分优化、检索召回质量提升、上下文合理组装、Prompt约束、拒答机制、答案校验等9个层面。文章详细分析了RAG幻觉的4种常见来源，并针对每个环节提出了具体优化建议，如文档版本管理、混合检索策略、reranker重排序、生成参数控制等。最终强调需要建立评

#人工智能 #算法 #数据库

大模型 + RAG 幻觉治理方案总结

#人工智能 #算法 #数据库

Github高赞项目50K learn-claude-code 的学习笔记总结

#github #学习

魔改鱼皮的 AI 零代码应用：加入 LangGraph 工作流、思维链可视化、三层压缩和 TODO 任务规划

当上下文超过阈值后，会调用模型生成结构化摘要，把多轮历史压缩成一条摘要消息。已完成的操作当前项目结构用户核心需求尚未完成的任务关键修改的前后值用户消息 + AI 回复 + thinking + 工具请求 + 工具结果 + 多轮文件修改记录 ...[对话已压缩，完整记录保留在事件日志中]1) 已完成的操作- 创建了 package.json、vite.config.js、index.html、src

#人工智能

魔改鱼皮的 AI 零代码应用：加入 LangGraph 工作流、思维链可视化、三层压缩和 TODO 任务规划

#人工智能

共 21 条

请选择