
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
这篇文章分享我在实训设备智能客服系统中设计的**双层 HITL 架构**:前置规则拦截 + 后置兜底检测,覆盖 99% 的 HITL 场景。

本文系统总结了Prompt Engineering(提示词工程)的主流优化策略。Prompt Engineering是通过合理组织任务、上下文与约束,引导AI模型进入正确推理路径的关键能力。文章介绍了10种核心策略:角色设定(Role Prompt)可提升专业性;零样本/少样本(Zero-shot/Few-shot)适用于不同复杂度任务;思维链(Chain of Thought)和逐步推理(Ste

本文探讨了RAG项目中的两个核心工程问题:LLM高可用与知识库增量管理。针对LLM高可用,介绍了双模型Fallback、Retry重试、熔断机制和分级降级等主流方案,推荐"Fallback+Retry+熔断"组合作为最优解。在知识库增量管理方面,分析了全量重建、mtime检测、Hash内容检测、事件驱动同步等方法,指出mtime检测和幂等写入是当前行业标配。文章强调这些工程化问题对生产环境的重要性

本文分享了智能客服RAG项目中的两个关键生产级优化方案。首先针对LLM服务不稳定的问题,设计了Fallback兜底机制,在主模型失败时自动切换备用模型,确保服务连续性。其次解决了知识库同步难题,采用声明式同步思路,实现了新增、更新、删除文件的自动检测与处理,并重点解决了幂等性和同名文件冲突问题。作者指出,RAG项目从Demo到生产环境的真正差距在于工程化能力,包括高可用、数据同步、熔断降级等核心要
本文介绍了在LangGraph中实现智能体记忆管理的四种方案:短期记忆(Checkpointer)、长期记忆(BaseStore)、消息裁剪和消息总结。重点演示了短期记忆和长期记忆的实现方法,通过代码示例展示了如何让Agent在同一会话中记住对话内容(短期记忆),以及如何跨会话识别用户(长期记忆)。文章提供了完整的Python代码实现,包括使用InMemorySaver和InMemoryStore







