logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

双层 HITL 架构:为什么你的 AI 客服需要前置规则 + 后置兜底?

这篇文章分享我在实训设备智能客服系统中设计的**双层 HITL 架构**:前置规则拦截 + 后置兜底检测,覆盖 99% 的 HITL 场景。

文章图片
#人工智能#python
Prompt Engineering 入门到进阶:主流提示词优化策略总结

本文系统总结了Prompt Engineering(提示词工程)的主流优化策略。Prompt Engineering是通过合理组织任务、上下文与约束,引导AI模型进入正确推理路径的关键能力。文章介绍了10种核心策略:角色设定(Role Prompt)可提升专业性;零样本/少样本(Zero-shot/Few-shot)适用于不同复杂度任务;思维链(Chain of Thought)和逐步推理(Ste

文章图片
#python#开发语言
RAG 项目中的两个核心工程问题:LLM 高可用与知识库增量管理

本文探讨了RAG项目中的两个核心工程问题:LLM高可用与知识库增量管理。针对LLM高可用,介绍了双模型Fallback、Retry重试、熔断机制和分级降级等主流方案,推荐"Fallback+Retry+熔断"组合作为最优解。在知识库增量管理方面,分析了全量重建、mtime检测、Hash内容检测、事件驱动同步等方法,指出mtime检测和幂等写入是当前行业标配。文章强调这些工程化问题对生产环境的重要性

文章图片
#python#人工智能
从“能跑”到“能用”:我在智能客服 RAG 项目中踩过的两个生产级问题

本文分享了智能客服RAG项目中的两个关键生产级优化方案。首先针对LLM服务不稳定的问题,设计了Fallback兜底机制,在主模型失败时自动切换备用模型,确保服务连续性。其次解决了知识库同步难题,采用声明式同步思路,实现了新增、更新、删除文件的自动检测与处理,并重点解决了幂等性和同名文件冲突问题。作者指出,RAG项目从Demo到生产环境的真正差距在于工程化能力,包括高可用、数据同步、熔断降级等核心要

#数据库#chrome#python
LangGraph智能体记忆管理与多轮对话实战

本文介绍了在LangGraph中实现智能体记忆管理的四种方案:短期记忆(Checkpointer)、长期记忆(BaseStore)、消息裁剪和消息总结。重点演示了短期记忆和长期记忆的实现方法,通过代码示例展示了如何让Agent在同一会话中记住对话内容(短期记忆),以及如何跨会话识别用户(长期记忆)。文章提供了完整的Python代码实现,包括使用InMemorySaver和InMemoryStore

#算法#python#人工智能
到底了