
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
你现在很可能遇到过这种“离谱但真实”的需求:

Agent 跑久后变慢、重复、忘规则,很多时候不是模型问题,而是上下文管线失控。本文用 3 个可复现实验拆解全量历史、工具结果和 schema 膨胀。

用 structlog/loguru 把 turn、tokens、tool、latency 写进 JSON 日志,并用一段 Python 快速定位最费 token 的轮次。

Model Context Protocol(MCP)自 2024 年底 Anthropic 发布以来,以惊人的速度成为 AI Agent 工具接入的事实标准。到 2025 年底,GitHub 上已有数千个 MCP Server 实现,主流 AI 应用(Claude Desktop、Cursor、VS Code Copilot、Windsurf)都已原生支持。

Prompt injection 不是模型 bug,而是指令与数据同流的结构性问题。本文用 EchoLeak(CVE-2025-32711)零点击外泄案例,给出按成本排序的 6 层防护栈,并附 3 段可运行 Node.js 守卫代码与红队门禁方法。

我们的 AI 客服 Agent 上线三周后,有一天收到用户投诉,说同一张工单被创建了三次。查日志才发现:Agent 调用 create_ticket 工具时,因为网络抖动触发了重试,结果三次调用全部成功,数据库里躺着三条一模一样的记录。

很多团队做 Agent 的第一阶段,都会把精力放在:

凌晨两点四十七分,手机疯狂震动。PagerDuty 告警:生产环境的 Agent 系统成功率从 92% 跌到了 31%。
title: "AI Agent 记忆体系建设实战:短期、长期与工作记忆的工程实现"

三个月前,我的 AI Agent 在凌晨 2 点挂了。 它负责每天抓取数据、生成报告、推送给下游系统。挂了之后什么都没发生——没有报错,没有告警,下游系统只是静静地不再收到数据。直到第二天早上用户问"昨天的报告怎么没出来",我才发现。








