Anthropic 把“AI团队管理“变成了一键服务：Claude Managed Agents解读

Model 是一匹千里马，Harness 是马鞍、缰绳和赛道。没有 Harness，千里马只能在草地上乱跑；有了 Harness，它才能赢比赛。这些基础设施工作可能。Anthropic开始做云服务商做的事——提供计算资源和运行环境，只不过跑在上面的是AI Agent。Anthropic在设计这套系统时，遵循了三个核心思路。AI自己决定哪些结果需要仔细看、哪些可以直接跳过。：很多中间结果根本不需要"

迷途小书童的Note

556人浏览 · 2026-04-10 23:32:33

迷途小书童的Note · 2026-04-10 23:32:33 发布

以前搭一个能上线的AI Agent要几个月，现在几行代码就搞定了。

先搞懂一个公式

2026年初，AI圈流传着一个简洁的公式：

Agent = Model + Harness

Model（模型） 提供智能——能思考、能推理、能生成。

Harness（缰绳） 让这个智能能真正干活——在哪里跑、用什么工具、出了错怎么办。

打个比方：

Model 是一匹千里马，Harness 是马鞍、缰绳和赛道。没有 Harness，千里马只能在草地上乱跑；有了 Harness，它才能赢比赛。

问题是：搭一套生产级的 Harness，需要处理沙箱执行、状态管理、权限控制、端到端追踪……这些基础设施工作可能耗费数月。

昨天，Anthropic 说：这些活儿我们全包了。

Claude Managed Agents：到底是什么？

一句话概括： 你定义AI要干什么，Anthropic负责让它跑起来。

以前 vs 现在

以前（自己搭）	现在（Managed Agents）
自己搭沙箱环境	平台提供安全沙箱
自己写状态管理	内置检查点机制
自己做权限控制	作用域权限已内置
自己处理错误恢复	自动从错误中恢复
几个月才能上线	几行代码就能跑

四个核心能力

1. 生产级 Agent

安全沙箱、身份验证、工具执行——全部由平台处理。

开发者不需要自己搭基础设施，专注于定义Agent该干什么就行。

2. 长运行会话

Agent可以自主工作数小时，不是几分钟的简单问答。

进度和输出会持久化保存，即使连接断开也不会丢失状态。

就像你给员工布置了一个大项目，他不会因为你关了办公室的门就停下来。

3. 多Agent协调

一个主Agent可以派生多个子Agent，分别处理不同子任务，然后汇总结果。

就像项目经理把大任务拆成小任务，分给不同组员并行处理，最后合并交付。

4. 可信治理

Agent访问真实系统时，权限管理、身份验证、执行追踪全部内置。

企业最担心的问题——Agent越权访问敏感数据——有了系统性的解决方案。

底层设计：三个关键模式

Anthropic在设计这套系统时，遵循了三个核心思路。听起来像技术细节，但其实很好理解。

模式一：用AI已经擅长的工具

Claude在SWE-bench测试中拿到49%的成绩，当时的最先进水平。

用的工具只有两个：bash 和文本编辑器。

这两个工具看起来很"原始"，但关键在于：Claude对它们理解极深。

就像给一个大厨一把好刀和一口好锅，他能做出千变万化的菜——不需要108种厨具。

Anthropic发现，Claude能把这些通用工具组合出各种解决方案：

Agent Skills = bash + 文本编辑器的组合
编程式工具调用 = bash脚本串联
内存工具 = 文件读写的巧妙运用

设计哲学：给AI它已经精通的通用工具，让它自己组合出解决方案。

模式二：让AI自己做决策

传统做法：AI每调用一个工具，结果都要经过"大脑"处理，然后再决定下一步。

问题是：很多中间结果根本不需要"过脑子"，直接传给下一个工具就行了。每次都要处理，又慢又费钱。

Managed Agents的做法：

给AI一个代码执行工具，让AI自己写代码来编排工具调用。 AI自己决定哪些结果需要仔细看、哪些可以直接跳过。只有最终输出才进入AI的"大脑"。

效果有多好？在BrowseComp测试中，让AI自己过滤工具输出后，准确率从45.3%飙升到61.6%。

核心洞察：强大的编码模型，也是强大的通用Agent。

模式三：该管的地方严格管

AI能力越强，安全边界越重要。

Managed Agents的安全设计逻辑：

操作类型	处理方式
可逆操作（编辑文件）	AI自主执行，但带过期检查
不可逆操作（调用外部API）	需要用户确认
高风险操作	第二个AI审查后才放行

就像公司里的审批流程：买个文具自己批就行，签个大合同要领导签字。

这件事为什么重要？

1. Anthropic变了

以前：我提供模型，你自己搭基础设施。现在：我提供整套运行环境，你专注于定义Agent该干什么。

Anthropic开始做云服务商做的事——提供计算资源和运行环境，只不过跑在上面的是AI Agent。

2. 从原型到生产的"死亡谷"消失了

很多开发者都有这个痛苦：

ounter(lineDemo很酷 → 上线很难 → 基础设施搞死人 → 项目烂尾

Managed Agents把中间那段最痛苦的基础设施工作接管了。

3. Agent的"工业化"时代来了

阶段	特征
2023-2024	手工作坊：每个Agent都是定制开发
2025	工具链成熟：框架和库越来越多
2026	工业化生产：基础设施即服务

给开发者的启示

1. 基础设施不再是瓶颈

当沙箱、状态管理、权限控制都有人帮你做了，你该把精力放在哪？

设计Agent能做什么、怎么做、边界在哪里。

2. "用AI已经擅长的工具"是通用原则

不要为每个任务设计专用工具。

给AI通用工具，让它自己组合——这个思路不只适用于Anthropic，适用于所有AI应用开发。

3. 安全边界要从第一天就设计

不是"先跑起来再加安全"，而是安全是架构的一部分。

Managed Agents在这方面做了很好的示范。

4. 关注"Agent即服务"赛道

Anthropic带了个头，但不会是唯一一个。

预计Google、OpenAI、以及国内的大模型厂商，都会推出类似的托管Agent服务。

参考链接

资源	链接
Claude Managed Agents 官方博客	https://claude.com/blog/claude-managed-agents

龙虾开发者社区

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地，聚焦技能开发、插件实践与部署教程，为开发者提供可直接落地的方案、工具与交流平台，助力高效构建与落地 AI 应用

更多推荐

金三银四就业真相：传统岗位缩招，AI Agent全栈成爆款！薪资20K起，大厂疯抢！

龙虾开发者社区

LLM_Agent周边概念科普+相互关系全解析｜一次厘清

龙虾开发者社区

AI Agent Harness Engineering 安全体系：权限、审计与监控

术语定义介于AI Agent实例与企业内部IT资源（数据库、API、SaaS、文件系统等）之间的管控中间层，是Agent操作企业资源的唯一入口，承担安全管控、流量调度、能力编排的核心职能，相当于Agent的「安全网关+操作总线」。权限体系Harness的事前管控模块，基于零信任原则动态判断Agent的操作是否合法，从源头拦截违规请求。审计体系Harness的事后追溯模块，全链路记录Agent的输入