
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
生成式检索早已成为大模型时代推荐系统的核心方向,却始终被一个行业痛点卡住落地节奏。想给大模型的输出加业务约束,要么算力拉满延迟飙升,要么干脆在 TPU/GPU 加速器上跑不通。

最早就是个简单的想法:我想跟自己的笔记对话。然后自然就试了多 agent——给不同任务分配不同的 AI。结果发现管理成本巨高,像带了个外包团队,每个人都要你手把手交代,交代完还不一定对。

2024 年底,一个新词开始在 AI 圈子里冒出来:**Harness Engineering

今年 2 月,OpenAI 在一篇题为《Harness engineering: leveraging Codex in an agent-first world》的博文中,总结了一项持续数月的工程实践。文章并不聚焦某个具体技术点,而是试图回答一个更基础的问题:当软件工程进入以智能体为中心的阶段,工程团队的工作方式会发生怎样的变化?

关于构建 AI Agent,业界通常谈的是三种架构路径:SDK、Frameworks、Scaffolding。这三种方式各自站在灵活性与结构性的不同位置,也各有适用场景。

当 AI 能写出 100 万行代码,真正的挑战不是让它写得更好——而是怎么驾驭它。

根据 OpenAI 在 2026 年 2 月发布的官方文章《Harness engineering: leveraging Codex in an agent-first world》,Harness Engineering(驾驭工程)的核心定义可以总结为:

成功训练出了一个。这标志着AI训练领域迈出了革命性的一步。从训练面板可以看到,这个名为INTELLECT-1的项目已经完成了。损失和困惑度曲线都呈现出理想的下降趋势,每秒生成的token 数也保持稳定,这表明训练过程非常成功。。包括Hugging Face、SemiAnalysis、Arcee.ai、Hyperbolic Labs、Olas、Akash、Schelling AI等在内的多家机构都为

他构建了一套生成器与评估器分离的多Agent框架,让 AI 学会了“自我批判”。更令人惊喜的是,这套方法不仅适用于有标准答案的编码任务,甚至能让 AI 在主观性极强的前端设计中展现出“博物馆级”的审美判断。这是Claude团队对Agent Harness的一次最佳实践分享。

关于构建 AI Agent,业界通常谈的是三种架构路径:SDK、Frameworks、Scaffolding。这三种方式各自站在灵活性与结构性的不同位置,也各有适用场景。








