一、那个"神奇补全"的时代已经过去了

记得第一次用 GitHub Copilot 的时候,我的第一反应是"卧槽,它能读心术?"

那是 2022 年,我在写一个电商平台的 SKU 匹配逻辑,敲了几个函数名,Copilot 一口气补全了整个算法体。那种感觉就像你刚想说一句话,旁边有个人已经帮你说完了——又准确,又省力。

但现在回头看,那不过是"聪明的自动补全"。它本质上仍是被动响应:你说一句,它接一句;你停下,它也停下。决策权、上下文、业务判断——全在你脑袋里。

2025 年之后,一切都变了。

AI 开始主动"做事"了。


二、Copilot vs Agent:一个范式的跃迁

先说清楚两者的本质区别,这不是营销话术,是工程层面真实的边界变化。

维度 Copilot 模式 Agent 模式
执行方式 被动响应,按提示补全 主动规划,自主拆解任务
上下文范围 当前文件或光标附近 整个仓库 + Issue + PR + CI
决策能力 无,只生成代码片段 有,能判断下一步该做什么
工具调用 可调用 Git、终端、测试框架、API
人工介入时机 每一步都需要 起点定义 + 终点审核

用一句话总结得很准确:Copilot 是"人类主导 + AI 辅助",Agent 是"AI 主导 + 人类监督"

这不是量变,是质变。就像从自行车换成了有自动驾驶的汽车——你还是司机,但你的职责变了。


三、我的工作流是怎么被颠覆的

3.1 处理 Issue:从"我来写"到"我来审"

以前接到一个 Issue,我的流程是:

读 Issue → 定位代码 → 想方案 → 写代码 → 自测 → 提 PR

现在的流程是:

读 Issue → 把 Issue 丢给 Agent → 喝杯咖啡 → 审核 Agent 提的 PR

以 GitHub Copilot Workspace(2025年正式商用)为例,你可以直接在 Issue 页面点击"Open in Workspace",Agent 会:

  1. 分析 Issue 描述,提取出修复意图

  2. 扫描相关代码路径,找到根因文件

  3. 生成一个修改计划(Planning Step),列出要改哪些文件、改什么

  4. 生成具体代码变更,可直接 diff 查看

  5. 提一个草稿 PR,附带说明

我最近用这个方式处理了一个跨境电商平台的汇率精度 Bug(float 累计误差导致订单金额偏差)。整个过程:Agent 3 分钟定位 + 生成方案,我 5 分钟审核 + 合并。以前这个 Bug 我可能要找半小时才能定位。

关键点: Agent 并不会自动合并到主干。 所有 Agent 生成的修复,都会以"修复建议 PR"的形式提交,包含缺陷分析报告、修复代码、验证结果,最终决策权在人。这是个好的工程边界设计。


3.2 写单元测试:从"最烦的活"到"全自动"

坦白说,写单测是大多数开发者最容易拖延的事。逻辑清楚了,功能跑通了,然后……单测就悄悄欠着了。

Agent 在这里的价值是巨大且即时的。

我的实践方式:在每次提 PR 之前,让 Agent 扫描变更的函数,自动生成对应的单元测试。使用的工具组合:

  • Cursor + Claude 3.5:理解函数意图,生成测试用例

  • pytest + mock:隔离外部依赖(数据库、第三方 API)

  • 覆盖比例参考: 建议正常:边界:异常 = 6:2:2,特别要覆盖工具失败、非法输入等异常场景

一个真实案例:我的 Solana 链上数据采集模块有个 parse_transaction() 函数,之前完全没有测试覆盖。我丢给 Agent 两句话:"帮我为这个函数生成完整的 pytest 单元测试,覆盖正常 SOL 转账、SPL Token 转账、解析失败三种情况。"

不到 1 分钟,12 个测试用例,覆盖率 87%,mock 了所有 RPC 调用。我只需要检查边界条件定义是否符合业务逻辑。


3.3 修 Bug:Agent 的"侦探模式"

Bug 修复是 Agent 目前表现最亮眼的场景之一,尤其是那种"日志报错 → 定位根因"的链路。

描述的 Agent 修 Bug 流程和我的实践高度吻合:

  1. 输入错误日志 + 相关代码上下文

  2. Agent 进行根因分析,给出 1-3 个可能的修复方案

  3. 对于每个方案,Agent 生成包含修改的完整代码片段

  4. 自动生成回归测试,防止同类 Bug 再次出现

我在 CI/CD 流水线里加了一个 AI 审查节点:每次 PR 触发,Agent 自动执行风格检查、安全漏洞扫描、逻辑分析,最终输出结构化报告。 这种"每个步骤是独立节点,可以单独调试和替换"的设计,让整个流程透明可控。


四、我的角色变了——真实的感受

这部分我想说得诚实一点,不想端着。

第一阶段(刚开始用 Agent):兴奋 + 不安

看着 Agent 几分钟写完我要写 2 小时的代码,第一反应是"哇",第二反应是"我还有价值吗"。

这个心理波动是真实的,不只我一个人有。 描述的那种"大厂老兵看着刚毕业的人张口闭口 Agent 的发毛感",我完全理解。

第二阶段(用了 3 个月之后):角色重新锚定

我慢慢意识到一件事:Agent 能做的是"执行已知模式",但它不能定义"什么是正确的业务边界"。

举个例子:Agent 能帮我修一个 NullPointerException,但它不知道这个函数在我的电商系统里是否应该允许空值输入——这取决于上游是否有数据清洗逻辑,取决于合同条款,取决于历史决策。这些,只有我知道。

第三阶段(现在):架构师 + 审阅者

我现在的日常工作重心已经转移:

  • ❌ 减少:重复 CRUD 编写、样板测试、文档初稿

  • ✅ 增加:需求边界定义Agent 任务拆解设计输出质量审核系统风险识别

说得好:"以前写死规则让机器执行,现在要教机器自己'思考'着完成任务。" 这句话让我想了很久。我们从"写代码的人"变成了"设计代码生产流程的人"。

就像从泥瓦匠变成了工地总监——你要懂每个工序,但你的核心价值是把控全局、保证质量、做出判断


五、落地建议:别被"Agent 万能论"坑了

用了将近一年 Agent 驱动的工作流,我总结了几条反直觉的经验:

✅ Agent 最擅长的任务特征:

给出了很好的标准:边界清楚、反馈明确、验证链路短。比如修小 Bug、补测试、升级依赖、生成迁移脚本初稿、整理接口文档。

❌ 别指望 Agent 做这些:

  • 需要理解业务背景的架构决策

  • 需要跨团队沟通的需求澄清

  • 涉及安全敏感操作(绝对不要让 Agent 有生产环境直接写权限)

  • 全新领域的技术选型(Agent 会给你一个"看起来合理"的答案,但不一定适合你的具体约束)

工作流设计原则(来自实践):

总结的四点我深度认同:

  1. 专业分工:每个 Agent 只做一件事,不要设计万能 Agent

  2. 标准接口:通过文件或消息通信,不直接调用

  3. 闭环反馈:审核 → 修改 → 再审核,不跳步

  4. 持续优化:监控任务完成率,发现问题就迭代


六、写在最后

我不认为"AI 取代程序员"是个准确的命题。

更准确的说法是:AI Agent 正在取代"只会执行、不会设计"的程序员,同时在放大"懂业务、懂架构、懂风险"的工程师的价值。

有个数据值得警醒:2026 年,67% 的架构师已经在团队中引入了 AI Agent,上线周期从 6 个月压缩至 4 周。这不是遥远的未来,这是正在发生的现在。

我选择主动迎接这个变化,因为最好的应对方式不是抗拒,而是先成为那个最懂得用 Agent 的人

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐