概述

Vibe Coding,氛围编程,AI辅助编程。提到Vibe Coding,多数人第一印象是三剑客:

  • Google Gemini
  • OpenAI Codex
  • Anthropic Claude

一篇发表于25年10月的综述性论文GitHub

循环
在这里插入图片描述
形式化为受限马尔可夫决策过程(Constrained Markov Decision Process,CMDP):

  • 状态S:项目快照,包括代码+文档+数据
  • 动作A:人发指令→Agent产生代码/命令
  • 奖励R:人只看运行结果给0/1反馈
  • 约束C:项目规范、安全边界、Token上限

技术全景图
在这里插入图片描述
分4大板块

板块 关键能力 代表工作
LLMs 代码补全、理解、重构 CodeLlama、DeepSeek-Coder、StarCoder2
Agents 计划、记忆、工具调用 OpenHands、MetaGPT、SWE-agent
环境 沙箱执行、IDE插件、分布式编排 Docker+K8s、Cursor、AutoGen
反馈机制 编译/运行/人类/自反思四级反馈 RLCF、Reflexion、Self-Refine

在这里插入图片描述
LLMs
在这里插入图片描述

阶段 关键技术 亮点数据
预训练 持续预训练(CPT)、FIM目标 Stack v2(67TB,619语言)
指令微调 OSS-Instruct、Evol-Instruct OpenCodeInstruct 5M样本
偏好对齐 RLHF→DPO→GRPO CodeUltraFeedback 10k四选一对比

Agents架构图
在这里插入图片描述
核心组件:认知-记忆-工具
核心能力:规划、执行、协作

论文列举的Code Agents

CodingAgent Code Search File Ops Shell Web Search Testing MCP Multimodal Context
CodeAgent
MapCoder
ChatDev
CodeAct
SWE-Search
OpenHands
OpenHands-Versa
MetaGPT
SWE-agent
AutoSafeCoder
AutoCodeRover
Lita
SWE-dev
RepoForge
LessonL
AdaCoder
Code2MCP
ScreenCoder
SimuGen
SoA
SICA
RGD
Guided Code Generation
AgentCoder
AppAgent
Cursor IDE
Claude Code
Gemini Code CLI
Qwen Coder
Codex

开发环境
在这里插入图片描述

隔离手段 实现示例
容器级 Docker+Kubernetes(25000 vCPU集群)
系统调用过滤 gVisor、NatiSand
硬件级 Intel PKRU、ARM TrustZone
语言级 WebAssembly运行时

反馈机制
在这里插入图片描述
内部反馈和外部反馈;多层级:模型、Agent、人类。

多级反馈:

  • 自反思:Reflexion用语言强化学习把失败经验转成自然语言提示,HumanEval提升11%
  • 编译反馈:RLCF把gcc报错当奖励信号,提升45%通过率
  • 执行反馈:Test-Driven生成多组单元测试,AI自评
  • 人类反馈:ClarifyGPT主动提问消除需求歧义

开发模式
在这里插入图片描述
横坐标是开发速度,纵坐标是限制。

五种模式:

  • UAM,Unconstrained Automation Model,无约束自动化
  • ICCM,Iterative Conversational Collaboration Model,迭代式对话协作
  • PDM,Planning-Driven Model,规划驱动
  • TDM,Test-Driven Model,测试驱动
  • CEM,Context-Enhanced Model,上下文增强
Model Upfront Investment Human Control Structured Constraints Dev Speed Code Quality Maintainability Security Technical Debt Risk SE Counterpart
UAM None None None Strict Low Low Low High RAD
ICCM Low Strict Moderate High High High Moderate Low Pair Programming
PDM High Strict Strict Moderate High Strict High Low Waterfall
TDM High Moderate Strict Moderate Strict High Strict None TDD
CEM Moderate - - +1 Level +1 Level +1 Level +1 Level -1 Level -

IDE

Cursor

基于VS Code开发。

特性:

  • AI驱动的代码生成:输入想要的内容,Cursor会将这些需求转换为实际代码。
  • 自动调试辅助:可以识别它生成的代码(或您编写的代码)中的错误或bug,并建议修复方案,使调试过程更快。
  • 上下文感知帮助:理解项目上下文。可查看所有文件,并提出适合您项目的建议,确保生成的代码与您已有的内容一致。
  • 文档和学习工具:提供文档的快速查阅,甚至可以为您解释代码。

快捷键:

  • Ctrl+L:打开侧边栏聊天窗口
  • Ctrl+K:打开一个内联提示用于代码生成。

生成的建议代码以预览或差异(diff)格式出现,可选择接受或放弃;基本循环:提示→生成→审查→接受→测试。

最佳实践

  • 清晰描述意图:尽可能清晰和具体地说明您的需求。
  • 逐步进行:将项目或问题分解成更小的任务,并逐个解决。迭代过程。
  • 经常审查和测试:AI生成的代码不完美。
  • 根据结果优化提示:重新措辞请求或添加更多细节。
  • 利用指导功能:API解读、代码块解释、优化、重构、提高可读性…。
  • 通过实践不断学习:有助于更好地编写提示。

Trae

字节跳动推出的基于VS Code的免费IDE,The Real AI Engineer缩写,内置Claude 3.5和GPT-4o等模型,支持智能代码生成与优化,原生中文支持,还具备多模态能力,适合Web开发、游戏开发等多种场景。

原本的MarsCode编程助手和Trae IDE已经合并,现在统一归属于Trae品牌。

Trae旗下包含两款产品:IDE和插件。

功能:

  • Builder模式:支持Vibe Coding,拆解需求自动生成完整项目
  • Chat模式:交互式问答,实时编程助手,深度上下文理解
  • 多模态输入:图片转代码、手绘稿生成界面、Webview实时预览
  • 顶级模型免费:Claude 3.5 Sonnet、GPT-4o、Gemini 2.5 Pro完全免费

MCP

MCP允许LLM访问自定义工具和服务,MCP Servers是支持MCP协议的服务,提供工具和功能。支持添加线上和本地部署的服务,两者的能力差异主要体现在部署方式、适用场景、安全管控和功能扩展性上;本地服务依赖stdio,仅支持简单进程间通信;远程服务通过HTTP/SSE实现跨网络交互。

Trae内置MCP市场,可快速添加第三方MCP Servers;配置MCP Server将外部工具和服务连接至IDE进行使用;可定义调用MCP工具的Agent,拓展Trae的执行能力。

规则

用于规范AI在IDE内的行为,包括:

  • 个人规则:全局粒度,基于个人使用习惯和需求定制的规则,旨在让输出更符合用户的个性化要求。如语言风格、内容深度、交互方式等规则。配置文件user_rules.md
  • 项目规则:项目粒度,配置文件project_rules.md

智能体

在这里插入图片描述

上下文

支持多种形态的上下文:

  • Code
  • Files
  • Folder
  • Workspace
  • Docs:上传个人文档集
  • Web:#Web后输入问题并发送,触发联网搜索

SOLO

SOLO模式集成包括IDE在内的多种工具。你只需表达需求,它就会基于目标主动推进完整开发流程。

Windsurf

官网,基于Codeium技术,推出Cascade技术,将Copilot和Agent完美融合。支持深度项目理解,能够处理复杂的多文件编辑任务。

功能:

  • Cascade技术:深度理解项目结构,处理复杂编程任务
  • Agent模式:助手可以主动调用各种工具,实现自主编程
  • 多文件编辑:同时处理多个文件,保持代码一致性
  • 智能上下文:自动记住项目上下文,越用越聪明

Warp Code

官网GitHub仅用于提交Bug,24.8K Star,541 Fork,3.5K Issue。

基于Rust开发,使用GPU加速,内置AI功能,提供三大主流系统安装应用程序。

四大核心能力:

  • 顶级编码Agent:在Terminal-bench中取得第1名,在SWE-bench Verified排名前3(基于GPT-5测评,截至9月2日)。
  • 代码审查:提供专门面板用于查看Agent生成的变更,支持强化Prompt、行级编辑diff、并在Warp内直接操作,不必跳转到GitHub等外部工具。
  • 代码编辑:支持在Warp中直接打开和编辑文件,具备标签式文件视图、语法高亮、文件树、vim键位等特性。
  • Warp项目支持:通过WARP.md文件兼容Agents.mdClaude.md、Cursor规则,允许定义agent配置文件和全局slash命令,优化Agent启动体验。

Agent Steering功能:操控Agent,在生成过程中实时干预,解决AI输出几乎对但不够准的问题。

Qoder

阿里推出,主页,能记住用户的编码风格、项目习惯、踩过的坑。

两种聊天模式:

  • Ask模式:只动嘴不动手,问啥答啥;
  • Agent模式:直接下场改代码、跑命令、提PR。

核心优势:

  • 超长上下文处理:原生支持256K Token,并可扩展至1M,轻松应对大型微服务架构;
  • 多语言协同:同时生成Python、Java、TypeScript代码,确保跨语言逻辑一致性;
  • 智能体能力:在WebArena评测中,Qwen Code的自主任务完成率达82%,超越GPT-4.1。

Quest 模式?完整:需求 → 设计 → 编码 → 测试 → 报告,

Repo Wiki:看懂代码库。

规则文件,位于.qoder/rules文件夹。

MCP集成。

代码补齐,Next Edit Suggestion,NES

Kiro

官网,亚马逊推出的IDE,目前还是预览版。

插件

Claude Code

另起两篇:

GitHub Copilot

IDE插件。

功能:

  • Claude 3.5 Sonnet集成:新增Claude模型支持,代码质量显著提升
  • Copilot Vision:上传截图生成代码,设计稿秒变界面
  • 免费版本:每月2000次代码补全和50次聊天,个人用户可免费使用
  • 企业级功能:Pro+计划支持Claude Opus 4.1,处理复杂编程任务

CodeX

OpenAI提供的CLI、IDE插件工具,支持更完整的图形化操作,包含目前CodeX几乎所有的指令,在输出内容里面有增强型的图形化实施步骤,修改步骤一目了然,还能直接与编辑器进行双向同步操作,通过点击聊天内容的文件链接直接跳转到编辑器对应的文件,或从编辑器当中选取内容作为上下文。

Claude Code写前端细节更香,Codex搞后端和整体设计更强。

在安全设计上,Codex CLI提供三级模式:

  • Suggest模式:仅生成代码建议,需人工确认后写入文件;
  • Auto Edit模式:自动读写文件但需授权执行;
  • Full Auto模式:全自动完成代码生成、测试、提交。

基于SWE-Agent理论构建,通过ReAct框架实现思考→行动→观察的闭环迭代。

实战

安装

npm install -g @openai/codex
codex
# 自动执行命令,不问权限
codex --ask-for-approval never --sandbox danger-full-access
# 深度模式
codex -m gpt-5 -c model_reasoning_effort="high"
# 更新
npm install -g @openai/codex@latest
# 查看Token用量
/status
# 快速查看历史记录,上下文切换
Ctrl+T

自动打开浏览器,进入授权登录页面:
在这里插入图片描述
继续
在这里插入图片描述
安装成功
在这里插入图片描述
输入/
在这里插入图片描述
当前支持8个Slash命令:

  • /model:轻松切换当前会话使用的模型
  • /approvals:权限控制
  • /init:在当前目录生成一个Agent.md文件,可理解为Codex Agent的系统提示词,每次启动时都会自动加载
  • /status:工作空间、账户、模型、Token使用信息
  • /new:开启一个全新的、不受历史记录干扰的session
  • /diff:即git diff,方便快速查看AI对代码的修改
  • /compact:把当前的上下文信息进行压缩总结
  • /mention:即@,用于将指定文件或代码片段扔给AI,精准补充上下文

快捷键:Esc + Esc,按第一次 Esc,可快速拉起历史记录,按第二次 Esc,光标会自动上移一条消息,按下回车就能直接编辑。

Gemini CLI

GitHub,Google发布的一款基于Gemini 2.5 Pro模型的本地AI代理,可在终端内构建应用、调试代码、解析代码库并获取实时数据。

其首创的渐进式开发模式支持从需求描述到代码提交的全流程自治:

  • 需求理解阶段:通过图像识别与自然语言处理生成UML类图;
  • 代码生成阶段:利用代码补全与智能体协作完成多文件开发;
  • 测试验证阶段:自动生成Cypress测试用例并执行端到端测试。

功能:

  • 每天最多可免费请求1000次;
  • 集成Google搜索,维基百科、GitHub都可;
  • read_fileread_folder、文件编辑、脚本生成、Bash工作流自动化;
  • 集成到Git代码块,询问关于代码块的信息;
  • 使用MCP服务器和工具进行扩展,如使用Google Cloud的GenMedia API生成视频,或通过预建端点向外部模型发送提示;
  • 以Gemini Code Assist插件的形式集成IDE。使用:运行终端提示、自动生成代码、调试、无需切换标签即可触发CLI请求。

安装

npx https://github.com/google-gemini/gemini-cli
# 或
npm install -g @google/gemini-cli
gemini

使用NPX来获取CLI包并初始化提示,将被引导完成以下过程:

  1. 主题选择:选择浅色或深色的终端主题。
  2. 身份验证:可通过以下方式进行身份验证:
    • Google帐户:推荐,无需设置
    • Gemini API Key:如果想要更高的请求限制

一旦通过身份验证,将进入Gemini CLI界面。
在这里插入图片描述

AionUi

GitHub,2K Star,156 Fork,官网

AionUi是一款基于Electron和React构建的跨平台桌面应用,旨在将命令行AI聊天体验转化为现代化、高效的图形界面,从而弥补官方Gemini CLI在日常使用中的不足。该项目核心功能包括提供增强的聊天体验,支持多会话管理和本地持久化历史记录,以及通过可视化文件树、文件上传和代码对比视图等功能强化文件与项目管理。它还集成了完整的Gemini API功能调用、富文本Markdown渲染及简便的API配置,显著优化了开发者的工作流程。未来,AionUi致力于发展成为一个通用AI代理平台,构建多代理生态系统,并支持灵活绑定不同的LLM(如Gemini、Claude、GPT),以期让复杂的AI能力变得更加易于用户使用。

Augment Agent

官网,专为大型代码库打造,具备20万tokens的超长上下文、持久记忆和深度工具集成的IDE AI插件,支持Vim、GitHub、Slack。

功能:

  • 代码理解、持久化记忆;
  • 渗透完整开发工作流:可集成到项目管理工具(如Jira、Linear)、文档工具(如Confluence、Notion);
    @GitHub:创建分支、提交代码、发起PR
    @Linear:问题检测与解决
    @Notion、@JIRA、@Confluence:将上下文信息转化为实际代码
  • 可视化调试:拖入截图,自动识别UI问题(CSS、布局、逻辑),并提供修复建议。
  • 版本控制:每一步操作都会被记录,每一次编辑都可以撤销。

CodeBuddy

官网,腾讯提供的AI编码助手,提供三种版本:

  • IDE
  • 插件
  • CLI

都针对中文开发场景深度优化,支持智能文档生成、RAG代码库理解等高级功能。

核心优势在于通过文档驱动开发模式,利用Codebuddy.md文件管理项目上下文,结合语义化压缩与长期记忆机制,实现跨会话、跨项目的智能延续。

技术架构上,Codebuddy CLI 采用多智能体协作模式:

  • 前端Agent:根据Figma设计稿生成React/Vue组件代码,并自动关联UI测试框架;
  • 后端Agent:基于领域模型生成Spring Boot/Node.js接口,集成Swagger文档与权限控制;
  • DevOps Agent:同步生成Jenkins Pipeline脚本与Kubernetes部署清单,支持蓝绿发布与灰度引流。

Lingma

通义灵码,阿里云提供的智能编码辅助工具,具备代码智能生成、智能问答、多文件修改等能力,支持多种主流编程语言,可助力开发者提升编码效率,引领AI原生研发新范式。正在规划推出IDE版本。

功能:

  • 智能体模式,端到端任务执行
  • 行间预测,NES
  • 长期记忆功能

文心快码

Baidu Comate,百度发布的国内首个多模态、多智能体协同的AI原生开发环境,通过多智能体协同能自动规划执行任务,试图主导开发流程,为开发者带来全新开发体验。

功能:

  • 代码补全、单测生成
  • Zulu多智能体协同模式,生成速度慢
  • 设计稿转代码,即F2C,Figma to Code

Cline

官网,开源(GitHub,50.4K Star,7.1K Fork)Coding Agent。

终端与编辑器AI超级助手,专为工程师量身打造。无论是文件操作、项目管理,还是自动化测试、终端命令执行,Cline都能一站式搞定。它不仅能像老司机一样穿梭于大型项目,还能通过MCP变身万能工具箱。

Cline支持市面主流大模型API,包括AWS Bedrock、GCP Vertex等,兼容OpenAI标准接口,支持LM Studio等本地模型,灵活切换云端与本地算力。还能自动记录Token用量和API费用。

终端集成

可直接在终端执行命令并实时获取输出。无论是包安装、构建脚本、应用部署、数据库管理还是测试执行,都能一键搞定。支持长时间运行的进程(如开发服务器),还能监控终端输出,遇到异常自动提醒,彻底解放双手。

提供强大的终端命令自动化功能。用户可通过简单的任务描述,自动生成复杂的命令脚本,避免手动输入的繁琐和出错风险。对于需要多步操作的任务,支持命令链式执行,确保任务流畅进行。

终端集成功能与上下文管理深度结合。能够根据当前项目的状态,智能推荐相关命令。在检测到项目依赖缺失时,会自动生成安装命令;在发现测试失败时,会提供调试建议和修复脚本。

文件操作

在编辑器中创建、编辑文件,提供强大的文件操作功能,确保工程师在处理项目文件时更加高效和安全。通过内置的差异视图,用户可清晰地看到所有更改,快速定位修改内容,避免遗漏关键更新。Cline还支持实时检测linter或编译器报错,并提供自动修复功能,帮助工程师快速解决问题,提升代码质量。

所有文件操作都会被记录在文件时间轴中,用户可以随时回溯到任意历史版本,确保项目进度的可追溯性和协作的透明性。无论是多人协作还是个人开发,时间轴功能都能为工程师提供极大的便利,避免因误操作导致的文件丢失或错误。

Cline的文件操作功能与上下文管理深度集成。它能够根据当前项目状态,智能推荐相关操作。例如,在检测到文件依赖缺失时,Cline会自动生成修复建议;在发现代码冲突时,它会提供合并策略和解决方案。

浏览器自动化

Cline集成Claude 4 Sonnet的计算机使用能力,提供强大的浏览器自动化功能。用户可通过简单的任务描述,自动完成一系列复杂的浏览器操作,包括启动浏览器、点击按钮、输入文本、滚动页面、截图、抓取控制台日志等。无论是日常的页面操作,还是复杂的交互式调试。

在自动化测试方面,Cline 支持端到端测试和页面巡检,帮助工程师快速发现页面中的问题。通过脚本录制功能,用户可以将手动操作记录为自动化脚本,方便后续复用和优化。Cline 还能根据测试需求生成自定义的测试用例,确保覆盖关键场景,提升测试效率和质量。更重要的是,Cline 的浏览器自动化功能与上下文管理深度结合。它能够根据当前任务状态,智能推荐相关操作。例如,在检测到页面加载异常时,Cline 会自动抓取相关日志并提供调试建议;在发现页面元素缺失时,它会生成修复方案,帮助工程师快速定位和解决问题。

MCP

通过MCP实现强大的工具扩展能力,支持用户根据需求打造个性化的工程工具箱。允许用户像搭建乐高积木一样,灵活地添加和配置新功能模块,满足多样化的工程场景需求。

Cline的MCP工具库会随着用户社区的贡献不断丰富。用户可共享自己的工具扩展,还能从社区中获取高质量的模块,进一步提升工程效率。未来,Cline将继续优化MCP的易用性和兼容性,支持更多主流工具和服务的集成。通过探索MCP的潜力,工程师可以构建专属的AI工具生态,全面提升开发、测试和运维的效率与质量。

上下文管理

Cline提供强大的上下文管理功能,确保任务执行的连贯性与高效性:

  • @url:快速将网页内容转为Markdown,提升资料收集效率;
  • @problems:集中显示工作区的所有错误与警告,便于统一处理;
  • @file、@folder:支持批量添加文件或文件夹内容,提升项目管理效率;
  • @git:集成Git信息,清晰展示代码变更,便于版本控制。

Cline能够帮助工程师更好地组织和管理项目上下文,减少重复操作,专注于核心任务。

检查点

每完成一个任务步骤,Cline都会自动拍摄工作区快照,支持比较和恢复功能。用户可以选择仅恢复工作区,或连同任务一起回滚,操作灵活便捷。通过自动化的快照管理,Cline确保工程师在任何情况下都能快速恢复到理想状态,彻底解决回档失败的困扰。

快照功能不仅限于单一任务,还支持多任务快照管理。用户可以为不同的任务创建独立的快照链,方便在复杂项目中快速切换上下文。通过时间轴视图,用户能够直观地查看每个快照的创建时间、任务内容以及相关变更记录,确保项目进度一目了然。

Cline为工程师提供前所未有的灵活性和安全感。无论是调试代码、测试新功能,还是处理复杂的多任务场景,检查点功能都能帮助用户轻松应对,确保工程效率和质量的双重提升。

Streaming Tools Call

流式返回调用工具,边生成边调用,边调用边检测,大大提高Agent系统核心能力。

CodeWhisperer

Amazon推出专为企业环境设计,AWS Toolkit插件,支持多种IDE,在安全性和合规性方面表现出色。个人用户可以免费使用基础功能。

在线AI开发平台

Firebase Studio

Google推出的免费AI应用构建器,与Firebase生态深度集成。特别适合需要后端服务的应用开发,AI能自动配置数据库、认证、云函数等服务。

功能:

  • Firebase集成: 自动配置云服务
  • 多平台支持: Web、移动端应用都能生成

Lovable

官网

功能:

  • 设计转代码: 上传设计稿,AI自动生成React代码
  • 多人协作模式: 实时协作,支持设计师和开发者同时工作
  • 全栈生成: 前端+后端+数据库,一站式解决
  • Claude集成: 基于最新Claude模型,理解能力超强

Bolt.new

官网,StackBlitz出品,结合Artifacts、V0和Replit的优势。支持React、Vue、Svelte、Angular等主流框架,真正实现用英语编程,几分钟内就能从想法变成可运行的Web应用。

功能:

  • 实时预览: 边写边看,即时反馈
  • 一键部署: 集成Vercel、Netlify等部署平台

v0.dev

官网,Vercel推出的AI UI生成工具,专注于生成高质量的React组件。采用ShadCN UI设计系统,生成的界面美观且现代化。

功能:

  • UI专精:专注于界面生成,质量极高
  • ShadCN集成:统一的设计语言,风格一致
  • 组件化:生成可复用的React组件
  • Vercel部署:一键部署到Vercel平台

Replit

集成在Replit在线IDE中的AI助手,支持Python、JS、Go等多种编程语言。最大优势是云端开发,无需本地环境配置,特别适合快速原型开发和团队协作。

libra.dev

官网,同时还有开源版本,用于快速构建以自然语言驱动的SaaS应用。

特点:

  • 部署选项多样:
    • 托管平台:通过Cloudflare Workers无服务器架构提供快速上线、一键部署、自动 TLS/SSL、版本控制、回滚等功能
    • 开源自部署:支持本地开发与自部署,自由配置API Key与基础架构
  • 面向情境选择建议:
    • 选择托管平台:适合快速上线、追求团队协作、希望获得技术支持等场景
    • 选择开源版本:适合对数据自主、深度定制、成本控制或离线部署有需求的技术团队
Logo

为武汉地区的开发者提供学习、交流和合作的平台。社区聚集了众多技术爱好者和专业人士,涵盖了多个领域,包括人工智能、大数据、云计算、区块链等。社区定期举办技术分享、培训和活动,为开发者提供更多的学习和交流机会。

更多推荐