OpenAI 在 2025 年 10 月旧金山举办的 DevDay 2025 开发者大会上,以“降低 AI 开发门槛、构建以大模型为核心的软件生态”为核心,发布了一系列重磅更新,涵盖平台转型、开发工具、代码助手、新模型四大维度,同时披露了关键业务数据,展现了其从 AI 工具提供商向生态构建者的进阶。

一、核心业务数据:用户与开发者规模再突破

大会开篇披露了 OpenAI 近两年的高速增长成果,为后续生态布局奠定数据基础:

  • 用户规模:ChatGPT 周活用户从 1 亿飙升至 8 亿,较上月(7 亿)增长超 10%;
  • 开发者生态:开发者数量从 200 万翻倍至 400 万
  • 技术承载力:API 每分钟处理的 token 数从 3 亿激增至 60 亿(部分信源提及峰值 80 亿),技术基建能力显著提升。

二、平台转型:ChatGPT 从“聊天工具”变“开放应用平台”

这是本次大会最核心的战略升级——通过 Apps SDK 让 ChatGPT 成为“内置应用的生态入口”,实现“对话即使用”的体验革新,直接对标传统应用商店。

1. 核心能力:基于 MCP 协议的原生应用开发

Apps SDK 基于 Model Context Protocol(MCP)开放协议,为开发者提供完整技术栈,支持三大关键功能:

  • 连接外部数据源(如 Booking、Zillow 的实时数据);
  • 触发具体操作(如订机票、生成海报、筛选房源);
  • 渲染交互式 UI(支持内嵌、画中画、全屏模式,适配网页/移动端)。

2. 首批合作伙伴与用户体验

  • 首批接入应用:覆盖出行(Booking、Expedia)、设计(Canva、Figma)、教育(Coursera)、娱乐(Spotify)、房产(Zillow)等高频场景,用户可在 ChatGPT 内直接完成“需求对话-功能使用-结果交互”全流程(如用 Canva 生成遛狗公司海报、用 Zillow 筛选带院子的房源);
  • 支付与分发:支持 Agentic Commerce Protocol 代理式商业协议,可在对话中直接完成付款;今年晚些时候将开放“应用提交流程”和“专属应用目录”,并向企业版(Business/Enterprise)、教育版(Edu)用户开放;
  • 区域限制:欧盟用户暂无法使用,OpenAI 称正解决监管问题,预计很快开放。

三、开发工具:AgentKit 让“拖拽造 AI 智能体”成为现实

针对 AI 智能体(Agent)开发门槛高、落地难的行业痛点,OpenAI 推出 AgentKit——一套可视化、模块化的智能体开发工具集,目标是让“从原型到生产”的周期从数月缩短至分钟级。

1. 三大核心组件(含开放节奏)

组件名称 核心功能 开放状态
Agent Builder 可视化画布,通过拖拽“逻辑节点(条件/并行)+ 工具(文件搜索/MCP 应用)”构建多智能体工作流,支持预览、版本控制 公开测试(Beta)
ChatKit 可嵌入的定制化聊天组件,支持品牌风格自定义,适用于客服、新员工入职、内部知识助手等场景 全面开放(已被 HubSpot、Evernote 等采用)
Evals 评估工具 支持数据集构建、trace 评分、自动提示词优化,甚至可评估第三方模型,定位工作流问题 全面开放

2. 配套能力:安全与数据连接

  • Connector Registry:统一管理数据源的面板,预置 Dropbox、Google Drive、SharePoint、Microsoft Teams 等常见服务的连接器,方便智能体调用企业内部/外部数据;
  • Guardrails 安全层:开源模块化组件,可屏蔽个人信息(PII)、检测越狱尝试,防止智能体出现意外/恶意行为,支持单独部署或通过 Python/JavaScript 集成。

3. 行业反响与争议

  • 正面评价:被认为是 AI 智能体的“Webflow 时刻”,大幅降低开发门槛(现场演示 8 分钟构建 DevDay 官网智能问答代理“Ask Froge”);
  • 争议点:功能与 Dify、n8n 等现有工具重合度高,且 仅支持 OpenAI 自家模型,无法适配其他更擅长特定任务的大模型。

四、代码助手:Codex 结束预览,正式成为“企业级编程协作伙伴”

Codex 作为 OpenAI 面向开发者的核心工具,本次从“研究预览版”转为 正式版(General Availability),强化企业级支持,目标是“让编程从‘团队任务’变‘个人可完成的快速创作’”。

1. 三大核心更新

  • Slack 集成:支持在团队频道/线程中直接调用 Codex 写代码、答技术问题,无需切换应用;
  • Codex SDK:允许企业将 Codex 能力嵌入内部工作流(如 IDE、终端、GitHub),基于 GPT-5-Codex 模型实现“无额外微调”的高性能编码;
  • 管理工具:提供环境控制、使用监控、分析仪表盘,方便企业管控团队使用权限与成本。

2. 使用效果与数据

  • 内部效率提升:OpenAI 内部 100% 工程师使用(7 月仅 50%+),每周合并的 Pull Request(PR)增加 70%,且几乎所有 PR 由 Codex 自动审核,提前发现生产环境缺陷;
  • 用户增长:自 8 月初以来,Codex 日使用量增长超 10 倍,GPT-5-Codex 上线三周处理超 40 万亿 token,成为 OpenAI 增长最快的模型之一;
  • 收费调整:10 月 20 日起,Codex 云端任务计入使用限额——Plus 用户每 5 小时可使用 30-150 条本地消息/5-40 个云端任务,Pro 用户为 300-1500 条本地消息/50-400 个云端任务。

五、新模型发布:“高端精准+低端普惠”双轨策略

API 层面推出多款新模型,覆盖高价值场景与大众化场景,满足不同开发者的成本与性能需求:

1. 高端模型:GPT-5 Pro——聚焦高精准推理场景

  • 定位:面向金融、法律、医疗等对“准确性+深度推理”要求极高的领域;
  • 定价:每百万输入 token 15 美元,输出 120 美元(价格显著高于基础模型,体现高端定位);
  • 开放状态:API 已正式向所有开发者开放。

2. 普惠模型:降低语音/图像/视频开发成本

模型名称 核心功能 优势(价格/性能)
gpt-realtime-mini 实时响应音频/文本输入(支持 WebRTC/WebSocket/SIP 连接) 比高级语音模型便宜 70%,音质与表现力不打折
gpt-audio-mini 专门处理音频任务(如转写、降噪) 价格亲民,降低音频类应用开发成本
gpt-image-1-mini 原生多模态模型,支持文本/图像输入+图像输出 比大模型便宜 80%,适配轻量化图像需求

3. 视频生成:Sora 2 API 开放预览

作为 OpenAI 在生成式媒体领域的核心产品,Sora 2 首次通过 API 向开发者开放,聚焦“高可控性+音画同步”:

  • 核心能力:支持文本/图像生成视频、视频扩展(如 iPhone 画面转电影级广角)、视频混剪,提供 5 个 API 端点(创建/查询/下载/列出/删除视频);
  • 音画同步突破:可生成环境音、背景音乐,并与画面动作精准同步(如皮划艇划水声与镜头节奏匹配);
  • 版本与定价:分“基础版(720p,每秒 0.1 美元)”和“Pro 版(更高分辨率,价格上浮)”,适配创意探索、营销视频、电影镜头等不同场景;
  • 合作案例:美泰(Mattel)用其将玩具草图快速转化为动态视觉方案,加速产品创意落地。

六、生态愿景:从“工具提供商”到“AI 商业帝国”

大会多次强调 OpenAI 2023 年 DevDay 的初心——“让每个人都能构建自己的 AI 应用”,并通过本次更新将愿景落地:从早期的 GPTs 提示词模板,到如今的 Apps SDK 原生应用、AgentKit 可视化开发,逐步解决“AI 智能体落地难、应用分发效率低”的行业痛点。

但同时也引发行业讨论:OpenAI 的“封闭生态倾向”(如 AgentKit 仅支持自家模型)可能挤压中小开发者空间,且其商业帝国轮廓(掌控入口、模型、工具)正逐渐盖过早期对“通用人工智能(AGI)”的探索气质,未来如何平衡“生态开放”与“商业掌控”将是关键。

参考:https://www.youtube.com/watch?v=hS1YqcewH0c

更多内容关注公众号"快乐王子AI说"

Logo

更多推荐