OpenAI开发者大会全解析:ChatGPT超级应用+AgentKit工具链,大模型开发必看!
OpenAI开发者大会推出多项创新:Apps SDK打造ChatGpt内小程序生态,触达全球8亿用户;AgentKit提供智能体开发完整工具链,简化构建流程;Sora 2实现高质量视频生成;GPT-5 Pro API增强复杂任务处理能力。这些更新表明OpenAI正从单纯模型提供商向AI生态平台转型,将Agent开发从复杂工程简化为配置问题,可能重塑AI开发格局。
吐槽归吐槽,但不得不服,OpenAI 的技术前瞻性还是在的。此次 OpenAI 开发者大会信息量有点大,给我最大的感受:OpenAI 正在将 ChatGPT 打造为超级应用,类似于国内的微信(如小程序、视频号、公众号、社交等)。也就是 AI 能做的事终将都被 ChatGPT 所集成(toB、toC 全覆盖,从 API 提供到用户体验)。

大会最值得关注的两个点:Apps、AgentKit。通过 Apps SDK 构建的应用,可借助 ChatGPT 渠道将产品分发至全球(AI 应用分发中心)。不想过度耦合 ChatGPT 的企业,OpenAI 还贴心准备了 AgentKit,来简化智能体搭建。
一、Apps SDK
ChatGPT 版小程序,由 LLM 驱动。
OpenAI 正式推出可在 ChatGPT 内直接交互的新一代应用 Apps[1],以及供开发者构建这些应用的 Apps SDK[2]。用户可以像与模型对话一样自然地使用这些应用,开发者则能通过 SDK 轻松将自家服务嵌入 ChatGPT,触达超 8 亿用户。
用户可通过自然语言调用应用(如 “Spotify,帮我生成一份派对歌单”),或由 ChatGPT 在对话中智能推荐相关应用(如讨论买房时出现 Zillow 房产搜索界面)。这些应用融合了地图、播放列表、演示文稿等交互元素,实现“聊天即操作”的全新体验——比如让 Canva 直接把你的提纲转为幻灯片,或在观看 Coursera 课程时实时提问。我尝试用 Figma 生成 UI 图失败了,貌似现在只能生成流程图(感觉有点鸡肋)。



首批合作伙伴包括 Booking.com、Canva、Coursera、Figma、Expedia、Spotify、Zillow,更多应用(如 Uber、OpenTable、Target、Peloton 等)将陆续上线。
Apps SDK 基于开放标准 Model Context Protocol(MCP) 构建,允许开发者定义应用逻辑与界面、连接后端服务,并开源支持在任何采用 MCP 标准的环境中运行。OpenAI 已发布文档与示例仓库,帮助开发者快速设计融合“对话 + 交互”的体验。
所有应用必须遵守 OpenAI 使用政策,面向所有年龄段安全可用,并明确隐私与数据权限。首次使用时,ChatGPT 会提示用户确认共享的数据范围;未来还将提供更细粒度的隐私控制。
今年晚些时候,OpenAI 将开放应用提交与上架流程,推出应用目录(App Directory),并支持开发者通过 Agentic Commerce Protocol 实现一键结账与应用变现。这标志着 ChatGPT 从“聊天模型”正式进化为一个具备生态系统能力的“对话式应用平台”。
📌 AI 电商
OpenAI 表示,每天都有数百万人在 ChatGPT 中寻找购物建议。现在从聊天到下单,一步到位。

通过 Instant Checkout 功能,用户可以在对话中直接完成下单购买。该功能基于 Agentic Commerce Protocol (ACP)[3] —— 由 OpenAI 与 Stripe 联合开发的开放标准 —— 为商家和开发者提供了一个简单高效的方式,将对话流量转化为实际销售。
Agentic Commerce Protocol 是一个面向未来的开放标准,旨在让 AI 智能体与企业之间的交易过程变得更加顺畅。它不仅能与现有系统兼容,还具备良好的可扩展性,适应未来智能商业的发展趋势。ACP 接入门槛低,适用于各种支付平台和技术栈,同时也为下一代 AI 驱动的电商体验做好了准备。
ACP 已率先应用于如 Etsy 这样的商家体系中,Shopify 也即将接入。它为 AI 接口处理购物场景提供了基础框架。使用 Stripe 的商家,只需添加一行代码即可开启支付功能;而使用其他支付系统的商家,也可通过 Stripe 的 Shared Payment Token API[4] 或 ACP 的 Delegated Payments 规范实现对接,无需更改原有支付架构。
一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

以下流程图是代理商务协议的端到端数据流。感兴趣的朋友可以查看文档,了解更多 Agentic Commerce[5]。

二、技术差异
Apps、GPT Store、小程序傻傻分不清楚…
与 GPT Store
GPT Store 面向“配置式 Agent”(系统指令 + 知识 + 工具/动作),主要是对话 + 工具调用,界面轻量级,更像“可分享的定制 GPT”。
Apps SDK 则是面向“可编程 App”,扩展到界面 + 逻辑 + 后端直连,强调交互 UI 与工作流编排。对话内上下文推荐,命中“使用瞬间”,原生渲染交互组件(地图/列表/小部件),更接近“对话里的小应用”。
GPT Store 目前已被 OpenAI 放弃,Apps 应该就是其理念的继承者。
与微信小程序
小程序是运行在微信超级 App 内,使用 WXML/WXSS/JS 及微信专有 API,分发、支付、LBS 等生态能力完备;“即开即用、免安装”。它是“页面/组件驱动”,依托搜索、扫码、社交传播等传统入口,深耦合微信生态(登录、支付、订阅消息等)。国内分发/增长与闭环运营强。
Apps 则在 ChatGPT 对话容器内运行,由 LLM 作为“编排中枢”,通过 MCP 接外部数据与工具。它由“对话驱动”,精准出现在用户问题上下文中,深耦合 ChatGPT 生态(对话上下文、Agent/工具、评测与后续变现等)。
三、AgentKit
一整套专为开发者与企业打造、用于构建、部署与优化智能体(Agent)的完整工具集。
AgentKit[6] 将 Agent Builder(可视化编排)、Connector Registry(统一数据/工具治理)、ChatKit(可嵌入聊天式 UI)与 Evals(评估/优化)打包成一条龙平台,直接瞄准“工程落地的最后一公里”。这意味着大部分通用编排、嵌 UI、评测与治理能力,首次在官方同一栈内闭环提供。

Agent Builder
节点化多智能体编排 + 版本化 + 预览评测
Agent Builder[7] 提供拖拽节点、工具连接、条件/分支、守护策略(Guardrails)与“预览运行 + 内嵌评测配置 + 全量版本化”。它面向“多智能体工作流”的可视化模型/工具/状态编排,缩短从试验到上线的回路时间,并内建与平台 Guardrails/MCP/评估体系的耦合点。

Connector Registry
跨工作区/组织的统一连接治理
Registry 把 ChatGPT 与 API 侧的预置连接器(如 Google Drive、SharePoint、Dropbox、Microsoft Teams 等)纳入统一的后台(依赖 Global Admin Console[8]),帮助企业做跨域权限与数据线路的集中治理与复用,降低“连接器碎片化”和“多环境配置漂移”的风险。
📌 全局管理控制台
访问地址:https://admin.openai.com
Global Admin Console 是 OpenAI 面向企业推出的统一身份与访问管理平台,它引入 “Tenant(租户)” 概念,将多个 ChatGPT 工作区与 API 组织纳入同一体系,实现域名验证、SSO 单点登录、用户权限、账户合并等集中管理。它让管理员能在一个界面中配置身份策略、跨域管控访问、查看全局用户,并简化过去分散在不同工作区的操作,标志着 OpenAI 企业级账号体系向统一化、可治理化迈进。

Guardrails
模块化安全层(可独立或以库集成)
官方 Guardrails[9] 作为开源、模块化安全层,支持 PII 屏蔽/标注、越狱检测与策略化约束,可在 Builder 里开关,也可通过 Python/JS 库独立集成,形成“开发-测试-上线”同一套安全基线。

ChatKit
产品内嵌式对话 UI 基建
ChatKit 解决“流式响应、线程管理、思考过程展示、内聊交互组件”这些常见但重复的工程工作,且支持品牌化定制与应用/网站内嵌,可大幅压缩前端堆料时间,使团队将精力集中在“Agent 能力与场景策略”本身。
要在前端嵌入 ChatKit,需创建一个代理工作流,托管在 OpenAI 服务器上,然后设置 ChatKit 并添加功能。核心架构图如下:

在 GitHub 上开源了 4 个项目:
- chatkit-python[10]: ChatKit Python SDK
- chatkit-js[11]: ChatKit JS SDK,一个开箱即用的 AI 聊天框架,开发者无需自建前端或管理复杂状态,即可快速在应用中嵌入可定制的高质量智能对话界面。它支持流式响应、工具调用可视化、富交互组件、文件上传、消息线程与来源标注等功能,实现即插即用的生产级聊天体验。
- ChatKit Starter Template[12]:是启动 ChatKit 应用的最简模板,内置精简版 Next.js 界面、ChatKit Web 组件,以及可直接使用的会话接口,让开发者能快速体验并测试基于 Agent Builder 构建的 OpenAI 托管工作流。
- OpenAI ChatKit Advanced Samples[13]:是一个完整的 ChatKit 高级示例与实验项目,结合 FastAPI Python 后端和 Vite + React 前端,展示了 ChatKit UI、交互组件与客户端工具的实际用法。项目使用 ChatKit Python SDK 与 OpenAI Agents SDK[14] 构建自定义服务器。前端的 Vite 服务器会将所有
/chatkit请求自动代理到本地 FastAPI 服务,从而实现前后端同步开发,无需额外配置。
ChatKit Studio
OpenAI 还准备了一个 ChatKit Studio[15] 来供大家探索学习。

Playground
一个可个性化设置的游乐场,支持配置导出。

如果你对配置参数有疑问,还可以点击字段后的 ℹ️ 进行对话交流,AI 的出现让技术学习成本进一步降低(老程序员已经泪流满面,这属于把文档喂到嘴里)。

Widget builder
这部分也很有意思,它让组件开发成本进一步降低,通过 AI 对话,直接生成组件,也支持 .widget 文件上传(会添加到侧栏 Widgets 下)。

画廊则展示了一些小部件,组件、图标就是标准的组件库内容,多一句嘴,咋感觉 OpenAI 把 shadcn[16] 又包了一层壳。


chatkit.world
chatkit.world[17] 是一个 Demo 演示,可以和 3D 地球进行交互式对话。OpenAI 大概就是想通过这个例子来演示 chatkit 的客服对话能力。

Evals
数据集、链路级打分、自动 Prompt 优化、第三方模型评测
新版 Evals 引入四大能力:Datasets、Trace Grading、Automated Prompt Optimization、第三方模型支持。它把“人标 + 自动评分 + 自动改写”串成闭环,并能在端到端执行轨迹上定位短板,显著提升生产级可验证性与回归效率。

RFT(强化微调)
面向推理任务的定制化
RFT 已在 o4-mini 全量开放,GPT-5 处于私测阶段;最新还加入“自定义工具调用策略(Custom tool calls)”与“自定义评分器(Custom graders)”,让团队把“何时、如何调用外部工具”和“按业务标准给出好答案”的偏好固化进模型行为。
📌
强化微调(RFT)是一种利用自定义评分器对模型输出打分,并根据得分信号持续优化模型权重的训练方法。相比传统微调,它不依赖固定答案,而通过“采样—评分—更新”的循环,使模型在复杂、高推理性的任务中逐渐学会符合特定目标(如准确性、风格、安全性或领域规范)的行为。适用于专家意见一致、可量化评分、具备一定成功率的任务,可在无需搭建强化学习基础设施的情况下,让模型达到更精细、专业的表现。
了解更多:Reinforcement fine-tuning[18]
可用性
ChatKit 与新 Evals 已普遍可用;Agent Builder 处于 Beta;Connector Registry 正面向具备 Global Admin Console 的 API/Enterprise/Edu 客户分批 Beta。与标准 API 模型定价打包;此外,ChatKit 文件/图片存储的计费自 2025-11-01 起生效,之前不收取此项费用(有免费额度与日计费说明)。

一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

四、Sora 2
Sora 2 是 OpenAI 新一代生成式视频模型,可从文本或图像生成带音频的高细节动态视频,对三维空间、运动与场景连续性有较强建模能力。面向开发者的 Video API 首次开放程序化的创建、扩展与二创能力,涵盖创建任务、查询状态、下载成片、分页列出与删除等完整管理接口。

模型选择
sora-2 主打速度与灵活性,适合探索期快速迭代、概念稿和社媒内容;sora-2-pro 注重稳定与画质,适合高分辨率、营销级与电影感产出,代价是更长渲染时延与更高成本。按“时效 VS 画质”选型。
任务流程
视频生成为异步过程:提交任务后获得 ID 与初始状态,随后通过状态查询或 Webhook 获取进度与完成/失败事件;到达完成态后再下载 MP4 内容。渲染时延随模型、系统负载与分辨率波动,需在前端提供进度反馈与合理的重试/退避策略。
{"id":"video_68d7512d07848190b3e45da0ecbebcde004da08e1e0678d5","object":"video","created_at":1758941485,"status":"queued","model":"sora-2-pro","progress":0,"seconds":"8","size":"1280x720"}
合规与限制
目前仅允许适合未满 18 岁受众的内容;受版权保护的角色与音乐会被拒绝;不可生成真实人物(含公众人物);带有人脸的输入图像会被拒绝。提示词、参考图和字幕等素材均需符合规则。
提示词策略
为提高一致性与可控性,应清晰描述机位、主体、动作、场景与光线(如“广角/特写”“镜头运动”“黄金时刻/晨光/浅景深”等)。更细的镜头语言能减少模型“意外发挥”,进阶可参考专门的提示词指南。
结果获取与资产
任务完成后可下载 MP4;下载链接有效期一般为 24 小时,需长期保存应尽快转存至自有存储。每个视频还可额外下载缩略图与雪碧图,用于预览、拖拽时间轴或素材库展示。
图像参考
可将输入图像作为首帧强引导,以保持品牌资产、角色或环境的外观一致性。参考图分辨率必须与目标视频一致,支持 JPEG/PNG/WebP。该方式尤其适合要求强一致性的广告与系列物料。
Remix 二创
对已完成视频可发起 Remix,在保留原结构、连贯性与构图的前提下做定向修改。最佳实践是每次只做一个明确的小改动(如调色、替换单个元素、增加第二个对象),以最大化保真并降低伪影风险,便于通过“小步快跑”打磨高质量序列。
素材库治理
API 支持分页列出视频以便做历史审计、看板与清理,并可按需删除不再使用的成片,结合对象存储与生命周期策略构建可审计、可回溯的素材管理流程。
工程建议
生产集成时,建议以 Webhook 驱动后台队列与状态机,前端仅展示用户可感知的进度与占位;将“提词模板 + 参考图 + 审核规则”固化为可配置项;按业务分层选择 sora-2 做探索、sora-2-pro 做终稿,确保成本与交付质量的平衡。
提示词指南
把提示词当作给摄影指导的简报:你不给细节,它就会自由发挥;写得越具体,可控性与一致性越高;留白越多,惊喜与变体越多。把提示词视作“愿望清单”而非合同——同一提示多次生成会有不同结果。最重要的是:反复迭代。机位、光线、动作的微调,常会带来截然不同的画面。参考 Sora 2 Prompting Guide[19]、Video generation with Sora[20]。
API 参数
这些属性只能通过 API 参数控制,不能用文字描述替代:
- model:sora-2 或 sora-2-pro
- size:分辨率 {宽}x{高}
- sora-2:1280×720,720×1280
- sora-2-pro:1280×720,720×1280,1024×1792,1792×1024
- seconds:时长 “4”、“8”、“12”(默认 “4”)
提示词决定“内容与风格”,参数决定“容器(分辨率/时长/质量)”。
- 分辨率:越高细节与运动一致性越好,越低越可能模糊或出 artifacts。
- 时长:短片段更易严格跟随指令。若可行,两个 4 秒拼接常好过一个 8 秒长镜头。
提示词骨架
把一条镜头写成“分镜卡”:机位/景别 → 景深 → 动作节拍 → 光线/色调。
需要多镜头时,每个镜头单独成段(一个机位、一种动作、一套光线),便于生成独立短片或连续片段。
- 短提示:留给模型更大创作空间,结果更“出其不意”。
- 长提示:更可控,但不一定每次都完全遵照。
示例(短提示,说明作用):
- “90年代纪录片风格” → 设定总体美学与摄影基调
- “一位瑞典老人坐在书房里” → 主体与场景的轻描
- “说:‘我还记得年轻时……’” → 明确对话,易被遵循
但未指定“时段、天气、服装、镜头角度、布景”等,模型将自行补全。
超详细提示
当你追求电影级可控,需用专业术语指定:镜头格式/镜头组、滤镜/调色、色盘/光源方向、质感/氛围/机位、构图/服化道/同期声/分镜时码、意图说明。
适用:匹配真实摄影风格(IMAX 航拍/35mm 手持/16mm 纪实等)与跨镜头连续性。
示例:
- Format & Look:4s;180° 快门;数码模拟 65mm 胶片对比;细颗粒;高光微晕 …
- Lenses & Filtration:32/50mm 定焦;Black Pro-Mist 1/4;偏振角度控制反射 …
- Lighting:左侧自然晨光;反射/负补/道具灯;薄雾穿束光 …
- Shot List:0.00–2.40 到位镜;2.40–4.00 轻弧移特写;并写明“为何好看”的摄影意图。
定风格标签
用“视觉线索”把风格钉住,先定风格标签(如 “1970s 电影” “IMAX 史诗” “16mm 黑白”),再叠加镜头/动作/光线细节。

机位/构图示例:
- wide establishing shot, eye level(广角定场镜头,视线高度)
- aerial wide, slight downward angle(空中广角,略微向下倾斜)
- medium close-up, slight back angle(中景特写,略微向后倾斜)
镜头运动示例:
- slow tilt(缓慢倾斜)
- handheld ENG(手持式 ENG 感)
引入角色时,措辞微变可能引起身份/姿态/焦点改变。跨镜头保持措辞一致可增强连续性。
控制运动与节奏
一镜只做一件事:一个清晰的镜头运动 + 一个清晰的主体动作。用节拍写动作(步数/停顿/转身),让时间可实现。
- 弱:演员走过房间。
- 强:演员向窗外走了四步,停顿了一下,并在最后一秒拉上了窗帘。
光线与色彩的一致性
光线决定情绪。剪辑要顺畅,光线逻辑一致最关键。写清 光质 + 光源/色温的搭配 与 色盘锚点(3–5 个颜色)。
- 弱:明亮的房间。
- 强:灯光+色调:柔和的窗台主光+暖色的补光灯,走廊边缘的冷色;色调:琥珀色/奶油色/胡桃棕色。
用图像输入获得更强可控性
将图像作为第一帧锚点:锁定角色设计、服装、布景或整体美学;文字提示控制“之后发生什么”。
- 作为 input_reference 传入
- 分辨率需与目标视频一致
- 支持:jpeg/png/webp
实验建议:没有现成参考图?用 OpenAI 图像生成模型先产出风格/场景草图,再作为参考输入 Sora,能快速探索审美与起片质量。
对白与音频
对白须写进提示词,并与视觉描述分区(如用 “Dialogue:” 段)。台词要短而自然,多角色需标注说话人并轮流,以便模型对齐口型与表情。
节奏上:4 秒容纳 1–2 句短句;8 秒可稍多。若无对白,也可用一两个声学提示(如“远处车流嘶声”)做节奏锚点。
用 Remix 小步快跑
Remix 是“微调杆”,不是“骰子”:一次只改一处,并明确修改点(如“镜头不变,换 85mm” “光位不变,只改色盘:teal/sand/rust”)。 屡次跑偏就减复杂度:定机位、简化动作、清背景;成型后再逐层加复杂度。这样可在保留结构/主体/机位稳定性的前提下,探索情绪、色彩或调度变体。
提示模板(描述型)
可将信息分层,方便保持一致性;不必“填满”,无关要素留白即可,留白会带来更多创意变体。
[场景散文式描述:人物/服装/场景/天气/质感等,尽量贴近目标画面]Cinematography:Camera shot: [景别+角度,如 wide establishing, eye level]Mood: [整体基调,如 cinematic & tense / playful & suspenseful]Actions:- [动作1:清晰节拍或手势]- [动作2:同一镜头内的第二节拍]- [动作3:可包含一句对白]Dialogue:[若有对白,写在此;保持简短以匹配时长]
提示示例
示例 1|手绘 2D/3D 混合动画
- 风格:软笔触、钨丝暖光、定格质感,水彩晕染与温暖-冷调平衡。
- 场景:杂乱工坊,小圆机器人坐在木凳上,眼睛幽蓝,摆弄嗡嗡作响的灯泡,窗外雨声与轻微机械嗡鸣。
- 摄影:中近景,缓慢推进;35mm 虚拟镜头,浅景深;顶灯暖主光,窗边冷辅助;氛围温柔、童趣、微悬念。
- 动作节拍:轻敲灯泡→火花→惊吓落手→慢动作接住→胸腔喷汽松口气→小声说“差点掉了……还好接住”。
- 背景声:雨、钟摆、轻微机械声与灯丝噪声。
示例 2|1970s 浪漫剧情片(35mm)
- 风格:自然炫光、柔焦、暖色晕亮,微 Gate-weave 与手持微颠;Kodak 质感颗粒与轻晕。
- 场景:金色时分的屋顶;白床单随风起伏,杂色串灯微嗡鸣;红丝裙女子赤脚起舞;男伴卷袖、吊带松垮,笑意自在;城市远处汽笛与地铁震动。
- 摄影:中广,平视缓推;40mm 球面;浅景深隔离人物与天际线;黄金自然主光+钨丝反打+串灯边光;基调怀旧、温柔、电影感。
- 动作与对白:旋转——裙摆接光;“看吧?连这座城今晚也跟我们一起跳。”——男伴牵手下沉——“那是因为你在领舞。”——床单掠过镜头,短暂遮蔽天际线又分开。
- 环境声:风、布料、街噪与远处音乐,无配乐。
小结
- 先定容器(参数,适用于 API 场景)后定内容(提示);短镜头更稳定。
- 清晰的镜头语言(机位/景深/动作节拍/光源与色盘锚点)= 更一致结果。
- 参考图作首帧锚定,确保品牌/角色/场景一致性。
- Remix 小步快跑,一次只改一处,稳定迭代到最终风格。
四、其他更新
GPT-5 Pro API
GPT-5 Pro 现已在 API 中可用。 它会花更多时间思考,以应对最艰巨的任务。

价格也很美丽,每 1M token $15/$120(input/output)

Codex 全面可用
Codex 现已正式全面可用,上线三大能力:
- Slack 集成 :在频道/线程直接 @Codex 分派任务、回链到云端结果;
- Codex SDK:首发 TypeScript,含 GitHub Action、可在 CI/CD 与 Shell 中用 CLI 运行。把与 Codex CLI 同源的智能体嵌入自家工作流,提供结构化输出与会话续接;
- 管理员工具:环境管控、受管配置与操作监控、跨 CLI/IDE/Web 的用量与评审质量看板。
自 8 月初起日用量 10× 增长,GPT-5-Codex 上线三周服务 40 万亿 tokens;OpenAI 内部工程师几乎全量使用,每周合并 PR +70%、PR 几近全量自动审查。Slack 集成与 SDK 面向 Plus/Pro/Business/Edu/Enterprise 开放;新管理功能面向 Business/Edu/Enterprise。自 10 月 20 日起,Codex Cloud 任务 将计入 Codex 用量。
技术影响
AgentKit 是 OpenAI 的“操作系统时刻”,意味着它不再满足于“卖模型”,而是要接管整个 Agent 开发生态的“标准层”。
AgentKit 对整个通用 Agent 世界的影响,可能比很多人意识到的要大得多。它把“Agent 开发”从工程问题变成配置问题,从编程语言时代推到了智能生态时代(就像从“写 Linux 内核”时代,进入了“在 iOS 上装 App” 的时代)。
- 平台化范式转移:AgentKit 把编排、交互、评测与安全收进同一技术栈,通用 Agent 的“搭积木工程”被压缩为“配置与策略设计”。门槛下降带来速度红利,也意味着“自建框架优势”快速贬值(如 LangChain[21]、AutoGPT[22]、CrewAI[23]、Dify[24]、n8n[25]、Flowise[26]、Dust[27] 等)。
- 在 AgentKit 之前,开发一个通用 Agent 像在搭一台拼装电脑:模型、Prompt、工具、评测、界面,全靠你自己焊线。每家公司都在搞自己的“小生态”,试图定义 Agent 框架的“标准接口”。
- 将编排逻辑、UI 和评测都被吸进了模型生态内部。过去一个 AI 团队要花几周搭 pipeline,现在拖几个组件数小时搞定。
- 语义标准成形:什么是一个“可部署的 Agent”被固化为:工具调用、上下文与记忆、守护策略、可回归评测。标准化提升可比性与可维护性,但减少了框架层的多样性,创新重心从“造框架”转向“造行为与流程”。
- 框架层短期百花齐放,长期被平台标准吞噬。以后大家不比“我接了多少接口”,而是比“我养出来的智能体在现实业务里,怎么做选择、怎么花成本、怎么拿结果”。
- 模型/Agent 边界变薄:RFT、Custom Tool Calls、Custom Graders 把策略与调用时机内化进模型,Agent 更像“带策略的模型态”。未来可迁移资产不再是 prompt 文本本身,而是数据集、评分器、策略包与连接器。
- 生态重新分工:通用 Agent 框架的护城河收缩,价值回落到两端:
- 要么做“多模型/自托管/数据主权”的基础设施。
- 要么做垂直场景的深度策略与知识工程。平台内核负责智能,外部系统负责流程与治理。
- 竞争焦点迁移:UI(chat 式对话)与编排形态(可拖拽 workflow)趋同后,胜负手变为:工具图谱设计、数据与评价体系质量、领域知识沉淀、风险与成本曲线控制。小团队可在同等工程水位下与大厂同场竞技,比的是策略密度与数据资产。
- ChatKit 对 Open WebUI[28] 之类的 chat 类对话也将造成部分冲击。
- 锁定与可逆权衡:一体化好用,但更容易被平台绑住,需留好后手(很香也很粘)。接口要可替换,数据要能带走,外层自动化要自己掌舵。
- 走向 Agent 经济:当单体 Agent 被标准化、可度量、可组合,下一步是 “Agent-to-Agent 协作协议”(Google 的 A2A[29] 协议?了解更多:Google A2A:多智能体通信协议)与可交易的能力市场。赢家不再只定义模型性能,而是定义协作规则、共享记忆与结算机制(Agentic Commerce 协议)的那套“操作系统”。
- …
最大的感受:世界级知识模型正在加速扩大自身影响力(比如 GPT、Gemini),当模型有了顶级智力,真就可以横扫一切。之前一直认为做平台化,培养生态是不太容易被取代,但看到 AgentKit 对 n8n 之类工作流的冲击,我开始有点怀疑了(n8n 更多是在做一些脏活累活,用集成度来扩大覆盖范围,自以为的护城河可能只是你以为)…
五、AI大模型从0到精通全套学习大礼包
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!
如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!

01.从入门到精通的全套视频教程
包含提示词工程、RAG、Agent等技术点
02.AI大模型学习路线图(还有视频解说)
全过程AI大模型学习路线


03.学习电子书籍和技术文档
市面上的大模型书籍确实太多了,这些是我精选出来的


04.大模型面试题目详解


05.这些资料真的有用吗?
这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。
所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。
资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势,构建起"前沿课程+智能实训+精准就业"的高效培养体系。
课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事!

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!
应届毕业生:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能 突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
更多推荐


所有评论(0)