编译 | 苏宓

出品 | CSDN(ID:CSDNnews)

过去一年,大模型公司的竞争几乎都围绕着几个热门方向展开:谁的编程能力更强、谁的搜索体验更好、谁能率先做出真正有用的 AI Agent。

但最近,一个新的战场正在快速升温——网络安全。

前不久,Anthropic 推出了 Mythos 系列模型,希望让 Claude 帮助安全研究人员发现漏洞、分析攻击路径,甚至参与关键基础设施的安全防护。而就在 6 月 22 日,OpenAI 也宣布扩展 Daybreak 安全计划,推出更新版 GPT-5.5-Cyber 模型、Codex Security 插件、Daybreak Cyber Partner Program⁠,以及一个面向开源生态的“Patch the Planet(修补星球)”计划。

图片

根据官方介绍,包括 Go、Python、Curl 在内的多个重要开源项目已经承诺参与“Patch the Planet”。未来,AI 不仅负责安全分析和漏洞挖掘,还会尝试生成补丁、提交代码,并协助维护者完成修复工作。

图片

Daybreak 到底是什么?

Daybreak 最早于今年 5 月发布,它把 OpenAI 最新的网络安全能力整合在一起,包括前沿模型能力、“可信网络安全访问”、Codex Security 工作流,以及生态合作伙伴,算是 OpenAI 面向网络安全领域推出的一整套 AI 防御体系。

 OpenAI 给它定下的目标是帮助经过授权的安全防御人员,在现有的安全和开发流程里完成这些事情:验证漏洞是否真实存在、判断风险优先级、生成并测试修复方案,并把相关证据记录下来。

OpenAI 希望通过这套系统,让组织即使面对不断加速变化的网络安全威胁,也能更高效地保持安全。

在此次 Daybreak 计划中,OpenAI 带来了几项重磅更新。

图片

图片

GPT-5.5-Cyber「满血版」来了

此次更新最大的看点之一,是 GPT-5.5-Cyber 的更新。

事实上,这个模型并不是第一次出现。

今年 5 月,OpenAI 已经开始向部分经过审核的网络安全研究人员和关键基础设施防御团队开放测试版本。如今,其向部分安全研究员正式推出了 GPT-5.5-Cyber 的「满血」版本。

据悉,最初的 GPT-5.5-Cyber 预览版本主要目标是减少模型在专业安全工作流中过度拒绝请求的情况。而此次更新进一步强化了其能力,使其成为目前在漏洞发现与修复辅助方面最强的模型之一,同时仍保留 GPT-5.5 的通用能力,能够处理长链条、复杂任务。

在实际能力上,该模型可以对大型代码库进行更深入分析,包括识别与安全相关的代码组件、判断漏洞是否可被实际利用、在受控环境中验证问题、生成并测试修复方案,并整理相关证据供人工审查。其目标被描述为帮助防御方完成从漏洞发现到修复验证的完整流程,而不仅仅是生成更多安全告警。

在 CyberGym 基准测试中,更新后的 GPT-5.5-Cyber 在单模型评测中达到 85.6%,高于 GPT-5.5 的 81.8%,为目前该测试中的最高单模型成绩。

图片

在另外两项安全基准测试中,该模型同样优于前代版本:在 ExploitGym 中得分为 39.5%,相比 GPT-5.5 的 25.95%;在 SEC-bench Pro 中得分为 69.8%,高于 GPT-5.5 的 63.1%。

图片

不过 OpenAI 也强调,基准测试仅能反映部分能力,更关键的是模型在真实环境中是否能够发现实际漏洞、区分有效问题与噪声,并协助完成安全修复流程。目前,该公司仍在结合真实代码库和漏洞披露流程,对模型表现进行持续评估。

对于实际使用场景,OpenAI 认为,大多数安全团队更适合从 GPT-5.5 结合 Trusted Access for Cyber 与 Codex Security 工作流开始使用。而 GPT-5.5-Cyber 则面向经过验证的安全人员,用于需要更高能力与更少限制的高级安全任务,并配套更严格的监控与权限控制机制。

在早期 Daybreak 项目实践中,GPT-5.5 与 Codex Security 已被用于协助在 Firefox、V8、Safari、OpenBSD、FreeBSD 以及 HTTP/2 等多个广泛使用的软件系统中发现并验证安全漏洞。

图片

让开源修复落地

此外,OpenAI 还联合 Trail of Bits 发起,并与 HackerOne 等安全平台合作,推出了一个名为 “Patch the Planet”的倡议。

可以简单理解成:OpenAI 想用 AI 给开源维护者“补人手”,帮他们处理现实中最难的一步——修复漏洞,帮开源项目把漏洞“真正修好”,而不是只负责“发现问题”。

之所以这么做,原因也很现实。今天很多开源软件支撑着互联网基础设施,从开发工具到网络服务,再到各种公共系统都依赖它们。但很多关键项目其实只有很小的维护团队在支撑,有些甚至长期只有不到十个核心开发者,却要负责绝大部分代码维护工作。

此前,AI 确实能更快发现漏洞,但也带来了新的负担:安全报告数量暴增,其中还夹杂大量误报。对维护者来说,不再是“没漏洞可修”,而是“看不完、处理不完”。

所以 Patch the Planet 的思路不是简单丢一堆 AI 报告给维护者,而是换一种方式:先由安全研究员(结合 AI 工具)把漏洞筛一遍、去重、验证,并且尽量先生成可用的修复方案,再交给维护者确认。

在执行方式上,这个项目会先和开源项目维护者沟通,确认他们的优先级、修复习惯和漏洞披露流程,然后由安全研究员团队主导整个流程,AI 负责辅助分析和生成补丁,人工负责把关,最终再交付给维护者。

参与项目的开源团队可以获得 ChatGPT Pro、Codex Security 的使用权限,以及 API 额度,用来支持开发和自动化工作流。

当前超过 30 个开源项目承诺参与,首批参与者包括 cURL、Go、Python、Sigstore 和 pyca/cryptography。

据 OpenAI 披露,在早期试点中,这个计划在短短几天内就发现了数百个潜在问题,合并了数十个修复补丁,并且还建立了一套可以复用的测试流程,用来更系统地找漏洞和验证修复效果。

图片

其他重磅更新

不止于此,与 GPT-5.5-Cyber 一同升级的,还有 OpenAI 的 Codex Security 工具链。

OpenAI 发布了新版 Codex Security 插件,希望把原本需要安全专家完成的许多工作进一步自动化。借助这一工具,开发者不仅可以对代码进行深度安全扫描,还能分析近期代码变更可能带来的风险,自动生成包含漏洞等级、受影响代码位置、验证依据以及修复建议在内的安全报告。

在发现问题之后,Codex Security 还能够进一步分析漏洞的攻击路径、构建威胁模型、验证漏洞是否真实存在,并根据具体代码库生成可供开发者审核的修复补丁。

除了发现新漏洞,这套工具也被设计用于处理企业已经积压的大量安全问题。例如,它可以读取来自漏洞扫描器、安全公告、漏洞赏金计划或工单系统中的历史报告,对这些问题进行筛选、验证和优先级排序,并自动生成对应补丁,帮助团队更快完成修复工作。

从 OpenAI 的定位来看,Codex Security 并不是单纯的漏洞扫描工具,更像是一名能够参与完整安全开发流程的 AI 安全工程师。它既能帮助发现问题,也能协助验证问题、生成修复方案,并将结果对接到企业现有的漏洞管理系统和开发工具链中。

另外,OpenAI 还宣布启动 Daybreak Cyber Partner Program(Daybreak 网络安全合作伙伴计划),希望通过与安全厂商合作的方式,将其网络安全能力进一步推广到企业市场。

根据 OpenAI 的介绍,加入该计划的安全产品和服务提供商,可以在自身产品中接入 GPT-5.5 及 Trusted Access for Cyber 能力,用于漏洞分析、安全检测和防御工作流等场景。企业客户虽然不会直接获得模型访问权限,但可以通过这些合作伙伴提供的产品和服务,间接使用相关能力。

图片

OpenAI 与 Anthropic 的新战场

Daybreak 的出现,也被不少业内人士视为 OpenAI 对 Anthropic 的直接回应。

过去几个月,Anthropic 推出了面向网络安全领域的 Mythos 项目,希望将 Claude 的推理能力用于漏洞研究和防御场景。

而 OpenAI 则迅速推出 Daybreak 和 GPT-5.5-Cyber。

双方正在形成一场新的竞争:谁能率先成为企业安全团队的 AI 平台。

事实上,这场竞争背后还有更大的背景。越来越多研究表明,前沿大模型已经具备相当强的漏洞分析和利用能力。部分测试中,模型甚至能够帮助研究人员快速构造漏洞利用代码、发现系统弱点。

这也是为什么 OpenAI 和 Anthropic 都没有完全开放最强安全模型。

因为同样的能力既能用于防御,也能用于攻击。如何在帮助安全研究人员与防止滥用之间取得平衡,正在成为所有前沿 AI 公司必须面对的问题。

参考:

https://openai.com/index/daybreak-securing-the-world/

更多推荐