最近,AI 圈炸了个大新闻 —— 疑似 GPT-5 的系统提示词在 GitHub 上被公开了!这份长达 15000 多个 Token 的文档,短短几天就拿下了 8.8K Star,让开发者和 AI 爱好者们沸腾不已。到底这份泄露文档藏着多少秘密?又会给我们带来哪些影响?今天就来好好扒这件事。


1.事件始末:从 Reddit 到 GitHub,1.5 万 Token 文档火了

        事情要从 2025 年 8 月 8 日说起。当时 Reddit 上一个名叫 OngaOngaOnga 的用户,声称自己用 “越狱” 技巧提取出了 GPT-5 的系统提示词。没过多久,X 平台上也有用户跟风发布了类似内容。

        直到 8 月 24日,GitHub 上一个专门收录大模型系统提示词的仓库,把这份文档正式上传。这个仓库的所有者 Ásgeir Thor Johnson 之前就整理过不少其他模型的提示词,算是业内小有名气的 “收藏家”,这也让这份泄露文档多了几分可信度。

https://github.com/asgeirtj/system_prompts_leaks/blob/main/OpenAI/gpt-5-thinking.md) 


2.泄露内容大揭秘:GPT-5 的 “行为准则” 全曝光

        我们将这个文档梳理成了一个GPT-5系统提示词核心对照表:

        这份文档里的内容,简直像是打开了 GPT-5 的 “说明书”,里面藏着不少关键信息:

        首先是身份声明,明确写着 “你是 ChatGPT,一个基于 GPT-5 模型的大型语言模型,由 OpenAI 训练”,算是给 GPT-5 定了 “身份牌”。

        然后是知识截止日期,标注为 2024 年 6 月,但同时支持动态显示当前日期,这也解释了为什么 GPT-5 能回答一些近期的问题。

        在沟通风格上,要求保持 “有洞察力和鼓励性”,还得避免犹豫的表达,难怪有时候感觉 GPT-5 的回答特别干脆。

        最让人关注的是工具使用规范,里面详细列出了代码解释、网页浏览、文件搜索、图像生成等功能,但强调只有符合严格规则才能启用,这也帮我们摸清了 GPT-5 的 “能力边界”。


3.是真泄露还是 “烟雾弹”?

a.支持 “真实” 的证据

        GPT-5 自己的验证:我们拿着这份的系统提示词表格询问GPT-5,然后给了我们一份对比表

        技术特征匹配:用 OpenAI 的分词器分析,这份文档的 Token 数量是 17803,和 GPT-5 的处理能力相符;里面提到的知识截止日期、动态日期功能,也和官方公布的 GPT-5 特性一致;甚至文档末尾的 “模型当前版本是 GPT-5 Thinking”,都和官方的模型变体名称对得上。

        社区验证:很多用户自己测试了文档里提到的功能,比如记忆管理、工具调用,发现实际使用效果和文档描述一样;而且部分内容和 OpenAI 之前发布的官方信息也能对应上,这些都让文档的可信度更高了。

b.质疑 “真实” 的声音

        GPT-5 的官方否认:当直接问它这份泄露文档是不是真的,它说 “无法披露专有系统提示词,不会把外部泄露当权威来源,只遵循内部指令”,还提到 “可能存在诱饵或替身文本”,这就让人有点怀疑了。

        文档本身的问题:这份文档内容不全,比如没详细说网页浏览的规则,但实际 GPT-5 在浏览功能上有严格限制,这明显对不上;有人觉得,这可能是旧版本的提示词,不是现在用的最新版。

    有人从OpenAI 的动机出发:猜测这可能是 OpenAI 放的 “烟雾弹”。比如故意放出假提示词,迷惑黑客,保护真正的核心信息;或者混一些真假信息,引导竞争对手的研究方向;甚至可能是一种营销手段,借 “泄露” 的热度,提高 GPT-5 的关注度。

c.综合判断: 部分真实,不全最新

        综合来看,最可能的情况是:这份文档里有不少真实内容,但不是完整的最新版本,可能还混了一些虚假信息。

        一方面,模型验证、技术特征、社区测试都证明,里面很多内容和 GPT-5 的实际情况一致,不太可能是完全编造的;

        另一方面,官方否认、内容不全,又说明它不是完整的最新版。

Logo

中科创新烁智(CSCITech)

更多推荐