日消耗 10 亿 Tokens，“AI 暴动级实干家”的四点心得｜开发者说

最近的 AI 实践依旧热火朝天，不论是 Cowork 还是 OpenClaw，各种各样的 Agents 都实实在在干事了。一个显性变化是，我们讨论 Tokens 消耗量的声音越来越多。以下是日消耗 10 亿量级 Tokens 的“AI 暴动级”实干家胥克谦的自述。

硅基流动

381人浏览 · 2026-02-27 11:49:33

硅基流动 · 2026-02-27 11:49:33 发布

1. PPT 即应用，PPT 即智能体

我正在做一件疯狂的事，放在以前根本不敢想象。我不是一个恋旧的人，以前的很多事情现在都不怎么提了，简单来说，从我确定自己的教育情结到现在，就一直扎在教育科技领域，做得比较深。很多年前，我就用当时的技术在教育领域里大规模使用动画，从创意到互动交付，大幅提升效率，降低成本，也获得过一些重要奖项。我一直觉得最符合自己的角色定位，就是“产品经理”。而我一直在做的，就是把课堂这件事做好，仅此而已。

我正在用大模型能力做一个“教学系统”，这个项目到目前为止经历了 4 个月，2 次彻底推翻重构，我一个人，200 万行代码，沉淀了 1400 万字文档。这个项目预计还需要至少 1 个月，估计会新增 100 万行代码。这或许是一个超大体量的个人 Vibe Coding 项目，对我来说，也是一个孤注一掷的挑战。

我的一位 CTO 朋友做了一个估算，对比传统的软件开发，我一个人用 4 个月完成了以往需要 120-150 人研发团队 2 年的工作量，个人效率比可能是 1:800。更有意思的是，一位投资人朋友给我算了笔账，如果只看 Tokens 消耗的钱，那可能是上万倍的资金效率。当然了，不管是看人/天，还是看钱，这两个数字都只是一个粗略参考，实际成本要复杂得多，不能这么简化，这种比较不严格成立。比如几百人团队做一个项目，招聘、沟通成本就很高，4 个月可能都不够开会的。

但这两个数字让我有“惊人”之感，从某个维度精准地表达了我的体验，我实在地感受到了 AI 能力对我个人的一种“彻底的解放”，我体会到了一种根本性变化。

回到我专注的教育场景，其实复杂度非常高。一个教学系统基本等于把“内容+框架+课件+互动+老师+课程+教室+数据+运营+……”这些东西都聚合起来。类比来讲，一个教学系统是多个复杂能力的合集，包含 PPT、会议、游戏、营销、剪辑视频、CRM 等等。

我稍微展开一点来说：

一个比 WPS 更复杂的 PPT 工具，每一页 PPT 都要能绑定智能体的工作流，能点击、能交互、有数据。比如自动识别当前页面的职能，触发相应的交互，记录学生的个性化回答，最终生成每个学生独特的作品。
一个类似腾讯会议的实时课堂系统，但不是把 PPT 当视频流推送，而是像游戏房间一样，老师的每一次点击都会触发所有学生端的同步响应，支持个性化交互。
一个简化版的剪映，用来处理视频素材，时间轴清晰，支持自动抠绿幕，能把实时课程转化为带交互能力的录播课。

一个多级架构的 CRM 系统，管理机构、分支、员工等复杂的组织关系。
这里我多说几句 PPT 相关的，市面上已经有那么多相关工具了，为什么我还要自己做。这还得回到教学、回到课堂这个场景。教育信息化这么多年，留下来的基本上就是 PPT，智能体进课堂很不容易，为什么？不是老师保守，我们得理解在课堂里，教学环节是灵魂，是不能打乱的。一个班 50 个孩子，老师得有一个东西像指挥千军万马那样，掌控教学环节。以前就是老师统一指挥，学生千人一面，没办法实现个性化教学。现在技术能力支持了，就可以做到老师统一指挥，学生千人千面。

这里面就有太多事情可以做了，交互、分析、生成、上下文的记忆能力等等，PPT 是载体，每一页都可能是多个工作流。举个交互的小场景，这一页的内容是先提个问题？还是给出 ABC 让学生做选择？或者让学生把这句话记下来？这就需要自动识别这一页的教学目标，自动匹配，自动生成交互方式。你看，这样就可以实现，教学环节一致，但是每个孩子的体验都是个性化的。

再比如课堂任务是编创一个西游记故事：第一个环节是到哪里了？第二个环节唐僧为什么被抓走、被谁抓走？下一个是孙悟空怎么去营救、怎么失败的？再一个是求助的是谁、获得了什么新能力/新宝贝？最后一个环节是怎么挑战并成功，继续西行。每一个环节一个问题，对应一页 PPT，有相应的交互，进入大模型工作流的一个节点，最后再生成各自的作品。一个班 50 个孩子，每个人的作品都是不同的。

继续延伸，我正在做的就是让 PPT 自然具备类似扣子工作流的能力，让智能体以更自然的体验进入用户情景，这会带来很多原来难以想象的改变。那就不仅是教育场景了，其实可以成为通用能力，有非常大的想象空间。我总结了下，就是 Slides as App, Slides as Agent（PPT即应用，PPT即智能体）。我对此满怀热情，每天都在一点点建设中，看着自己的构想一步步实现，幸甚，快哉。

2. 重构产品理念，不是做轻，是做“重”

这几个月的实践，对我的产品理念也有很大冲击，很多我之前坚持的东西都发生了一些动摇。

产品经理能力大释放

我过去是坚决不碰代码的，故意不碰，那时候我有一个方法论叫**“站着说话不腰疼”**。作为产品经理，我必须 100% 代表用户角色，而不是顾及团队“能不能做到”。如果我太懂技术，团队就会认为我应该理解他们的困难，很容易陷入情绪化妥协。

这种坚决不要懂的执拗背后，是产品经理这个角色的根本困境：产品经理的能力依赖资本。无论多么优秀的产品经理，都无法独立完成产品。做硬件要工厂，做软件要团队，产品经理永远需要钱和人。更痛苦的是，即使有了团队，产品经理的想法也会在对齐过程中大量损耗。坦白说，过去我的创意和设计连 10% 都实现不了，大部分都在对齐的过程中丢掉了，有太多东西在妥协。

现在不一样了，产品经理第一次可以不依赖资本和团队独立完成产品。有了大模型能力，形同拥有上百人研发团队并拿到千万融资。我依然没自己写代码，但我开始懂了，我直接介入了，我和 AI 像和人一样打交道，但沟通效率高了不知道多少倍。

我以前从来不相信所谓的“一人公司”，至少我认为产品经理一个人是做不了大事的，得靠团队、靠资本。但现在，我真的在做着一个如此复杂的教学系统，开始体验到**“一个人也可以做很大的事儿”。当然了，我后面还是会有团队的，但现在我可以先把自己想做的都做出来**。

3. AI 产品“要做重”

过去很长一段时间，我们都被反复教育，默认做产品一定要轻，从一个 MVP 原型开始，快速迭代把产品滚出来，好产品是改出来的。我对此深信不疑，骨子里这么认为，也一直都是这么干出来的。

AI 来了，做个 MVP 变得极其简单。我们听过太多几小时做一个产品 Demo 的故事，我自己也有过这么一段时间，很嗨皮、穷乐呵。但是现在我觉得做这些东西的意义不大，你做 100 个产品上不了线，那这个数量就只是个虚荣指标。你 24 小时极限编程做出一个东西，隔天可能就有成千上万个复刻款，这样的东西没办法真正商业化。

MVP 可以实现得更快更多，用之前打磨一个 MVP 的时间周期，现在恨不得能把整个产品都做出来了，但这丝毫没有改变一个本质逻辑，产品是市场需求决定的，不是开发成本决定的。市场会自然形成平衡：你简单了大家都简单，然后大家就会开始增加复杂度，拼来拼去，到最后发现还是需要差不多的周期。

轻应用活不下来，真的能上线，可商业化，还是要做重，老老实实回到用户情景。虽然我做的项目过重了一点点，有点夸张，可能是因为胆子比较大。但我相信，这个产品上线之后，在一个很长的周期里，基本上不会有竞品。

4. Tokens 消耗不够，出不来方法论

我有一个观点：能不能消耗到一亿 Tokens 是 AI 编程的一个基本入门门槛；日均消耗一亿 Tokens 是真正熟练掌握 AI 编程的门槛。有人说这是暴论，说法确实粗糙了一些，但这就是我最近的一个体会，还是想毫无保留地分享出来。

为什么这么说呢？其实也简单，就是实践出真知。干，才是关键，Tokens 消耗量是 AI 编程的硬指标。你没消耗到这么多 Tokens，只是用 AI 写点小玩意儿，简单聊聊天，那基本等于没入门。写多了，才能知道 AI 的能力边界，才能理解什么叫自动化，有哪些问题需要解决，怎么在不同的情况下提升效率，搞清楚 AI 到底有多大的处理能力，能 Hold 住多大的架构……也就是说，得体会过一定的复杂度，做到一定规模，才能看到真问题，体验找答案的快乐。Tokens 消耗量与遇到过的问题正相关，与解决过的难题正相关。

换句话说，真正的方法论来自于极限施压下的不断优化，你得遇到不得不去优化的问题，才会产生方法论。对我来说，AI 编程到现在，我觉得最有用的方法就是写文档，文档是 AI 编程的灵魂。但是在没用 AI 写那么多代码之前，Tokens 消耗量不过亿的时候，我基本就在折腾提示词。Tokens 消耗过亿后，发现这一招不管用了，我得想更有效的方式，这时候就开始文档驱动了。

打磨到现在，我的文档主要有三份，第一份叫**“研究设计文档”**，这是大模型自动命名的，这里面其实就是我们熟悉的需求文档、设计文档、PRD 文档等等，在这里做的事包括研究行业情况、研究我的产品、研究产品特色怎么实现、怎么跟行业最佳实践结合、怎么做取舍，最后确定方案，也包括用 ASCII 描述出每个界面长的样子。

然后就到了第二份**“架构文档”**阶段，设计出能实现产品思路的整套说明书。分享一个细节，我一般不在这个环节做 UI，我认为 UI 前置是有害的，会框住架构设计，当然了这些思路还是由我的产品方法论决定的，源于我的实践。这段时间我的真实感受是，大模型能够承担百万年薪量级的架构师角色，大模型架构能力的发挥取决于产品经理角色跟它的配合，你提的问题质量越高，它给你的专家水平也越高。我跟高水平架构师配合过，现在和大模型配合，说实话，体验还要更好一些。现在，我更能看到产品架构的全貌，我对全技术栈的盲区越来越少了。

有了架构文档，最后就是**“分阶段开发规划文档”**。因为架构文档很大，这么大项目的任何一个子模块的子模块，把其架构文档扔给模型，它的上下文都可能会爆。所以要拆分成分阶段的开发计划，一般是 5-20 个开发阶段，每个阶段又会把前后端分开，分别开发。

这是我总结出来的，其实过程中会反复偏离规划，需要不断纠正。比如什么地方容易爆上下文，怎么去做自动化拆分的机制？断了以后没法继续，陷于无限循环怎么办？只能继续想办法，把整个过程的 To-do 给持久化，也就是说每一个任务的执行都会触发一个 Skill 去把 To-do 保存成文件。每一个任务、子任务完成都要去标注一下，把 To-do 标注成 Doing 或者是 Done。如果执行断了，就触发这个 To-do 文件，我只需要说“继续执行” 这四个字就行了。

再说一个关键挑战，怎么解决编程幻觉的问题？我逐步摸索出了一套**“Mock 驱动开发”**的路子。有了架构文档，就有了一套 API 契约手册，我会让大模型开发一套 Mock Server，所有输出变得可控，无限接近于 0 幻觉。比如前端的某个模块，5-7 层代码，用分层拦截做 Mock。这样，代码出现 Bug 时，可以精准定位、直接修改。

从解决第一个问题开始去创建第一条规则，这一个循序渐进的过程。这中间积累的方法论、每一个沉淀下来的东西，会发挥越来越大的价值。我和身边的朋友分享了这套“文档驱动开发”的工程化落地方法，一位大厂的朋友在他的部门做了推广，收到了特别好的反馈，帮他们提升了 PRD 质量，也提高了协同效率。

最后补充一点，也是很多人关心的一个问题：既然文档这么关键，那有没有啥模型推荐，可以把文档这件事一次性做好？答案是，没有哪个模型可以一步到位完成文档设计，这件事没有捷径。也不要轻信任何框架、任何模式，我们可以做的就是增多轮次，多尝试各种模型组合，从多角度、用多个虚拟角色来对文档反复进行可靠性验证。

5. 能做事，就是最幸福的事

说了这么多我最近在做的事，看着项目每天都在更往前一步，还有点小激动。
很多人好奇我整这么大一个开发项目，自己的状态到底咋样，其实没想象中那么苦。我现在每天都带着期待起床，先去检查下昨天布置给“数字伙伴们”的工作，一般每台机器都开着 6-8 个窗口，有 4-12 个并行任务在执行。检查完，给工作反馈和下一步指令，我自己实际的工作负荷差不多 40-50%，这几天甚至可以到 20%，自然有大把时间做其他事，比如刷剧、带娃、线上线下和真人社交。我可太喜欢现在这种不慌不忙、常有惊喜的的生活节奏了。

但我也慌张过，崩溃过，走过弯路，也有过“全靠熬”的日子。最开始下定决心学 AI Coding，模型能力还不够好，一试就废，根本什么都做不出来，有 2 个月我甚至都处于停工状态。怎么办？就三个字：熬过去。那段时间也做一些强度很大的锻炼，一边强迫自己锻炼上瘾，一边继续逼自己折腾 Vibe Coding，后来就拿到了结果，尝到了甜头，人也越来越兴奋。Skill 出来后，更是感觉工具箱里添砖加瓦了，定制了各种 Skills。

新模型、新技术层出不穷，也让我慢慢体会到自己视角的改变，不再是站在新技术背后看背影，想着追赶；而是思考技术发展的脉络，和它平行前进，甚至跑到它前面去看，站在终点去等它。这个让事情变简单、稳定的类似“压舱石”的东西其实就是“用户情景”，与我来说就是“课堂”这件事。先有这个命题，再看技术怎么能更好地解决问题。

以前我被困住，得等团队、等资本才能实现自己的想法。疫情几年，也依旧困在原地，什么也做不了。所以现在，我极其珍视这种“被解放”的感觉。真的，能做事就是最幸福的事。

想起以前我们吐槽老板的一个笑话，说你能不给我做个微信？现在看起来，这好像也不是那么难。当一切皆有可能，那么有价值的就变成了我们到底想问一个什么问题，再往深追问，或许就是我们是否有一个愿力（Will）：你想做什么？想用 AI 做一件多大的事？你能坚持多久？你能承受多大的复杂度？而我现在就是心怀愿力，干就完事。

最后，我也很好奇，你正在做或者想做哪些事儿？有关注自己的 Tokens 消耗量吗？沉淀了哪些方法？期待分享交流。

如果你也是 AI 实践者、探索者，欢迎分享你的足迹，让更多人看见你的故事。