日消耗 10 亿 Tokens,“AI 暴动级实干家”的四点心得|开发者说
最近的 AI 实践依旧热火朝天,不论是 Cowork 还是 OpenClaw,各种各样的 Agents 都实实在在干事了。一个显性变化是,我们讨论 Tokens 消耗量的声音越来越多。以下是日消耗 10 亿量级 Tokens 的“AI 暴动级”实干家胥克谦的自述。
最近的 AI 实践依旧热火朝天,不论是 Cowork 还是 OpenClaw,各种各样的 Agents 都实实在在干事了。一个显性变化是,我们讨论 Tokens 消耗量的声音越来越多。以下是日消耗 10 亿量级 Tokens 的“AI 暴动级”实干家胥克谦的自述。
1. PPT 即应用,PPT 即智能体
我正在做一件疯狂的事,放在以前根本不敢想象。我不是一个恋旧的人,以前的很多事情现在都不怎么提了,简单来说,从我确定自己的教育情结到现在,就一直扎在教育科技领域,做得比较深。很多年前,我就用当时的技术在教育领域里大规模使用动画,从创意到互动交付,大幅提升效率,降低成本,也获得过一些重要奖项。我一直觉得最符合自己的角色定位,就是“产品经理”。而我一直在做的,就是把课堂这件事做好,仅此而已。
我正在用大模型能力做一个“教学系统”,这个项目到目前为止经历了 4 个月,2 次彻底推翻重构,我一个人,200 万行代码,沉淀了 1400 万字文档。这个项目预计还需要至少 1 个月,估计会新增 100 万行代码。这或许是一个超大体量的个人 Vibe Coding 项目,对我来说,也是一个孤注一掷的挑战。
我的一位 CTO 朋友做了一个估算,对比传统的软件开发,我一个人用 4 个月完成了以往需要 120-150 人研发团队 2 年的工作量,个人效率比可能是 1:800。更有意思的是,一位投资人朋友给我算了笔账,如果只看 Tokens 消耗的钱,那可能是上万倍的资金效率。当然了,不管是看人/天,还是看钱,这两个数字都只是一个粗略参考,实际成本要复杂得多,不能这么简化,这种比较不严格成立。比如几百人团队做一个项目,招聘、沟通成本就很高,4 个月可能都不够开会的。
但这两个数字让我有“惊人”之感,从某个维度精准地表达了我的体验,我实在地感受到了 AI 能力对我个人的一种“彻底的解放”,我体会到了一种根本性变化。
回到我专注的教育场景,其实复杂度非常高。一个教学系统基本等于把“内容+框架+课件+互动+老师+课程+教室+数据+运营+……”这些东西都聚合起来。类比来讲,一个教学系统是多个复杂能力的合集,包含 PPT、会议、游戏、营销、剪辑视频、CRM 等等。
我稍微展开一点来说:
-
一个比 WPS 更复杂的 PPT 工具,每一页 PPT 都要能绑定智能体的工作流,能点击、能交互、有数据。比如自动识别当前页面的职能,触发相应的交互,记录学生的个性化回答,最终生成每个学生独特的作品。
-
一个类似腾讯会议的实时课堂系统,但不是把 PPT 当视频流推送,而是像游戏房间一样,老师的每一次点击都会触发所有学生端的同步响应,支持个性化交互。
-
一个简化版的剪映,用来处理视频素材,时间轴清晰,支持自动抠绿幕,能把实时课程转化为带交互能力的录播课。
一个多级架构的 CRM 系统,管理机构、分支、员工等复杂的组织关系。
这里我多说几句 PPT 相关的,市面上已经有那么多相关工具了,为什么我还要自己做。这还得回到教学、回到课堂这个场景。教育信息化这么多年,留下来的基本上就是 PPT,智能体进课堂很不容易,为什么?不是老师保守,我们得理解在课堂里,教学环节是灵魂,是不能打乱的。一个班 50 个孩子,老师得有一个东西像指挥千军万马那样,掌控教学环节。以前就是老师统一指挥,学生千人一面,没办法实现个性化教学。现在技术能力支持了,就可以做到老师统一指挥,学生千人千面。
这里面就有太多事情可以做了,交互、分析、生成、上下文的记忆能力等等,PPT 是载体,每一页都可能是多个工作流。举个交互的小场景,这一页的内容是先提个问题?还是给出 ABC 让学生做选择?或者让学生把这句话记下来?这就需要自动识别这一页的教学目标,自动匹配,自动生成交互方式。你看,这样就可以实现,教学环节一致,但是每个孩子的体验都是个性化的。
再比如课堂任务是编创一个西游记故事:第一个环节是到哪里了?第二个环节唐僧为什么被抓走、被谁抓走?下一个是孙悟空怎么去营救、怎么失败的?再一个是求助的是谁、获得了什么新能力/新宝贝?最后一个环节是怎么挑战并成功,继续西行。每一个环节一个问题,对应一页 PPT,有相应的交互,进入大模型工作流的一个节点,最后再生成各自的作品。一个班 50 个孩子,每个人的作品都是不同的。
继续延伸,我正在做的就是让 PPT 自然具备类似扣子工作流的能力,让智能体以更自然的体验进入用户情景,这会带来很多原来难以想象的改变。那就不仅是教育场景了,其实可以成为通用能力,有非常大的想象空间。我总结了下,就是 Slides as App, Slides as Agent(PPT即应用,PPT即智能体)。我对此满怀热情,每天都在一点点建设中,看着自己的构想一步步实现,幸甚,快哉。

2. 重构产品理念,不是做轻,是做“重”
这几个月的实践,对我的产品理念也有很大冲击,很多我之前坚持的东西都发生了一些动摇。
产品经理能力大释放
我过去是坚决不碰代码的,故意不碰,那时候我有一个方法论叫**“站着说话不腰疼”**。作为产品经理,我必须 100% 代表用户角色,而不是顾及团队“能不能做到”。如果我太懂技术,团队就会认为我应该理解他们的困难,很容易陷入情绪化妥协。
这种坚决不要懂的执拗背后,是产品经理这个角色的根本困境:产品经理的能力依赖资本。无论多么优秀的产品经理,都无法独立完成产品。做硬件要工厂,做软件要团队,产品经理永远需要钱和人。更痛苦的是,即使有了团队,产品经理的想法也会在对齐过程中大量损耗。坦白说,过去我的创意和设计连 10% 都实现不了,大部分都在对齐的过程中丢掉了,有太多东西在妥协。
现在不一样了,产品经理第一次可以不依赖资本和团队独立完成产品。有了大模型能力,形同拥有上百人研发团队并拿到千万融资。我依然没自己写代码,但我开始懂了,我直接介入了,我和 AI 像和人一样打交道,但沟通效率高了不知道多少倍。
我以前从来不相信所谓的“一人公司”,至少我认为产品经理一个人是做不了大事的,得靠团队、靠资本。但现在,我真的在做着一个如此复杂的教学系统,开始体验到**“一个人也可以做很大的事儿”。当然了,我后面还是会有团队的,但现在我可以先把自己想做的都做出来**。
3. AI 产品“要做重”
过去很长一段时间,我们都被反复教育,默认做产品一定要轻,从一个 MVP 原型开始,快速迭代把产品滚出来,好产品是改出来的。我对此深信不疑,骨子里这么认为,也一直都是这么干出来的。
AI 来了,做个 MVP 变得极其简单。我们听过太多几小时做一个产品 Demo 的故事,我自己也有过这么一段时间,很嗨皮、穷乐呵。但是现在我觉得做这些东西的意义不大,你做 100 个产品上不了线,那这个数量就只是个虚荣指标。你 24 小时极限编程做出一个东西,隔天可能就有成千上万个复刻款,这样的东西没办法真正商业化。
MVP 可以实现得更快更多,用之前打磨一个 MVP 的时间周期,现在恨不得能把整个产品都做出来了,但这丝毫没有改变一个本质逻辑,产品是市场需求决定的,不是开发成本决定的。市场会自然形成平衡:你简单了大家都简单,然后大家就会开始增加复杂度,拼来拼去,到最后发现还是需要差不多的周期。
轻应用活不下来,真的能上线,可商业化,还是要做重,老老实实回到用户情景。虽然我做的项目过重了一点点,有点夸张,可能是因为胆子比较大。但我相信,这个产品上线之后,在一个很长的周期里,基本上不会有竞品。

4. Tokens 消耗不够,出不来方法论
我有一个观点:能不能消耗到一亿 Tokens 是 AI 编程的一个基本入门门槛;日均消耗一亿 Tokens 是真正熟练掌握 AI 编程的门槛。有人说这是暴论,说法确实粗糙了一些,但这就是我最近的一个体会,还是想毫无保留地分享出来。
为什么这么说呢?其实也简单,就是实践出真知。干,才是关键,Tokens 消耗量是 AI 编程的硬指标。你没消耗到这么多 Tokens,只是用 AI 写点小玩意儿,简单聊聊天,那基本等于没入门。写多了,才能知道 AI 的能力边界,才能理解什么叫自动化,有哪些问题需要解决,怎么在不同的情况下提升效率,搞清楚 AI 到底有多大的处理能力,能 Hold 住多大的架构……也就是说,得体会过一定的复杂度,做到一定规模,才能看到真问题,体验找答案的快乐。Tokens 消耗量与遇到过的问题正相关,与解决过的难题正相关。
换句话说,真正的方法论来自于极限施压下的不断优化,你得遇到不得不去优化的问题,才会产生方法论。对我来说,AI 编程到现在,我觉得最有用的方法就是写文档,文档是 AI 编程的灵魂。但是在没用 AI 写那么多代码之前,Tokens 消耗量不过亿的时候,我基本就在折腾提示词。Tokens 消耗过亿后,发现这一招不管用了,我得想更有效的方式,这时候就开始文档驱动了。
打磨到现在,我的文档主要有三份,第一份叫**“研究设计文档”**,这是大模型自动命名的,这里面其实就是我们熟悉的需求文档、设计文档、PRD 文档等等,在这里做的事包括研究行业情况、研究我的产品、研究产品特色怎么实现、怎么跟行业最佳实践结合、怎么做取舍,最后确定方案,也包括用 ASCII 描述出每个界面长的样子。
然后就到了第二份**“架构文档”**阶段,设计出能实现产品思路的整套说明书。分享一个细节,我一般不在这个环节做 UI,我认为 UI 前置是有害的,会框住架构设计,当然了这些思路还是由我的产品方法论决定的,源于我的实践。这段时间我的真实感受是,大模型能够承担百万年薪量级的架构师角色,大模型架构能力的发挥取决于产品经理角色跟它的配合,你提的问题质量越高,它给你的专家水平也越高。我跟高水平架构师配合过,现在和大模型配合,说实话,体验还要更好一些。现在,我更能看到产品架构的全貌,我对全技术栈的盲区越来越少了。
有了架构文档,最后就是**“分阶段开发规划文档”**。因为架构文档很大,这么大项目的任何一个子模块的子模块,把其架构文档扔给模型,它的上下文都可能会爆。所以要拆分成分阶段的开发计划,一般是 5-20 个开发阶段,每个阶段又会把前后端分开,分别开发。
这是我总结出来的,其实过程中会反复偏离规划,需要不断纠正。比如什么地方容易爆上下文,怎么去做自动化拆分的机制?断了以后没法继续,陷于无限循环怎么办?只能继续想办法,把整个过程的 To-do 给持久化,也就是说每一个任务的执行都会触发一个 Skill 去把 To-do 保存成文件。每一个任务、子任务完成都要去标注一下,把 To-do 标注成 Doing 或者是 Done。如果执行断了,就触发这个 To-do 文件,我只需要说“继续执行” 这四个字就行了。
再说一个关键挑战,怎么解决编程幻觉的问题?我逐步摸索出了一套**“Mock 驱动开发”**的路子。有了架构文档,就有了一套 API 契约手册,我会让大模型开发一套 Mock Server,所有输出变得可控,无限接近于 0 幻觉。比如前端的某个模块,5-7 层代码,用分层拦截做 Mock。这样,代码出现 Bug 时,可以精准定位、直接修改。
从解决第一个问题开始去创建第一条规则,这一个循序渐进的过程。这中间积累的方法论、每一个沉淀下来的东西,会发挥越来越大的价值。我和身边的朋友分享了这套“文档驱动开发”的工程化落地方法,一位大厂的朋友在他的部门做了推广,收到了特别好的反馈,帮他们提升了 PRD 质量,也提高了协同效率。
最后补充一点,也是很多人关心的一个问题:既然文档这么关键,那有没有啥模型推荐,可以把文档这件事一次性做好?答案是,没有哪个模型可以一步到位完成文档设计,这件事没有捷径。也不要轻信任何框架、任何模式,我们可以做的就是增多轮次,多尝试各种模型组合,从多角度、用多个虚拟角色来对文档反复进行可靠性验证。
5. 能做事,就是最幸福的事
说了这么多我最近在做的事,看着项目每天都在更往前一步,还有点小激动。
很多人好奇我整这么大一个开发项目,自己的状态到底咋样,其实没想象中那么苦。我现在每天都带着期待起床,先去检查下昨天布置给“数字伙伴们”的工作,一般每台机器都开着 6-8 个窗口,有 4-12 个并行任务在执行。检查完,给工作反馈和下一步指令,我自己实际的工作负荷差不多 40-50%,这几天甚至可以到 20%,自然有大把时间做其他事,比如刷剧、带娃、线上线下和真人社交。我可太喜欢现在这种不慌不忙、常有惊喜的的生活节奏了。

但我也慌张过,崩溃过,走过弯路,也有过“全靠熬”的日子。最开始下定决心学 AI Coding,模型能力还不够好,一试就废,根本什么都做不出来,有 2 个月我甚至都处于停工状态。怎么办?就三个字:熬过去。那段时间也做一些强度很大的锻炼,一边强迫自己锻炼上瘾,一边继续逼自己折腾 Vibe Coding,后来就拿到了结果,尝到了甜头,人也越来越兴奋。Skill 出来后,更是感觉工具箱里添砖加瓦了,定制了各种 Skills。
新模型、新技术层出不穷,也让我慢慢体会到自己视角的改变,不再是站在新技术背后看背影,想着追赶;而是思考技术发展的脉络,和它平行前进,甚至跑到它前面去看,站在终点去等它。这个让事情变简单、稳定的类似“压舱石”的东西其实就是“用户情景”,与我来说就是“课堂”这件事。先有这个命题,再看技术怎么能更好地解决问题。
以前我被困住,得等团队、等资本才能实现自己的想法。疫情几年,也依旧困在原地,什么也做不了。所以现在,我极其珍视这种“被解放”的感觉。真的,能做事就是最幸福的事。
想起以前我们吐槽老板的一个笑话,说你能不给我做个微信?现在看起来,这好像也不是那么难。当一切皆有可能,那么有价值的就变成了我们到底想问一个什么问题,再往深追问,或许就是我们是否有一个愿力(Will):你想做什么?想用 AI 做一件多大的事?你能坚持多久?你能承受多大的复杂度?而我现在就是心怀愿力,干就完事。
最后,我也很好奇,你正在做或者想做哪些事儿?有关注自己的 Tokens 消耗量吗?沉淀了哪些方法?期待分享交流。
如果你也是 AI 实践者、探索者,欢迎分享你的足迹,让更多人看见你的故事。

更多推荐

所有评论(0)