最近的 AI 实践依旧热火朝天,不论是 Cowork 还是 OpenClaw,各种各样的 Agents 都实实在在干事了。一个显性变化是,我们讨论 Tokens 消耗量的声音越来越多。以下是日消耗 10 亿量级 Tokens 的“AI 暴动级”实干家胥克谦的自述。

1. PPT 即应用,PPT 即智能体

我正在做一件疯狂的事,放在以前根本不敢想象。我不是一个恋旧的人,以前的很多事情现在都不怎么提了,简单来说,从我确定自己的教育情结到现在,就一直扎在教育科技领域,做得比较深。很多年前,我就用当时的技术在教育领域里大规模使用动画,从创意到互动交付,大幅提升效率,降低成本,也获得过一些重要奖项。我一直觉得最符合自己的角色定位,就是“产品经理”。而我一直在做的,就是把课堂这件事做好,仅此而已。

我正在用大模型能力做一个“教学系统”,这个项目到目前为止经历了 4 个月,2 次彻底推翻重构,我一个人,200 万行代码,沉淀了 1400 万字文档。这个项目预计还需要至少 1 个月,估计会新增 100 万行代码。这或许是一个超大体量的个人 Vibe Coding 项目,对我来说,也是一个孤注一掷的挑战。

我的一位 CTO 朋友做了一个估算,对比传统的软件开发,我一个人用 4 个月完成了以往需要 120-150 人研发团队 2 年的工作量,个人效率比可能是 1:800。更有意思的是,一位投资人朋友给我算了笔账,如果只看 Tokens 消耗的钱,那可能是上万倍的资金效率。当然了,不管是看人/天,还是看钱,这两个数字都只是一个粗略参考,实际成本要复杂得多,不能这么简化,这种比较不严格成立。比如几百人团队做一个项目,招聘、沟通成本就很高,4 个月可能都不够开会的。

但这两个数字让我有“惊人”之感,从某个维度精准地表达了我的体验,我实在地感受到了 AI 能力对我个人的一种“彻底的解放”,我体会到了一种根本性变化。

回到我专注的教育场景,其实复杂度非常高。一个教学系统基本等于把“内容+框架+课件+互动+老师+课程+教室+数据+运营+……”这些东西都聚合起来。类比来讲,一个教学系统是多个复杂能力的合集,包含 PPT、会议、游戏、营销、剪辑视频、CRM 等等。

我稍微展开一点来说:

  • 一个比 WPS 更复杂的 PPT 工具,每一页 PPT 都要能绑定智能体的工作流,能点击、能交互、有数据。比如自动识别当前页面的职能,触发相应的交互,记录学生的个性化回答,最终生成每个学生独特的作品。

  • 一个类似腾讯会议的实时课堂系统,但不是把 PPT 当视频流推送,而是像游戏房间一样,老师的每一次点击都会触发所有学生端的同步响应,支持个性化交互。

  • 一个简化版的剪映,用来处理视频素材,时间轴清晰,支持自动抠绿幕,能把实时课程转化为带交互能力的录播课。

一个多级架构的 CRM 系统,管理机构、分支、员工等复杂的组织关系。
这里我多说几句 PPT 相关的,市面上已经有那么多相关工具了,为什么我还要自己做。这还得回到教学、回到课堂这个场景。教育信息化这么多年,留下来的基本上就是 PPT,智能体进课堂很不容易,为什么?不是老师保守,我们得理解在课堂里,教学环节是灵魂,是不能打乱的。一个班 50 个孩子,老师得有一个东西像指挥千军万马那样,掌控教学环节。以前就是老师统一指挥,学生千人一面,没办法实现个性化教学。现在技术能力支持了,就可以做到老师统一指挥,学生千人千面

这里面就有太多事情可以做了,交互、分析、生成、上下文的记忆能力等等,PPT 是载体,每一页都可能是多个工作流。举个交互的小场景,这一页的内容是先提个问题?还是给出 ABC 让学生做选择?或者让学生把这句话记下来?这就需要自动识别这一页的教学目标,自动匹配,自动生成交互方式。你看,这样就可以实现,教学环节一致,但是每个孩子的体验都是个性化的。

再比如课堂任务是编创一个西游记故事:第一个环节是到哪里了?第二个环节唐僧为什么被抓走、被谁抓走?下一个是孙悟空怎么去营救、怎么失败的?再一个是求助的是谁、获得了什么新能力/新宝贝?最后一个环节是怎么挑战并成功,继续西行。每一个环节一个问题,对应一页 PPT,有相应的交互,进入大模型工作流的一个节点,最后再生成各自的作品。一个班 50 个孩子,每个人的作品都是不同的。

继续延伸,我正在做的就是让 PPT 自然具备类似扣子工作流的能力,让智能体以更自然的体验进入用户情景,这会带来很多原来难以想象的改变。那就不仅是教育场景了,其实可以成为通用能力,有非常大的想象空间。我总结了下,就是 Slides as App, Slides as Agent(PPT即应用,PPT即智能体)。我对此满怀热情,每天都在一点点建设中,看着自己的构想一步步实现,幸甚,快哉。

f01ebac5d605d0198da9c4955d3e7d9e.jpeg

2. 重构产品理念,不是做轻,是做“重”

这几个月的实践,对我的产品理念也有很大冲击,很多我之前坚持的东西都发生了一些动摇。

产品经理能力大释放

我过去是坚决不碰代码的,故意不碰,那时候我有一个方法论叫**“站着说话不腰疼”**。作为产品经理,我必须 100% 代表用户角色,而不是顾及团队“能不能做到”。如果我太懂技术,团队就会认为我应该理解他们的困难,很容易陷入情绪化妥协。

这种坚决不要懂的执拗背后,是产品经理这个角色的根本困境:产品经理的能力依赖资本。无论多么优秀的产品经理,都无法独立完成产品。做硬件要工厂,做软件要团队,产品经理永远需要钱和人。更痛苦的是,即使有了团队,产品经理的想法也会在对齐过程中大量损耗。坦白说,过去我的创意和设计连 10% 都实现不了,大部分都在对齐的过程中丢掉了,有太多东西在妥协。

现在不一样了,产品经理第一次可以不依赖资本和团队独立完成产品。有了大模型能力,形同拥有上百人研发团队并拿到千万融资。我依然没自己写代码,但我开始懂了,我直接介入了,我和 AI 像和人一样打交道,但沟通效率高了不知道多少倍。

我以前从来不相信所谓的“一人公司”,至少我认为产品经理一个人是做不了大事的,得靠团队、靠资本。但现在,我真的在做着一个如此复杂的教学系统,开始体验到**“一个人也可以做很大的事儿”。当然了,我后面还是会有团队的,但现在我可以先把自己想做的都做出来**。

3. AI 产品“要做重”

过去很长一段时间,我们都被反复教育,默认做产品一定要轻,从一个 MVP 原型开始,快速迭代把产品滚出来,好产品是改出来的。我对此深信不疑,骨子里这么认为,也一直都是这么干出来的。

AI 来了,做个 MVP 变得极其简单。我们听过太多几小时做一个产品 Demo 的故事,我自己也有过这么一段时间,很嗨皮、穷乐呵。但是现在我觉得做这些东西的意义不大,你做 100 个产品上不了线,那这个数量就只是个虚荣指标。你 24 小时极限编程做出一个东西,隔天可能就有成千上万个复刻款,这样的东西没办法真正商业化。

MVP 可以实现得更快更多,用之前打磨一个 MVP 的时间周期,现在恨不得能把整个产品都做出来了,但这丝毫没有改变一个本质逻辑,产品是市场需求决定的,不是开发成本决定的。市场会自然形成平衡:你简单了大家都简单,然后大家就会开始增加复杂度,拼来拼去,到最后发现还是需要差不多的周期。

轻应用活不下来,真的能上线,可商业化,还是要做重,老老实实回到用户情景。虽然我做的项目过重了一点点,有点夸张,可能是因为胆子比较大。但我相信,这个产品上线之后,在一个很长的周期里,基本上不会有竞品。

d31f27319e08e4d12b48a5552438acbc.jpeg

4. Tokens 消耗不够,出不来方法论

我有一个观点:能不能消耗到一亿 Tokens 是 AI 编程的一个基本入门门槛;日均消耗一亿 Tokens 是真正熟练掌握 AI 编程的门槛。有人说这是暴论,说法确实粗糙了一些,但这就是我最近的一个体会,还是想毫无保留地分享出来。

为什么这么说呢?其实也简单,就是实践出真知。干,才是关键,Tokens 消耗量是 AI 编程的硬指标。你没消耗到这么多 Tokens,只是用 AI 写点小玩意儿,简单聊聊天,那基本等于没入门。写多了,才能知道 AI 的能力边界,才能理解什么叫自动化,有哪些问题需要解决,怎么在不同的情况下提升效率,搞清楚 AI 到底有多大的处理能力,能 Hold 住多大的架构……也就是说,得体会过一定的复杂度,做到一定规模,才能看到真问题,体验找答案的快乐。Tokens 消耗量与遇到过的问题正相关,与解决过的难题正相关

换句话说,真正的方法论来自于极限施压下的不断优化,你得遇到不得不去优化的问题,才会产生方法论。对我来说,AI 编程到现在,我觉得最有用的方法就是写文档,文档是 AI 编程的灵魂。但是在没用 AI 写那么多代码之前,Tokens 消耗量不过亿的时候,我基本就在折腾提示词。Tokens 消耗过亿后,发现这一招不管用了,我得想更有效的方式,这时候就开始文档驱动了。

打磨到现在,我的文档主要有三份,第一份叫**“研究设计文档”**,这是大模型自动命名的,这里面其实就是我们熟悉的需求文档、设计文档、PRD 文档等等,在这里做的事包括研究行业情况、研究我的产品、研究产品特色怎么实现、怎么跟行业最佳实践结合、怎么做取舍,最后确定方案,也包括用 ASCII 描述出每个界面长的样子。

然后就到了第二份**“架构文档”**阶段,设计出能实现产品思路的整套说明书。分享一个细节,我一般不在这个环节做 UI,我认为 UI 前置是有害的,会框住架构设计,当然了这些思路还是由我的产品方法论决定的,源于我的实践。这段时间我的真实感受是,大模型能够承担百万年薪量级的架构师角色,大模型架构能力的发挥取决于产品经理角色跟它的配合,你提的问题质量越高,它给你的专家水平也越高。我跟高水平架构师配合过,现在和大模型配合,说实话,体验还要更好一些。现在,我更能看到产品架构的全貌,我对全技术栈的盲区越来越少了。

有了架构文档,最后就是**“分阶段开发规划文档”**。因为架构文档很大,这么大项目的任何一个子模块的子模块,把其架构文档扔给模型,它的上下文都可能会爆。所以要拆分成分阶段的开发计划,一般是 5-20 个开发阶段,每个阶段又会把前后端分开,分别开发。

这是我总结出来的,其实过程中会反复偏离规划,需要不断纠正。比如什么地方容易爆上下文,怎么去做自动化拆分的机制?断了以后没法继续,陷于无限循环怎么办?只能继续想办法,把整个过程的 To-do 给持久化,也就是说每一个任务的执行都会触发一个 Skill 去把 To-do 保存成文件。每一个任务、子任务完成都要去标注一下,把 To-do 标注成 Doing 或者是 Done。如果执行断了,就触发这个 To-do 文件,我只需要说“继续执行” 这四个字就行了。

再说一个关键挑战,怎么解决编程幻觉的问题?我逐步摸索出了一套**“Mock 驱动开发”**的路子。有了架构文档,就有了一套 API 契约手册,我会让大模型开发一套 Mock Server,所有输出变得可控,无限接近于 0 幻觉。比如前端的某个模块,5-7 层代码,用分层拦截做 Mock。这样,代码出现 Bug 时,可以精准定位、直接修改。

从解决第一个问题开始去创建第一条规则,这一个循序渐进的过程。这中间积累的方法论、每一个沉淀下来的东西,会发挥越来越大的价值。我和身边的朋友分享了这套“文档驱动开发”的工程化落地方法,一位大厂的朋友在他的部门做了推广,收到了特别好的反馈,帮他们提升了 PRD 质量,也提高了协同效率。

最后补充一点,也是很多人关心的一个问题:既然文档这么关键,那有没有啥模型推荐,可以把文档这件事一次性做好?答案是,没有哪个模型可以一步到位完成文档设计,这件事没有捷径。也不要轻信任何框架、任何模式,我们可以做的就是增多轮次,多尝试各种模型组合,从多角度、用多个虚拟角色来对文档反复进行可靠性验证。

5. 能做事,就是最幸福的事

说了这么多我最近在做的事,看着项目每天都在更往前一步,还有点小激动。
很多人好奇我整这么大一个开发项目,自己的状态到底咋样,其实没想象中那么苦。我现在每天都带着期待起床,先去检查下昨天布置给“数字伙伴们”的工作,一般每台机器都开着 6-8 个窗口,有 4-12 个并行任务在执行。检查完,给工作反馈和下一步指令,我自己实际的工作负荷差不多 40-50%,这几天甚至可以到 20%,自然有大把时间做其他事,比如刷剧、带娃、线上线下和真人社交。我可太喜欢现在这种不慌不忙、常有惊喜的的生活节奏了。

a04fb0e1337923dbeaf5d308a68cb1b2.jpeg

但我也慌张过,崩溃过,走过弯路,也有过“全靠熬”的日子。最开始下定决心学 AI Coding,模型能力还不够好,一试就废,根本什么都做不出来,有 2 个月我甚至都处于停工状态。怎么办?就三个字:熬过去。那段时间也做一些强度很大的锻炼,一边强迫自己锻炼上瘾,一边继续逼自己折腾 Vibe Coding,后来就拿到了结果,尝到了甜头,人也越来越兴奋。Skill 出来后,更是感觉工具箱里添砖加瓦了,定制了各种 Skills。

新模型、新技术层出不穷,也让我慢慢体会到自己视角的改变,不再是站在新技术背后看背影,想着追赶;而是思考技术发展的脉络,和它平行前进,甚至跑到它前面去看,站在终点去等它。这个让事情变简单、稳定的类似“压舱石”的东西其实就是“用户情景”,与我来说就是“课堂”这件事。先有这个命题,再看技术怎么能更好地解决问题。

以前我被困住,得等团队、等资本才能实现自己的想法。疫情几年,也依旧困在原地,什么也做不了。所以现在,我极其珍视这种“被解放”的感觉。真的,能做事就是最幸福的事。

想起以前我们吐槽老板的一个笑话,说你能不给我做个微信?现在看起来,这好像也不是那么难。当一切皆有可能,那么有价值的就变成了我们到底想问一个什么问题,再往深追问,或许就是我们是否有一个愿力(Will):你想做什么?想用 AI 做一件多大的事?你能坚持多久?你能承受多大的复杂度?而我现在就是心怀愿力,干就完事

最后,我也很好奇,你正在做或者想做哪些事儿?有关注自己的 Tokens 消耗量吗?沉淀了哪些方法?期待分享交流。

如果你也是 AI 实践者、探索者,欢迎分享你的足迹,让更多人看见你的故事。

ee0036c62282413d8af059f7b6dfb69b.png

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐