
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
我不想用一个漂亮的结论来收尾,因为我自己也还没想清楚。但有一点我比较确定:Gowers 那篇博客里描述的那 17 分钟,是一个值得认真对待的信号。不是因为它证明了 AI「有多厉害」,而是因为它来自一个极其可靠的观察者,在一个极其难以造假的领域,给出了一个极其具体的案例。这种信号,比一千篇「AI 改变世界」的营销文章更值得花时间消化。原文出处:Timothy Gowers 博客,
上个月团队决定全面切到 Claude Code 做日常开发,Sonnet 4.6 的代码能力确实猛,但问题来了——十几个工程师每人都要绑自己的 API Key,月底报销的时候财务看着一堆美元账单直接崩溃。老板让我调研一下 API 聚合平台,统一走一个入口,最好能看到每个人的用量明细。我花了大概一周时间,把市面上几个主流的聚合平台都接到 Claude Code 里跑了一轮。结果跟我预想的不太一样。
用 Claude Code 写代码有一个很烦的事:每一轮对话结束,它就停下来等你回复。改一个 bug 要来回五六轮,你得一直盯着终端,看它改完了没,然后敲回车让它继续。本质上你变成了一个人肉"继续"按钮。v2.1.139 加了两个命令,直接解决了这个问题。/goal让 Claude 自己干到满足条件为止,不用你催;打开一个多会话管理面板,让你同时派发好几个任务,哪个卡住了一眼就能看到。这篇文章是我
上周三我把 Windsurf Cascade 的后端模型从 Claude Sonnet 换成 Qwen3.7 Plus,想省点钱跑日常的代码补全和重构任务。结果折腾了大半天——Cascade 生成到一半突然停了,不报错,不提示,就是静默截断。查了两个小时才发现是里的和maxTokens字段跟 Qwen3.7 Plus 的实际上限对不上。这篇把我踩的坑全拆一遍,直接贴配置。
上周三我把 Windsurf Cascade 的后端模型从 Claude Sonnet 换成 Qwen3.7 Plus,想省点钱跑日常的代码补全和重构任务。结果折腾了大半天——Cascade 生成到一半突然停了,不报错,不提示,就是静默截断。查了两个小时才发现是里的和maxTokens字段跟 Qwen3.7 Plus 的实际上限对不上。这篇把我踩的坑全拆一遍,直接贴配置。
上周三我把 Windsurf Cascade 的后端模型从 Claude Sonnet 换成 Qwen3.7 Plus,想省点钱跑日常的代码补全和重构任务。结果折腾了大半天——Cascade 生成到一半突然停了,不报错,不提示,就是静默截断。查了两个小时才发现是里的和maxTokens字段跟 Qwen3.7 Plus 的实际上限对不上。这篇把我踩的坑全拆一遍,直接贴配置。
上周三我把 Windsurf Cascade 的后端模型从 Claude Sonnet 换成 Qwen3.7 Plus,想省点钱跑日常的代码补全和重构任务。结果折腾了大半天——Cascade 生成到一半突然停了,不报错,不提示,就是静默截断。查了两个小时才发现是里的和maxTokens字段跟 Qwen3.7 Plus 的实际上限对不上。这篇把我踩的坑全拆一遍,直接贴配置。
问题触发条件报错信息实际原因规避方案system 超限system prompt > ~12K tokens(实测值,非官方)单轮 system 疑似有隐藏上限拆分到 user 轮tool_call_id 不匹配多轮 tool use 后 id 对不上格式校验比 OpenAI 严格发送前校验 id 一致性流式不关闭max_tokens 截断 + stream=true无报错,连接挂起疑似 bug:
折腾了一周,我的结论:Claude Opus 4.7 在代码和推理这两个维度上确实是目前最强的选择,SWE-Bench 72.3% 不是吹的。但它贵,输出 $75/M tokens 这个价格决定了它不适合当日常模型用。我的策略是分层:Agent 核心推理用 Opus 4.7,普通对话和初步生成用 Sonnet 4.6,简单分类/提取用 Haiku 4.5。这样月成本能控制在 Opus 全量的 30
我不想用一个漂亮的结论来收尾,因为我自己也还没想清楚。但有一点我比较确定:Gowers 那篇博客里描述的那 17 分钟,是一个值得认真对待的信号。不是因为它证明了 AI「有多厉害」,而是因为它来自一个极其可靠的观察者,在一个极其难以造假的领域,给出了一个极其具体的案例。这种信号,比一千篇「AI 改变世界」的营销文章更值得花时间消化。原文出处:Timothy Gowers 博客,







