logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

菲尔兹奖得主亲测:ChatGPT 17分钟解决了博士级数学难题,我们该怎么办?

我不想用一个漂亮的结论来收尾,因为我自己也还没想清楚。但有一点我比较确定:Gowers 那篇博客里描述的那 17 分钟,是一个值得认真对待的信号。不是因为它证明了 AI「有多厉害」,而是因为它来自一个极其可靠的观察者,在一个极其难以造假的领域,给出了一个极其具体的案例。这种信号,比一千篇「AI 改变世界」的营销文章更值得花时间消化。原文出处:Timothy Gowers 博客,

#AI
Claude Code 接入 API 聚合平台实测:延迟、稳定性和成本我全跑了一遍

上个月团队决定全面切到 Claude Code 做日常开发,Sonnet 4.6 的代码能力确实猛,但问题来了——十几个工程师每人都要绑自己的 API Key,月底报销的时候财务看着一堆美元账单直接崩溃。老板让我调研一下 API 聚合平台,统一走一个入口,最好能看到每个人的用量明细。我花了大概一周时间,把市面上几个主流的聚合平台都接到 Claude Code 里跑了一轮。结果跟我预想的不太一样。

#人工智能#AI
Claude Code 两个被低估的新命令:/goal 让它自己干到底,Agent View 让你同时盯十个任务

用 Claude Code 写代码有一个很烦的事:每一轮对话结束,它就停下来等你回复。改一个 bug 要来回五六轮,你得一直盯着终端,看它改完了没,然后敲回车让它继续。本质上你变成了一个人肉"继续"按钮。v2.1.139 加了两个命令,直接解决了这个问题。/goal让 Claude 自己干到满足条件为止,不用你催;打开一个多会话管理面板,让你同时派发好几个任务,哪个卡住了一眼就能看到。这篇文章是我

Windsurf 换 Qwen3.7 Plus 当后端,这几个 context window 字段不设对就静默截断

上周三我把 Windsurf Cascade 的后端模型从 Claude Sonnet 换成 Qwen3.7 Plus,想省点钱跑日常的代码补全和重构任务。结果折腾了大半天——Cascade 生成到一半突然停了,不报错,不提示,就是静默截断。查了两个小时才发现是里的和maxTokens字段跟 Qwen3.7 Plus 的实际上限对不上。这篇把我踩的坑全拆一遍,直接贴配置。

#javascript#开发语言#ecmascript +1
Windsurf 换 Qwen3.7 Plus 当后端,这几个 context window 字段不设对就静默截断

上周三我把 Windsurf Cascade 的后端模型从 Claude Sonnet 换成 Qwen3.7 Plus,想省点钱跑日常的代码补全和重构任务。结果折腾了大半天——Cascade 生成到一半突然停了,不报错,不提示,就是静默截断。查了两个小时才发现是里的和maxTokens字段跟 Qwen3.7 Plus 的实际上限对不上。这篇把我踩的坑全拆一遍,直接贴配置。

#javascript#开发语言#ecmascript +1
Windsurf 换 Qwen3.7 Plus 当后端,这几个 context window 字段不设对就静默截断

上周三我把 Windsurf Cascade 的后端模型从 Claude Sonnet 换成 Qwen3.7 Plus,想省点钱跑日常的代码补全和重构任务。结果折腾了大半天——Cascade 生成到一半突然停了,不报错,不提示,就是静默截断。查了两个小时才发现是里的和maxTokens字段跟 Qwen3.7 Plus 的实际上限对不上。这篇把我踩的坑全拆一遍,直接贴配置。

#javascript#开发语言#ecmascript +1
Windsurf 换 Qwen3.7 Plus 当后端,这几个 context window 字段不设对就静默截断

上周三我把 Windsurf Cascade 的后端模型从 Claude Sonnet 换成 Qwen3.7 Plus,想省点钱跑日常的代码补全和重构任务。结果折腾了大半天——Cascade 生成到一半突然停了,不报错,不提示,就是静默截断。查了两个小时才发现是里的和maxTokens字段跟 Qwen3.7 Plus 的实际上限对不上。这篇把我踩的坑全拆一遍,直接贴配置。

#javascript#开发语言#ecmascript +1
Kimi K2 API 报 400 和流式挂起怎么办?3 个文档没写的坑和规避方案

问题触发条件报错信息实际原因规避方案system 超限system prompt > ~12K tokens(实测值,非官方)单轮 system 疑似有隐藏上限拆分到 user 轮tool_call_id 不匹配多轮 tool use 后 id 对不上格式校验比 OpenAI 严格发送前校验 id 一致性流式不关闭max_tokens 截断 + stream=true无报错,连接挂起疑似 bug:

#java#数据库#前端 +1
Claude Opus 4.7 API 完全指南:Benchmark 解析、定价分析与代码实战(2026)

折腾了一周,我的结论:Claude Opus 4.7 在代码和推理这两个维度上确实是目前最强的选择,SWE-Bench 72.3% 不是吹的。但它贵,输出 $75/M tokens 这个价格决定了它不适合当日常模型用。我的策略是分层:Agent 核心推理用 Opus 4.7,普通对话和初步生成用 Sonnet 4.6,简单分类/提取用 Haiku 4.5。这样月成本能控制在 Opus 全量的 30

#人工智能#AI
菲尔兹奖得主亲测:ChatGPT 17分钟解决了博士级数学难题,我们该怎么办?

我不想用一个漂亮的结论来收尾,因为我自己也还没想清楚。但有一点我比较确定:Gowers 那篇博客里描述的那 17 分钟,是一个值得认真对待的信号。不是因为它证明了 AI「有多厉害」,而是因为它来自一个极其可靠的观察者,在一个极其难以造假的领域,给出了一个极其具体的案例。这种信号,比一千篇「AI 改变世界」的营销文章更值得花时间消化。原文出处:Timothy Gowers 博客,

#AI
    共 28 条
  • 1
  • 2
  • 3
  • 请选择