
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
上周 Google 发了 Gemini 3.5 Flash,我当天晚上就拿 Codex CLI 接上跑了几个项目里的真实任务。原因很简单——我们团队最近 token 开销涨得太快,老板让我找个"又快又便宜还不太拉胯"的模型顶日常编码场景。Claude Sonnet 4.6 质量没话说但贵,GPT-4o 稳定但慢,Flash 系列一直是性价比标杆,3.5 版本到底有没有质变?测完数据我人傻了,直接说
上周三 Google I/O 2026 刚结束,我就收到了 Gemini app 的推送——不是那种"您有新消息"的通知,是它主动告诉我:"你关注的 GitHub repo 刚发了 breaking change,要不要我帮你看看迁移方案?说实话一开始我是拒绝的。AI 主动找我?听着像垃圾短信。但折腾了几天之后,我发现这东西的触发逻辑比我想象的精细得多,跟传统对话式 AI 完全是两回事。
折腾了三天,我的结论:Gemini 3.1 Pro 在 2026 年 4 月这个时间点,最大的竞争力是超长上下文 + 原生视频理解 + 相对低廉的价格这个组合。如果你的场景是长文档分析或者多模态处理,它目前是性价比最优解。但如果你主要做代码生成和复杂推理,Claude Opus 4.7 和 GPT-5.5 还是更稳。没有银弹,选模型得看具体场景。我现在的做法是在路由层做模型分流——简单任务走 Fl
上个月我接了个私活,甲方要做一个合同的小工具,指定要用 Claude Opus 4.7 来做长文本分析。说实话需求不复杂,但光是把 Claude API 在 Python 里跑通这一步,我就折腾了大半天——官方文档更新滞后、SDK 版本对不上、请求格式还分两套协议。踩完坑之后我把整个过程整理了一下,省得你们再走弯路。Python 调用 Claude API 的核心步骤是:安装 Anthropic
上个月我接了个私活,甲方要做一个合同的小工具,指定要用 Claude Opus 4.7 来做长文本分析。说实话需求不复杂,但光是把 Claude API 在 Python 里跑通这一步,我就折腾了大半天——官方文档更新滞后、SDK 版本对不上、请求格式还分两套协议。踩完坑之后我把整个过程整理了一下,省得你们再走弯路。Python 调用 Claude API 的核心步骤是:安装 Anthropic
GPT-Image-2 老是生成失败?完整排查和修复指南,5 个真根因逐个击破GPT-Image-2 的处理时间比文字模型长很多——高质量 1024px 需要 145-280 秒。大多数所谓的"生成失败"其实不是模型问题,而是网络链路(CDN、反代、SDK)提前断开了连接。这篇文章总结了实际使用中最常遇到的 5 类问题,每个都附了可以直接用的修复代码。
上个月我接了个私活,甲方要做一个合同的小工具,指定要用 Claude Opus 4.7 来做长文本理解。说实话一开始我是拒绝的——之前用 Claude 都是网页版手动复制粘贴,API 调用还真没正经搞过。折腾了大概两天半,把三种接入方式都试了一遍,踩了不少坑,这里把完整过程记录下来。直接回答标题问题:使用 Claude API 有三种主流方案——Anthropic 官方 SDK 直连、OpenAI
准确率够用,成本低到几乎可以忽略。我们的客服摘要场景切过去之后,月成本从七千降到四百多,质量只掉了 2-3 个点。
上个月我接了个私活,甲方要做一个合同审核的 AI 助手,指定用 Claude Opus 4.7 做底层模型。反复试了 3 张不同的卡,全部 declined。当时挺崩溃的,甲方催着要 demo,我这边连 API Key 都拿不到。后来花了大概一周时间,把市面上能用的中转/聚合方案都试了一遍,最终跑通了三种路径。这篇文章把我的实测数据和踩坑全写出来,省得你再走弯路。
上周三公司一个做客服机器人的项目要换模型,产品经理说想试试 Kimi K2.5,理由是"中文理解能力强,而且便宜"。我寻思也行,正好手头在用 OpenClaw 做日常开发,就花了两天把几种接入方案都跑了一遍。结果嘛……有惊喜也有坑,记录一下。说实话一开始我以为改个 base_url 就完事了,没想到 OpenClaw 对不同 API 协议的兼容性差异还挺大的。这篇文章就把我实测的 3 种方案摆出来







