
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
上周在给一个内部工具对接 Claude API 时,看到 Anthropic 相关讨论突然多了起来,顺手把接入流程重新走了一遍。发现对 API 用户来说有两处 header 格式值得注意,不确认的话可能会遇到 401 或 403。这篇把我踩的坑和当前方案整理出来,供参考。本文涉及的部分机制(包括这一 beta 字符串、account verification 流程及相关字段名)目前尚未在 Anth
上周在给一个内部工具对接 Claude API 时,看到 Anthropic 相关讨论突然多了起来,顺手把接入流程重新走了一遍。发现对 API 用户来说有两处 header 格式值得注意,不确认的话可能会遇到 401 或 403。这篇把我踩的坑和当前方案整理出来,供参考。本文涉及的部分机制(包括这一 beta 字符串、account verification 流程及相关字段名)目前尚未在 Anth
实测下来,Pro 相比 Mini 有可见差距的场景就两类:长链推理任务(合同审查、医疗记录归纳)和高客单价输出(企业付费报告、品牌方文案)。其他场景 Mini 完全够用。Pro 对 Mini 是 40 倍差。中小团队跑业务流,月费几千美金 vs 几十美金,差距能养一个实习生。九成应用最后停在 Mini。
GPT-Image-2 老是生成失败?完整排查和修复指南,5 个真根因逐个击破GPT-Image-2 的处理时间比文字模型长很多——高质量 1024px 需要 145-280 秒。大多数所谓的"生成失败"其实不是模型问题,而是网络链路(CDN、反代、SDK)提前断开了连接。这篇文章总结了实际使用中最常遇到的 5 类问题,每个都附了可以直接用的修复代码。
上周 Google 发了 Gemini 3.5 Flash,我当天晚上就拿 Codex CLI 接上跑了几个项目里的真实任务。原因很简单——我们团队最近 token 开销涨得太快,老板让我找个"又快又便宜还不太拉胯"的模型顶日常编码场景。Claude Sonnet 4.6 质量没话说但贵,GPT-4o 稳定但慢,Flash 系列一直是性价比标杆,3.5 版本到底有没有质变?测完数据我人傻了,直接说
上周三我们后端有个 RAG pipeline 跑着跑着全挂了,日志里刷屏 429 Too Many Requests。我第一反应是并发打高了,结果一看监控——QPM 才 12,远没到 xAI 文档写的 RPM 上限(具体数值请以官方文档为准)。折腾了大半天才搞明白,Grok API 的 429 其实藏着三种完全不同的子类型,而且有两种压根不是你真的超限了,是计费时机和 header 返回值在坑你。
API Key: <第三方平台提供的 Key>Model ID: <第三方平台支持的 model_id>Base URL 填到/v1即可,不要加/messages,Cline 会自动补全后续路径第三方服务的可用性、定价、延迟等情况请以对应平台的官方说明为准,本文不对具体服务商做推荐或背书使用前确认该服务商是否真实可达,建议先用 curl 测试连通性。
上周三智谱发布 GLM-4 系列新版本,我当天晚上就想把手头一个 RAG 项目的底层模型切过去。结果折腾到凌晨两点,遇到两个文档压根没提的坑——OpenAI 兼容模式下 model_id 格式和鉴权 header 的细微变动会导致静默失败(不报错,但返回的是旧模型的响应)。这篇把我踩过的坑全写出来,省得你们再走一遍。
上个月我给团队写了一份很详细的 AGENTS.md,把 Claude Code 能用哪些工具、不能碰哪些目录都写得明明白白。结果上线第二天,有同事发现 Claude Code 通过一个 MCP Server 读了生产环境的 .env 文件——AGENTS.md 里明确写了"禁止读取 .env*"。







