logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Windsurf Cascade 换成 DeepSeek 当后端,这几个自定义 endpoint 字段不填对就静默走默认模型

这是我折腾最久的部分。因为静默 fallback 的存在,你没法从 UI 上看出区别。方法一:看响应延迟不同模型和不同平台的首 token 延迟存在差异,但具体数值受网络环境、服务器负载等因素影响较大,不适合作为硬性判断标准。如果切换后延迟风格明显不同,可以作为辅助参考。方法二:问它是谁在 Cascade 里直接输入"你是什么模型"。虽然不是 100% 可靠(有些模型会被 system promp

#AI
Windsurf Cascade 换成 DeepSeek 当后端,这几个自定义 endpoint 字段不填对就静默走默认模型

这是我折腾最久的部分。因为静默 fallback 的存在,你没法从 UI 上看出区别。方法一:看响应延迟不同模型和不同平台的首 token 延迟存在差异,但具体数值受网络环境、服务器负载等因素影响较大,不适合作为硬性判断标准。如果切换后延迟风格明显不同,可以作为辅助参考。方法二:问它是谁在 Cascade 里直接输入"你是什么模型"。虽然不是 100% 可靠(有些模型会被 system promp

#AI
AI 编程工具 API 配置实战:Cursor、Claude Code、VS Code 插件一次搞定(2026 最新)

本文分享了2026年AI编程工具API配置的实战经验。针对国内开发者面临的API不稳定、多工具管理复杂等问题,作者提出统一API中转方案,通过一个Key管理Cursor、Claude Code、VS Code插件等主流工具。文章详细介绍了各工具的配置步骤,推荐使用ofox.ai等中转服务实现国内直连、统一计费和灵活切换模型,并提供了验证脚本和用量监控建议。最后指出AI编程工具整合趋势下,建立稳定A

#人工智能#php#开发语言
Claude API overloaded 报错怎么解决?3 种方案实测,附自动重试代码

上周三我们团队的 RAG pipeline 突然集体趴窝,日志里刷了满屏的和。当时正好赶上 Claude Opus 4.7 发布后的流量高峰,Anthropic 官方 API 基本每隔几分钟就 529 一次,搞得我那天下午什么正事都没干,全在折腾重试逻辑。直接说结论:Claude API 返回 529 overloaded 本质是 Anthropic 服务端过载限流,你客户端能做的就三件事——指数

#人工智能#大数据#网络 +1
Codex 搭 GPT-5.5 用,这几个 model 参数填错了根本不走最新模型

上周我把 Codex CLI 升到最新版,想着终于能用 GPT-5.5 跑代码生成了。结果折腾了大半天,发现生成质量明显不对——后来抓了下请求日志,好家伙,model 字段写的是gpt-5.5,实际 API 路由到的还是旧版。这个坑不止我一个人踩,掘金好几篇实战帖评论区都有人问"为什么感觉没变化"。今天把完整的配置流程、正确的 model 字段写法、API key 权限 scope、以及沙箱超时参

#AI
用 OpenRouter 统一接多家 API,这几个路由参数我一开始完全没注意到

上个月我们团队把后端的模型调用从"每家一个 SDK"迁移到聚合路由方案,目的很简单——业务代码里不想再写 if/else 来区分 OpenAI、Anthropic、Google 的 client 初始化了。迁完之后确实舒服了不少,但 OpenRouter 的routeprovidertransforms这几个参数,说实话我前两周完全没仔细看文档,直到某天早上收到一封账单邮件,发现一个 fallba

#AI
Claude API overloaded 报错怎么解决?3 种方案实测,附自动重试代码

上周三我们团队的 RAG pipeline 突然集体趴窝,日志里刷了满屏的和。当时正好赶上 Claude Opus 4.7 发布后的流量高峰,Anthropic 官方 API 基本每隔几分钟就 529 一次,搞得我那天下午什么正事都没干,全在折腾重试逻辑。直接说结论:Claude API 返回 529 overloaded 本质是 Anthropic 服务端过载限流,你客户端能做的就三件事——指数

#人工智能#大数据#网络 +1
同一批任务,我算了一下用不同模型 API 的实际花费,差距有点出乎意料(2026 多模型成本建模)

总输入:150 × 12,400 = 1,860,000 tokens总输出:150 × 380 = 57,000 tokens模型输入费用输出费用总费用(CNY)单份成本GPT-5.5¥161.57¥19.81¥181.38¥1.209¥20.20¥2.48¥22.68¥0.151¥201.97¥30.95¥232.92¥1.553¥40.39¥6.19¥46.58¥0.311¥2.02¥0.2

#前端#java#javascript +1
用 OlmoEarth v1.1 微调自己的遥感分类任务,从数据准备到推理全流程(2026 实测)

上个月接了个活,甲方是做农业保险的,需要对他们自己采集的卫星图做土地利用分类——总共就 6 类(耕地、林地、水体、建设用地、未利用地、草地),标注样本加起来才 1200 张。一开始想直接拿 ResNet50 ImageNet 预训练权重迁移,跑了几轮发现 val acc 卡在 71% 上不去。后来看到 Allen AI 4 月份更新的 OlmoEarth v1.1,号称在遥感领域做了效率优化的 f

#分类#人工智能#机器学习 +1
Claude API overloaded 报错怎么解决?3 种方案实测,附自动重试代码

上周三我们团队的 RAG pipeline 突然集体趴窝,日志里刷了满屏的和。当时正好赶上 Claude Opus 4.7 发布后的流量高峰,Anthropic 官方 API 基本每隔几分钟就 529 一次,搞得我那天下午什么正事都没干,全在折腾重试逻辑。直接说结论:Claude API 返回 529 overloaded 本质是 Anthropic 服务端过载限流,你客户端能做的就三件事——指数

#人工智能#大数据#网络 +1
    共 20 条
  • 1
  • 2
  • 请选择