
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
上个月老板突然说要搞个微信客服机器人,能自动回复产品咨询、处理售后问题,还得接大模型让回复"像人"。我看了眼掘金热榜,OpenClaw 刚好在风口上,就花了三天时间从零搭了一套出来。踩坑不少,但最终效果还行——日均处理 400+ 条消息,客户满意度从 62% 拉到了 89%。这篇把完整流程和坑都记下来。OpenClaw 本质是一个 AI Agent 运行框架,通过它的微信协议适配层(基于 itch
上周三我们团队的 RAG pipeline 突然集体趴窝,日志里刷了满屏的和。当时正好赶上 Claude Opus 4.7 发布后的流量高峰,Anthropic 官方 API 基本每隔几分钟就 529 一次,搞得我那天下午什么正事都没干,全在折腾重试逻辑。直接说结论:Claude API 返回 529 overloaded 本质是 Anthropic 服务端过载限流,你客户端能做的就三件事——指数
2026 年 6 月中文开发者社区出现大量 ChatGPT 和 Codex 账号被封的情况。本文按"共性原因 4 条 + Codex/开发者特有 2 条"分类,提供自查清单,并对比申诉、合规 API 网关等应对方案。
上周三我想把 Codex CLI 接到项目里替代部分 Claude Code 的工作流,结果光一个 config.yaml 就来回改了三遍才跑通。问题出在两个地方:provider 的枚举值拼写(openai和你以为的行为完全不一样),以及 api_key 到底读环境变量还是读配置文件——官方文档对这俩的优先级描述基本等于没写。这篇把我踩的坑和最终能用的最小配置模板都贴出来,省得你也折腾半天。
上周三我想把 Codex CLI 接到项目里替代部分 Claude Code 的工作流,结果光一个 config.yaml 就来回改了三遍才跑通。问题出在两个地方:provider 的枚举值拼写(openai和你以为的行为完全不一样),以及 api_key 到底读环境变量还是读配置文件——官方文档对这俩的优先级描述基本等于没写。这篇把我踩的坑和最终能用的最小配置模板都贴出来,省得你也折腾半天。
6 月 3 号早上刷 HN,看到传闻称 xAI(马斯克旗下 AI 公司)拟以某价格收购 Cursor 的消息(具体金额系未经官方证实的传闻数字,各方流传版本不一),说实话第一反应不是"卧槽好厉害",而是"完了,我的 BYOK 配置会不会被动"。Cursor 被收购后 API 后端策略会不会变、custom model endpoint 还让不让用、甚至 Base URL 字段会不会直接砍掉——这些
本文介绍如何在32GB内存的Mac Mini M1上通过Hypura项目成功运行Mixtral 8x7B等大模型。传统方法会因内存不足导致OOM,而Hypura采用分层存储调度策略,将模型不同部分分别置于GPU、RAM和SSD上,并利用MoE架构的特性实现专家参数按需加载。文章详细讲解了安装步骤、硬件配置要求、模型下载方法以及性能优化技巧,还展示了如何将Hypura作为本地API服务替代Ollam
总输入:150 × 12,400 = 1,860,000 tokens总输出:150 × 380 = 57,000 tokens模型输入费用输出费用总费用(CNY)单份成本GPT-5.5¥161.57¥19.81¥181.38¥1.209¥20.20¥2.48¥22.68¥0.151¥201.97¥30.95¥232.92¥1.553¥40.39¥6.19¥46.58¥0.311¥2.02¥0.2
上周我把 Codex CLI 升到最新版,想着终于能用 GPT-5.5 跑代码生成了。结果折腾了大半天,发现生成质量明显不对——后来抓了下请求日志,好家伙,model 字段写的是gpt-5.5,实际 API 路由到的还是旧版。这个坑不止我一个人踩,掘金好几篇实战帖评论区都有人问"为什么感觉没变化"。今天把完整的配置流程、正确的 model 字段写法、API key 权限 scope、以及沙箱超时参
上个月我把 Codex Agent 当主力用,Skills 生态刚起来那会儿什么都往里塞,高峰期里注册了 34 个 Skill。然后月底一看账单——$187,比上个月翻了将近一倍。排查了两天才发现,有些 Skill 的写得太模糊,导致 Agent 几乎每轮对话都会触发它们做一次"试探性调用",白白烧 token。这篇把我踩过的坑、最终留下的 7 个 Skill、以及里最容易写错的字段全部摊开讲。







