ofoxcoding 个人主页

@ofoxcoding

ofoxcoding

2026-02-09 18:08:41 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

第一次做 LoRA 微调，我把能踩的坑全踩了一遍，整理成这份避坑清单

上个月接了个私活，甲方要在 Qwen3-7B 上微调一个垂直领域的客服模型。我寻思 LoRA 微调嘛，2026 年了谁还不会这个，结果从数据格式到训练超参，能踩的坑我一个不落全踩了。跑了 4 天才出第一个能用的 checkpoint，期间 OOM 了十几次、loss 飙到 NaN 三次、生成结果全是乱码两次。把这些坑整理出来，希望后面的人少走弯路。

#人工智能 #AI

企业级 AI API 聚合平台对比 2026：主流大模型 API 中转站选型指南

2026 年值得企业认真对比的 AI API 聚合平台主要有四家：ofox.io、302.ai、硅基流动（SiliconFlow）、灵芽 AI。各平台侧重不同，选型错误容易掉坑，尤其对稳定性和合规要求高的团队。

#人工智能

我用 Gemini 搭了一套文献综述 Agent，帮我省了 80% 的时间

这一步要从每篇论文的摘要里提取：研究方法、核心贡献、数据集、性能指标。用 Pydantic 做 schema 约束输出格式。title: stryear: intmethod: str = Field(description="核心方法/模型名称")contribution: str = Field(description="主要贡献，2-3句话")datasets: List[str] = Fi

#AI

AI API 怎么用人民币付费？折腾了一周，我找到 3 种靠谱方案

上个月我接了个私活，甲方要做一个智能客服系统，需要调 Claude Opus 4.7 和 GPT-5.5 的 API。活儿不难，难的是付钱——甲方财务说公司没有外币信用卡，只能走人民币结算。我当时心想这能有多难？结果折腾了整整一周。直接回答：2026 年用人民币给 AI API 付费，主流方案有三种：一是用支持微信/支付宝充值的 API 聚合平台（如二是走国产云厂商的模型代理服务（阿里云百炼、火山

#人工智能 #大数据 #AI

Anthropic 又风控了怎么办？3 种方案实测，稳定调用 Claude API 不再看脸

昨晚 Claude Opus 4.6 刚上线，我兴冲冲跑去测新模型，代码跑到一半直接 403——账号又被风控了。如果你也踩到这个坑，目前有三条路可以走：1）切到 AWS Bedrock / Google VertexAI 等云厂商托管的 Claude 接入点；2）用 API 聚合平台（如）自动路由到可用节点；3）代码层做多 Key 轮换 + 自动降级。其中方案二改动最小，基本改个base_url就

#人工智能

2026 大模型 API 价格一览：GPT-5/Claude 4.6/Gemini 3/DeepSeek V3 费率实测对比

上个月我接了个私活，做一个多模型对话聚合的小产品。需求很简单：用户选模型，后端调 API，返回结果。但真到了选模型、算成本这步，我直接懵了——各家定价体系完全不一样，有的按 token 计费，有的按字符，有的输入输出价格差好几倍，还有的藏着隐性费用。我花了整整两天，把 2026 年主流大模型 API 的价格全扒了一遍，做了张表格贴在飞书文档里。后来想想，这事儿应该不止我一个人头疼，干脆整理出来发一

Claude Sonnet 4.6 API 完全指南：性能实测、成本测算与接入方案（2026）

我的核心观点很简单：Claude Sonnet 4.6 是 2026 年综合性价比最高的 API 模型。它在代码、指令遵循、长文本三个维度上都是中端模型的天花板，价格只有 Opus 的五分之一、GPT-5 的三分之一。如果只能选一个模型当日常主力，选它。先拿你自己的真实 Prompt 跑一轮 Sonnet 4.6，看看效果够不够用不够用的少数场景，按需切 Opus 或 GPT-5接入用聚合平台，改

Claude Mythos 意外泄露：10T 参数超级模型将如何重塑 AI 开发生态？

Claude Mythos 的意外泄露让我们提前看到了 AI 能力的下一个台阶。不要盲目追求最强模型：合适的才是最好的建立灵活的技术架构：通过 API 聚合平台（如ofox.ai）保持技术选型的灵活性关注成本效益比：性能提升 2 倍但成本增加 5 倍，不一定划算做好安全准备：更强的能力意味着更大的责任当 Claude Mythos 在未来几周通过 Claude API 正式开放时，那些提前做好准备

#人工智能 #网络

Claude Code 怎么用？2026 最新配置方案，终端里写代码真香

上周五晚上我在赶一个 side project 的 deadline，Cursor 突然开始抽风，Tab 补全延迟高得离谱，一怒之下决定试试之前一直种草的 Claude Code。说实话，一开始我是拒绝的——终端里写代码？这不是倒退到 vim 时代吗？结果配完跑了两天，真香。现在日常开发 Claude Code 用得比 Cursor 还多。

Claude Tool Use 怎么用？从零到生产的完整教程（2026）

上周接了个需求，做一个能查天气、查数据库、还能发邮件的 AI 助手。一开始想着用 LangChain 套一层，后来发现 Claude 原生的 Tool Use（也叫 Function Calling）已经很成熟了，根本不需要额外框架。但官方文档写得有点绕，我踩了不少坑才把整条链路跑通。把摸索出来的东西全写下来，让你少走弯路。

#java #数据库 #服务器

共 163 条

请选择