
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
上个月接了个私活,甲方要在 Qwen3-7B 上微调一个垂直领域的客服模型。我寻思 LoRA 微调嘛,2026 年了谁还不会这个,结果从数据格式到训练超参,能踩的坑我一个不落全踩了。跑了 4 天才出第一个能用的 checkpoint,期间 OOM 了十几次、loss 飙到 NaN 三次、生成结果全是乱码两次。把这些坑整理出来,希望后面的人少走弯路。
2026 年值得企业认真对比的 AI API 聚合平台主要有四家:ofox.io、302.ai、硅基流动(SiliconFlow)、灵芽 AI。各平台侧重不同,选型错误容易掉坑,尤其对稳定性和合规要求高的团队。
这一步要从每篇论文的摘要里提取:研究方法、核心贡献、数据集、性能指标。用 Pydantic 做 schema 约束输出格式。title: stryear: intmethod: str = Field(description="核心方法/模型名称")contribution: str = Field(description="主要贡献,2-3句话")datasets: List[str] = Fi
上个月我接了个私活,甲方要做一个智能客服系统,需要调 Claude Opus 4.7 和 GPT-5.5 的 API。活儿不难,难的是付钱——甲方财务说公司没有外币信用卡,只能走人民币结算。我当时心想这能有多难?结果折腾了整整一周。直接回答:2026 年用人民币给 AI API 付费,主流方案有三种:一是用支持微信/支付宝充值的 API 聚合平台(如二是走国产云厂商的模型代理服务(阿里云百炼、火山
昨晚 Claude Opus 4.6 刚上线,我兴冲冲跑去测新模型,代码跑到一半直接 403——账号又被风控了。如果你也踩到这个坑,目前有三条路可以走:1)切到 AWS Bedrock / Google VertexAI 等云厂商托管的 Claude 接入点;2)用 API 聚合平台(如)自动路由到可用节点;3)代码层做多 Key 轮换 + 自动降级。其中方案二改动最小,基本改个base_url就
上个月我接了个私活,做一个多模型对话聚合的小产品。需求很简单:用户选模型,后端调 API,返回结果。但真到了选模型、算成本这步,我直接懵了——各家定价体系完全不一样,有的按 token 计费,有的按字符,有的输入输出价格差好几倍,还有的藏着隐性费用。我花了整整两天,把 2026 年主流大模型 API 的价格全扒了一遍,做了张表格贴在飞书文档里。后来想想,这事儿应该不止我一个人头疼,干脆整理出来发一
我的核心观点很简单:Claude Sonnet 4.6 是 2026 年综合性价比最高的 API 模型。它在代码、指令遵循、长文本三个维度上都是中端模型的天花板,价格只有 Opus 的五分之一、GPT-5 的三分之一。如果只能选一个模型当日常主力,选它。先拿你自己的真实 Prompt 跑一轮 Sonnet 4.6,看看效果够不够用不够用的少数场景,按需切 Opus 或 GPT-5接入用聚合平台,改
Claude Mythos 的意外泄露让我们提前看到了 AI 能力的下一个台阶。不要盲目追求最强模型:合适的才是最好的建立灵活的技术架构:通过 API 聚合平台(如ofox.ai)保持技术选型的灵活性关注成本效益比:性能提升 2 倍但成本增加 5 倍,不一定划算做好安全准备:更强的能力意味着更大的责任当 Claude Mythos 在未来几周通过 Claude API 正式开放时,那些提前做好准备
上周五晚上我在赶一个 side project 的 deadline,Cursor 突然开始抽风,Tab 补全延迟高得离谱,一怒之下决定试试之前一直种草的 Claude Code。说实话,一开始我是拒绝的——终端里写代码?这不是倒退到 vim 时代吗?结果配完跑了两天,真香。现在日常开发 Claude Code 用得比 Cursor 还多。
上周接了个需求,做一个能查天气、查数据库、还能发邮件的 AI 助手。一开始想着用 LangChain 套一层,后来发现 Claude 原生的 Tool Use(也叫 Function Calling)已经很成熟了,根本不需要额外框架。但官方文档写得有点绕,我踩了不少坑才把整条链路跑通。把摸索出来的东西全写下来,让你少走弯路。







