logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

第一次做 LoRA 微调,我把能踩的坑全踩了一遍,整理成这份避坑清单

上个月接了个私活,甲方要在 Qwen3-7B 上微调一个垂直领域的客服模型。我寻思 LoRA 微调嘛,2026 年了谁还不会这个,结果从数据格式到训练超参,能踩的坑我一个不落全踩了。跑了 4 天才出第一个能用的 checkpoint,期间 OOM 了十几次、loss 飙到 NaN 三次、生成结果全是乱码两次。把这些坑整理出来,希望后面的人少走弯路。

#人工智能#AI
企业级 AI API 聚合平台对比 2026:主流大模型 API 中转站选型指南

2026 年值得企业认真对比的 AI API 聚合平台主要有四家:ofox.io、302.ai、硅基流动(SiliconFlow)、灵芽 AI。各平台侧重不同,选型错误容易掉坑,尤其对稳定性和合规要求高的团队。

#人工智能
我用 Gemini 搭了一套文献综述 Agent,帮我省了 80% 的时间

这一步要从每篇论文的摘要里提取:研究方法、核心贡献、数据集、性能指标。用 Pydantic 做 schema 约束输出格式。title: stryear: intmethod: str = Field(description="核心方法/模型名称")contribution: str = Field(description="主要贡献,2-3句话")datasets: List[str] = Fi

#AI
AI API 怎么用人民币付费?折腾了一周,我找到 3 种靠谱方案

上个月我接了个私活,甲方要做一个智能客服系统,需要调 Claude Opus 4.7 和 GPT-5.5 的 API。活儿不难,难的是付钱——甲方财务说公司没有外币信用卡,只能走人民币结算。我当时心想这能有多难?结果折腾了整整一周。直接回答:2026 年用人民币给 AI API 付费,主流方案有三种:一是用支持微信/支付宝充值的 API 聚合平台(如二是走国产云厂商的模型代理服务(阿里云百炼、火山

#人工智能#大数据#AI
Anthropic 又风控了怎么办?3 种方案实测,稳定调用 Claude API 不再看脸

昨晚 Claude Opus 4.6 刚上线,我兴冲冲跑去测新模型,代码跑到一半直接 403——账号又被风控了。如果你也踩到这个坑,目前有三条路可以走:1)切到 AWS Bedrock / Google VertexAI 等云厂商托管的 Claude 接入点;2)用 API 聚合平台(如)自动路由到可用节点;3)代码层做多 Key 轮换 + 自动降级。其中方案二改动最小,基本改个base_url就

#人工智能
2026 大模型 API 价格一览:GPT-5/Claude 4.6/Gemini 3/DeepSeek V3 费率实测对比

上个月我接了个私活,做一个多模型对话聚合的小产品。需求很简单:用户选模型,后端调 API,返回结果。但真到了选模型、算成本这步,我直接懵了——各家定价体系完全不一样,有的按 token 计费,有的按字符,有的输入输出价格差好几倍,还有的藏着隐性费用。我花了整整两天,把 2026 年主流大模型 API 的价格全扒了一遍,做了张表格贴在飞书文档里。后来想想,这事儿应该不止我一个人头疼,干脆整理出来发一

Claude Sonnet 4.6 API 完全指南:性能实测、成本测算与接入方案(2026)

我的核心观点很简单:Claude Sonnet 4.6 是 2026 年综合性价比最高的 API 模型。它在代码、指令遵循、长文本三个维度上都是中端模型的天花板,价格只有 Opus 的五分之一、GPT-5 的三分之一。如果只能选一个模型当日常主力,选它。先拿你自己的真实 Prompt 跑一轮 Sonnet 4.6,看看效果够不够用不够用的少数场景,按需切 Opus 或 GPT-5接入用聚合平台,改

Claude Mythos 意外泄露:10T 参数超级模型将如何重塑 AI 开发生态?

Claude Mythos 的意外泄露让我们提前看到了 AI 能力的下一个台阶。不要盲目追求最强模型:合适的才是最好的建立灵活的技术架构:通过 API 聚合平台(如ofox.ai)保持技术选型的灵活性关注成本效益比:性能提升 2 倍但成本增加 5 倍,不一定划算做好安全准备:更强的能力意味着更大的责任当 Claude Mythos 在未来几周通过 Claude API 正式开放时,那些提前做好准备

#人工智能#网络
Claude Code 怎么用?2026 最新配置方案,终端里写代码真香

上周五晚上我在赶一个 side project 的 deadline,Cursor 突然开始抽风,Tab 补全延迟高得离谱,一怒之下决定试试之前一直种草的 Claude Code。说实话,一开始我是拒绝的——终端里写代码?这不是倒退到 vim 时代吗?结果配完跑了两天,真香。现在日常开发 Claude Code 用得比 Cursor 还多。

Claude Tool Use 怎么用?从零到生产的完整教程(2026)

上周接了个需求,做一个能查天气、查数据库、还能发邮件的 AI 助手。一开始想着用 LangChain 套一层,后来发现 Claude 原生的 Tool Use(也叫 Function Calling)已经很成熟了,根本不需要额外框架。但官方文档写得有点绕,我踩了不少坑才把整条链路跑通。把摸索出来的东西全写下来,让你少走弯路。

#java#数据库#服务器
    共 163 条
  • 1
  • 2
  • 3
  • 17
  • 请选择