
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
DGX Spark 跑 Qwen3.5-35B-A3B 实测43tok/s
主要踩坑记录: - openclaw 发的请求里有 developer role,Qwen3.5 的模板不认,直接 500 ❌ - 工具调用返回用的是 toolResult,Qwen3.5 只认 tool,又是 500 ❌ - 默认开启 thinking 模式,模型把所有 token 都花在推理上,返回内容为空 ❌ 解决方案: 写了一个小代理层,自动处理所有兼容性问题。支持在消息开头加 [thin

从 RTX 到 Spark:NVIDIA 为本地代理式 AI 加速 Gemma4
Unsloth 提供首日支持,通过 Unsloth Studio 提供经过优化和量化的模型,以实现高效的本地微调和部署。它使用 NVIDIA GPU 在本地运行开放权重模型,同时通过混合路由器在本地 RTX 硬件与云端之间动态平衡工作负载,无需调用 API Key,即可实现快速、私密、零配置的执行体验。这些优化模型以便捷的方式提供业界领先的推理能力,可在 NVIDIA RTX GPU 和 DGX

到底了







