AI算力服务器-慧慧个人主页

@2401_88191956

AI算力服务器-慧慧

2026-04-13 14:33:08 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

DGX Spark 跑 Qwen3.5-35B-A3B 实测43tok/s

主要踩坑记录： - openclaw 发的请求里有 developer role，Qwen3.5 的模板不认，直接 500 ❌ - 工具调用返回用的是 toolResult，Qwen3.5 只认 tool，又是 500 ❌ - 默认开启 thinking 模式，模型把所有 token 都花在推理上，返回内容为空 ❌ 解决方案：写了一个小代理层，自动处理所有兼容性问题。支持在消息开头加 [thin

#python #java

从 RTX 到 Spark：NVIDIA 为本地代理式 AI 加速 Gemma4

Unsloth 提供首日支持，通过 Unsloth Studio 提供经过优化和量化的模型，以实现高效的本地微调和部署。它使用 NVIDIA GPU 在本地运行开放权重模型，同时通过混合路由器在本地 RTX 硬件与云端之间动态平衡工作负载，无需调用 API Key，即可实现快速、私密、零配置的执行体验。这些优化模型以便捷的方式提供业界领先的推理能力，可在 NVIDIA RTX GPU 和 DGX

#spark #人工智能 #大数据 +1

到底了