
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要: Claude Code 已通过环境变量成功接入 DeepSeek API,核心链路验证通过。若仅使用单一DeepSeek模型,无需引入CC Switch工具,推荐通过启动脚本管理环境变量(如ANTHROPIC_BASE_URL和ANTHROPIC_MODEL)。DeepSeek提供Flash(高效低价)和Pro(复杂推理)两种模型,建议日常使用Flash,遇复杂任务切换Pro。CC Swi
如果你的目标是获得更强模型、更低价格、更多模型选择,直接使用 API 通常更合适。如果你的目标是统一本地模型和云端模型的使用方式,减少适配成本,Ollama Cloud 才更有价值。
本文总结了Qwen3.6-35B-A3B-APEX-MTP模型在本地消费级硬件上的测试结果。测试表明,该模型可在单张RTX 4060 8GB显卡上运行,通过CPU MoE+APEX量化+MTP技术实现本地代码Agent服务。台式机(PCIe内置显卡)表现优于笔记本(USB4外接显卡),尤其在长上下文处理阶段(台式机499 tok/s vs笔记本168 tok/s)。关键参数设置建议:台式机使用64

文章摘要: Claude Code接入小米MiMo时缓存不命中问题,主要源于默认的attribution block动态信息干扰第三方网关的缓存前缀匹配。通过设置环境变量CLAUDE_CODE_ATTRIBUTION_HEADER=0关闭该功能后,MiMo缓存命中率显著提升,表现为cache read增加、首Token响应加速及输入成本降低。建议优先禁用attribution header而非直接

文章摘要: Claude Code接入小米MiMo时缓存不命中问题,主要源于默认的attribution block动态信息干扰第三方网关的缓存前缀匹配。通过设置环境变量CLAUDE_CODE_ATTRIBUTION_HEADER=0关闭该功能后,MiMo缓存命中率显著提升,表现为cache read增加、首Token响应加速及输入成本降低。建议优先禁用attribution header而非直接

如果你的目标是获得更强模型、更低价格、更多模型选择,直接使用 API 通常更合适。如果你的目标是统一本地模型和云端模型的使用方式,减少适配成本,Ollama Cloud 才更有价值。
本文总结了Qwen3.6-35B-A3B-APEX-MTP模型在本地消费级硬件上的测试结果。测试表明,该模型可在单张RTX 4060 8GB显卡上运行,通过CPU MoE+APEX量化+MTP技术实现本地代码Agent服务。台式机(PCIe内置显卡)表现优于笔记本(USB4外接显卡),尤其在长上下文处理阶段(台式机499 tok/s vs笔记本168 tok/s)。关键参数设置建议:台式机使用64

本文介绍了在Windows WSL环境下配置Codex CLI和Git的开发环境指南。主要内容包括:1) Codex CLI在WSL中的安装和使用建议,强调使用Linux文件系统而非/mnt/c目录;2) Git的WSL专属配置,包括换行符处理、SSH设置和常用别名;3) 推荐的工作流程,建议结合Git进行版本控制来确保安全;4) 常见问题解决方案和工具链推荐。文章强调Codex CLI在WSL环
摘要: Claude Code 已通过环境变量成功接入 DeepSeek API,核心链路验证通过。若仅使用单一DeepSeek模型,无需引入CC Switch工具,推荐通过启动脚本管理环境变量(如ANTHROPIC_BASE_URL和ANTHROPIC_MODEL)。DeepSeek提供Flash(高效低价)和Pro(复杂推理)两种模型,建议日常使用Flash,遇复杂任务切换Pro。CC Swi
如果你的目标是获得更强模型、更低价格、更多模型选择,直接使用 API 通常更合适。如果你的目标是统一本地模型和云端模型的使用方式,减少适配成本,Ollama Cloud 才更有价值。







