logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Claude Code 接入 DeepSeek:环境变量、CC Switch 与模型选择总结

摘要: Claude Code 已通过环境变量成功接入 DeepSeek API,核心链路验证通过。若仅使用单一DeepSeek模型,无需引入CC Switch工具,推荐通过启动脚本管理环境变量(如ANTHROPIC_BASE_URL和ANTHROPIC_MODEL)。DeepSeek提供Flash(高效低价)和Pro(复杂推理)两种模型,建议日常使用Flash,遇复杂任务切换Pro。CC Swi

Ollama Cloud 与直接使用 API 的对比

如果你的目标是获得更强模型、更低价格、更多模型选择,直接使用 API 通常更合适。如果你的目标是统一本地模型和云端模型的使用方式,减少适配成本,Ollama Cloud 才更有价值。

【RTX4060 8G显存】本地运行Qwen3.6 35B A3B实战

本文总结了Qwen3.6-35B-A3B-APEX-MTP模型在本地消费级硬件上的测试结果。测试表明,该模型可在单张RTX 4060 8GB显卡上运行,通过CPU MoE+APEX量化+MTP技术实现本地代码Agent服务。台式机(PCIe内置显卡)表现优于笔记本(USB4外接显卡),尤其在长上下文处理阶段(台式机499 tok/s vs笔记本168 tok/s)。关键参数设置建议:台式机使用64

文章图片
#人工智能
Claude Code接入MiMo缓存失效?1个变量秒修复

文章摘要: Claude Code接入小米MiMo时缓存不命中问题,主要源于默认的attribution block动态信息干扰第三方网关的缓存前缀匹配。通过设置环境变量CLAUDE_CODE_ATTRIBUTION_HEADER=0关闭该功能后,MiMo缓存命中率显著提升,表现为cache read增加、首Token响应加速及输入成本降低。建议优先禁用attribution header而非直接

文章图片
#缓存
Claude Code接入MiMo缓存失效?1个变量秒修复

文章摘要: Claude Code接入小米MiMo时缓存不命中问题,主要源于默认的attribution block动态信息干扰第三方网关的缓存前缀匹配。通过设置环境变量CLAUDE_CODE_ATTRIBUTION_HEADER=0关闭该功能后,MiMo缓存命中率显著提升,表现为cache read增加、首Token响应加速及输入成本降低。建议优先禁用attribution header而非直接

文章图片
#缓存
Ollama Cloud 与直接使用 API 的对比

如果你的目标是获得更强模型、更低价格、更多模型选择,直接使用 API 通常更合适。如果你的目标是统一本地模型和云端模型的使用方式,减少适配成本,Ollama Cloud 才更有价值。

【RTX4060 8G显存】本地运行Qwen3.6 35B A3B实战

本文总结了Qwen3.6-35B-A3B-APEX-MTP模型在本地消费级硬件上的测试结果。测试表明,该模型可在单张RTX 4060 8GB显卡上运行,通过CPU MoE+APEX量化+MTP技术实现本地代码Agent服务。台式机(PCIe内置显卡)表现优于笔记本(USB4外接显卡),尤其在长上下文处理阶段(台式机499 tok/s vs笔记本168 tok/s)。关键参数设置建议:台式机使用64

文章图片
#人工智能
Codex + Git 开发环境配置指南(WSL版)

本文介绍了在Windows WSL环境下配置Codex CLI和Git的开发环境指南。主要内容包括:1) Codex CLI在WSL中的安装和使用建议,强调使用Linux文件系统而非/mnt/c目录;2) Git的WSL专属配置,包括换行符处理、SSH设置和常用别名;3) 推荐的工作流程,建议结合Git进行版本控制来确保安全;4) 常见问题解决方案和工具链推荐。文章强调Codex CLI在WSL环

#git#linux#运维
Claude Code 接入 DeepSeek:环境变量、CC Switch 与模型选择总结

摘要: Claude Code 已通过环境变量成功接入 DeepSeek API,核心链路验证通过。若仅使用单一DeepSeek模型,无需引入CC Switch工具,推荐通过启动脚本管理环境变量(如ANTHROPIC_BASE_URL和ANTHROPIC_MODEL)。DeepSeek提供Flash(高效低价)和Pro(复杂推理)两种模型,建议日常使用Flash,遇复杂任务切换Pro。CC Swi

Ollama Cloud 与直接使用 API 的对比

如果你的目标是获得更强模型、更低价格、更多模型选择,直接使用 API 通常更合适。如果你的目标是统一本地模型和云端模型的使用方式,减少适配成本,Ollama Cloud 才更有价值。

    共 13 条
  • 1
  • 2
  • 请选择