
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
工具作用是否必须Obsidian知识库核心软件必须Git版本控制,数据安全必须VSCode辅助编辑器可选ClaudeAI辅助整理进阶使用CC SwitchAI工具管理进阶使用恭喜你!✅ 安装了 Obsidian 和 Git✅ 创建了第一个知识库✅ 掌握了双向链接和标签✅ 配置了版本控制但这只是开始。在下一篇文章安装 5 个核心插件,让知识库"活"起来配置自动备份和模板系统搭建日记 + 任务 + 笔
✅ 自动备份(Obsidian Git)✅ 模板系统(Templater)✅ 智能查询(Dataview)✅ 任务管理(Tasks)✅ 日记系统(Calendar)但这还不是全部。在下一篇文章配置 Claude Code 环境用 AI 辅助整理笔记实现知识图谱分析搭建自动化工作流当Obsidian遇上AI:让Claude成为你的知识管家。
可以读取和编辑本地文件执行命令行操作理解项目上下文与 Git 集成分析笔记内容,提取关键词和标签根据内容自动创建链接生成笔记摘要查找相关笔记Provider 管理:50+ 预设配置,一键切换 API 提供商代理与故障转移:本地代理、自动故障转移用量追踪:花费、请求、Token 统计会话管理:浏览、搜索、恢复对话历史在 Obsidian 内直接与 AI 对话让 AI 帮你整理笔记、提取关键词基于知识
可以读取和编辑本地文件执行命令行操作理解项目上下文与 Git 集成分析笔记内容,提取关键词和标签根据内容自动创建链接生成笔记摘要查找相关笔记Provider 管理:50+ 预设配置,一键切换 API 提供商代理与故障转移:本地代理、自动故障转移用量追踪:花费、请求、Token 统计会话管理:浏览、搜索、恢复对话历史在 Obsidian 内直接与 AI 对话让 AI 帮你整理笔记、提取关键词基于知识
✅ 自动备份(Obsidian Git)✅ 模板系统(Templater)✅ 智能查询(Dataview)✅ 任务管理(Tasks)✅ 日记系统(Calendar)但这还不是全部。在下一篇文章配置 Claude Code 环境用 AI 辅助整理笔记实现知识图谱分析搭建自动化工作流当Obsidian遇上AI:让Claude成为你的知识管家。
工具作用是否必须Obsidian知识库核心软件必须Git版本控制,数据安全必须VSCode辅助编辑器可选ClaudeAI辅助整理进阶使用CC SwitchAI工具管理进阶使用恭喜你!✅ 安装了 Obsidian 和 Git✅ 创建了第一个知识库✅ 掌握了双向链接和标签✅ 配置了版本控制但这只是开始。在下一篇文章安装 5 个核心插件,让知识库"活"起来配置自动备份和模板系统搭建日记 + 任务 + 笔
当我们谈论AI的未来,往往聚焦于模型架构、算法突破、应用创新。但有一个更底层的变量正在改变游戏规则——能源成本。绿电直供,让电费降低60%自然冷却,让PUE降至1.2算电协同,让Token价格下降30%+这不是技术革命,而是能源革命在AI领域的投射。未来,每一个Token的背后,都可能流淌着来自内蒙古草原的风、戈壁滩上的光。AI的尽头,是能源;而能源的尽头,是自然。
Speculative Decoding是近期最火的推理加速技术,核心思想是"小模型猜测,大模型验证"。三大变体对比变体核心创新加速比适用场景标准拒绝采样2.5x有现成小模型Medusa多解码头2.8x无额外模型EAGLE特征层猜测3.6x追求极致加速SpecTr动态猜测长度2.9x自适应场景关键结论输出质量完全一致:拒绝采样保证数学等价加速比2-4x:取决于接受率和猜测数显存开销可控:Medus
长文本推理是大模型落地的关键瓶颈。技术核心思想解决的问题复杂度IO感知分块计算HBM带宽瓶颈O(n)环形分布式计算显存瓶颈O(n/p)Attention Sink + 滑动窗口流式推理O(window)YaRN改进的RoPE缩放位置编码外推O(1)关键结论:单卡长文本的首选,性能提升9x:多卡分布式,实现"近无限上下文":流式推理神器,显存恒定、性能稳定YaRN:无需重新训练的上下文扩展,性能保持
多卡并行推理,选对策略是关键。策略核心思想适用场景优势劣势TP层内切分大batch、低延迟延迟低通信频繁PP层间切分小batch、显存受限显存友好延迟高EP专家切分MoE模型扩展性强仅适用MoE选型建议通用推理:优先TP(延迟低,实现简单)显存受限:使用PP(显存占用小)MoE模型:必须EP(唯一选择)超大模型:TP+PP混合(显存+通信平衡)进阶话题ZeRO优化:DeepSpeed ZeRO-3







