Hi,我是 meisijiya ,也是 老江湖 ,感谢你的阅读,我们一起进步。
个人博客:https://xn–ljhfjm-dl0o.top/
本文附录有详细配置说明🙂


📌 前言:不只是 Skill,是一套完整的 Agent 操作系统

很多人以为 OpenCode 只是一个"AI 写代码工具"——装上 Skill 让它更会写代码。但当你装上 OhMyOpenAgent 插件后,事情完全变了。

OhMyOpenAgent 把 OpenCode 变成了一个 多智能体操作系统:11 个专业 Agent 各司其职、14 种任务分类自动路由到最优模型、28 个 Skill 为每个 Agent 注入领域知识。DeepSeek v4 Pro 负责强力推理,MiniMax M2.7 负责创意执行和多模态生成(通过工具调用"补全"多模态能力)——双引擎各展所长。

MiniMax的多模态需要通过MiniMaxCLI来实现(Token订阅套餐有赠送多模态额度,视频生成、语音合成、音乐创作、编程、识图、webSearch)

本文基于个人 oh-my-openagent.json 实际配置,详解这套体系的运作原理与 Skill 选装策略。


🏛️ 第一章:架构全景——理解你在操作的是一支军队

1.1 双模型引擎

┌─────────────────────────────────────────────────────────┐
│                   OhMyOpenAgent 双引擎                    │
├─────────────────────────┬───────────────────────────────┤
│   DeepSeek v4 Pro       │   MiniMax M2.7                 │
│   (推理引擎)             │   (执行引擎)                    │
├─────────────────────────┤───────────────────────────────┤
│ • 硬核推理 / 逻辑分析    │ • Agent 任务执行                │
│ • 架构决策 / 算法设计    │ • 创意突破 / 跳出框架            │
│ • 长上下文分析(Metis)  │ • 多模态生成(视频/语音/音乐/图片)│
│ • 技术文档写作           │ • 视觉分析 / OCR                │
│ • 深度研究 / 复杂重构    │ • 前端 UI / 动画                │
├─────────────────────────┤───────────────────────────────┤
│ Flash 变体(低成本):     │ 全模态生产管线:                  │
│ • 代码探索               │ • Hailuo 视频生成               │
│ • 文档查询               │ • Speech 语音合成               │
│ • 简单任务               │ • Music 音乐创作                │
│ • Web 搜索               │ • Image 图片生成                │
└─────────────────────────┴───────────────────────────────┘

核心原则:DeepSeek “想”,MiniMax “做”。每个 Agent 和 Category 都配置了 fallback 链(反向互备),一个模型挂了自动切另一个。

1.2 11 智能体军团

OhMyOpenAgent 定义了 11 个专业智能体,每个都有明确的角色定位和模型分配:

# 智能体 主力模型 职责
🎯 Sisyphus DeepSeek v4 Pro 主控——任务拆解、多智能体编排、质量决策
📐 Prometheus DeepSeek v4 Pro 规划——模糊需求 → 分步可验证计划
🚀 Atlas MiniMax M2.7 执行——代码落地 + MiniMax 全模态管线
🔥 Hephaestus DeepSeek v4 Pro 攻坚——其他 Agent 反复失败的高难度 Bug / 重构
🔮 Oracle DeepSeek v4 Pro 顾问——只读分析:架构权衡、根因诊断、安全审查
📚 Metis DeepSeek v4 Pro 长上下文分析——1M 窗口全库深度审查
🔎 Momus MiniMax M2.7 批评——严格代码审查 + 业界最佳实践对照
🔍 Explore DeepSeek v4 Flash 探索——闪电级代码搜索、模式匹配
📖 Librarian DeepSeek v4 Flash 查询——文档检索、开源参考查找
👁️ Multimodal-Looker MiMo-V2.5 视觉——原生全模态图片分析、OCR、UI 审查
👶 Sisyphus-Junior DeepSeek v4 Flash 打杂——Lint 修复、批量重命名、简单格式调整

💡 协作模式:Sisyphus 拆解任务 → Prometheus 做计划 → Atlas 带队执行 → Momus 审查代码 → Oracle 做架构决策支持。遇到硬骨头交给 Hephaestus 攻坚。所有 Agent 都通过 fallback 互备,不存在单点故障。

1.3 14 种任务分类——智能路由

你的每个任务会被自动路由到最优模型。这套机制让你无需手动选择模型:

任务类型                    →  主力模型           适用场景
──────────────────────────────────────────────────────
🧠 ultrabrain (硬核推理)    →  DeepSeek v4 Pro    复杂算法、架构决策
🔬 deep (深度研究)          →  DeepSeek v4 Pro    多步推理、跨文件实现
✍️  writing (文档写作)      →  DeepSeek v4 Pro    技术文档、API 文档
🌐 web-research (搜索)      →  DeepSeek v4 Flash  查文档、找方案
⚡ quick (快速修复)          →  DeepSeek v4 Flash  typo、配置修改
📦 unspecified-low (低难度)  →  DeepSeek v4 Flash  通用小任务
📦 unspecified-high (高难度) →  DeepSeek v4 Pro    通用复杂任务
──────────────────────────────────────────────────────
🎨 visual-engineering (前端) →  MiniMax M2.7      UI、动画、图片
🎭 artistry (创意突破)       →  MiniMax M2.7      非传统方案
🌐 multimodal (多模态)       →  MiniMax M2.7      视频/语音/音乐/图片
🎬 video-generation          →  MiniMax M2.7      Hailuo 视频
🎙️ speech-synthesis           →  MiniMax M2.7      Speech 语音
🎵 music-composition          →  MiniMax M2.7      Music 音乐
🖼️ image-generation           →  MiniMax M2.7      Image 图片
👁️ vision-analysis            →  MiniMax M2.7      图片理解

关键规律

  • 需要推理 → DeepSeek v4 Pro
  • 需要执行/创意/多模态 → MiniMax M2.7
  • 简单快速 → DeepSeek v4 Flash(降成本)

🎯 第二章:Skill 全景地图——28 个 Skill 按 Agent 分工

把 Skill 按它们在多智能体体系中扮演的角色重新分类:

🎯 Sisyphus(主控编排)
  ├── subagent-driven-development  ← 多子代理并行驱动
  ├── executing-plans              ← 按计划分步执行
  ├── brainstorming                ← 开工前需求澄清
  ├── find-skills                  ← 发现新 Skill
  └── handoff                      ← 跨 Session 交接

📐 Prometheus(规划)
  └── executing-plans              ← 计划执行引擎

🚀 Atlas(执行)
  ├── frontend-dev                 ← 电影级前端(Framer Motion + 媒体生成)
  ├── fullstack-dev                ← 全栈(Express/Next.js/Go/Python)
  ├── react-native-dev             ← RN / Expo 全家桶
  ├── shader-dev                   ← GLSL 着色器特效
  ├── minimax-pdf                  ← 专业 PDF(三管线)
  ├── minimax-docx                 ← Word 文档
  ├── minimax-xlsx                 ← Excel 零格式丢失
  ├── pptx-generator               ← PPT 全流程
  └── minimax-multimodal-toolkit   ← 语音/音乐/视频/图片一站生成

🔥 Hephaestus(攻坚)
  └── systematic-debugging         ← 科学调试六步法

🔮 Oracle(顾问)
  ├── zoom-out                     ← 全局视角分析
  ├── grill-with-docs              ← 文档对照挑战
  └── improve-codebase-architecture ← 架构深化

🔎 Momus(审查)
  ├── review                       ← 双轴审查(规范 + 需求)
  └── verification-before-completion ← 强制验证门禁

👁️ Multimodal-Looker(视觉)
  └── vision-analysis              ← 图片分析/OCR/UI审查

🔧 通用(所有 Agent)
  ├── test-driven-development      ← TDD 红灯→绿灯→重构
  ├── diagnose                     ← 疑难 Bug 专家诊断
  ├── webapp-testing               ← Playwright E2E
  ├── triage                       ← Issue 状态机
  ├── to-prd                       ← PRD 生成
  ├── prototype                    ← 快速原型
  └── mcp-builder                  ← MCP Server 构建

⚡ 内置王牌(已随系统自带)
  ├── playwright                   ← 浏览器自动化
  ├── frontend-ui-ux               ← 设计师级 UI/UX
  ├── git-master                   ← Git 全操作
  ├── review-work                  ← 五重并行审查门禁
  └── ai-slop-remover             ← AI 代码味清理

🛡️ 第三章:第一梯队——质量保障(不装就是在裸奔)

1. verification-before-completion ⭐️⭐️⭐️⭐️⭐️

“完成前必须跑验证,不许空口说白话”

在 OhMyOpenAgent 体系中,Atlas 负责执行代码,Momus 负责审查——但最终验收需要这个 Skill 来强制把关。它会在 Agent 声称"做完了"之前,自动触发验证命令。

触发条件fixcompletedone 等声明性词汇。

2. test-driven-development ⭐️⭐️⭐️⭐️⭐️

“红灯 → 绿灯 → 重构,标准 TDD 循环”

DeepSeek v4 Pro 写代码极快,但没有约束时也极快写出 Bug。TDD Skill 把 Atlas 的执行能力约束在测试框架内。

推荐配合:Hephaestus 攻坚时,先用 TDD Skill 补齐测试覆盖。

3. systematic-debugging ⭐️⭐️⭐️⭐️

“复现 → 缩小 → 假设 → 打桩 → 修复 → 回归”

科学调试六步法。在 Hephaestus 接管前,先走标准流程;走不通再交给 Hephaestus 攻坚。

4. review ⭐️⭐️⭐️⭐️

“双轴并行审查:规范符合度 + 需求符合度”

启动两个并行子审查——一个检查代码规范,一个检查需求匹配。比 Momus 的内置审查更轻量,适合日常快速审查。

5. diagnose ⭐️⭐️⭐️

“疑难杂症专家门诊”

systematic-debugging 搞不定时,diagnose 提供更专业的诊断链路。如果还搞不定 → 交给 Hephaestus。


🎨 第四章:第二梯队——Atlas 执行工具箱

Atlas 是 OhMyOpenAgent 中的主力执行 Agent(MiniMax M2.7),肩负代码落地和多模态产出的双重使命。以下 Skill 直接增强 Atlas 的战斗力。

6. frontend-dev ⭐️⭐️⭐️⭐️⭐️

“电影级前端:Framer Motion / GSAP + MiniMax 媒体生成”

配合 Atlas 的 MiniMax CLI 能力,直接生成页面所需的图片和视频素材,加上电影级动画——一个 Prompt 出整站。

集成点:Atlas → visual-engineering category(MiniMax M2.7) → frontend-dev Skill。

7. fullstack-dev ⭐️⭐️⭐️⭐️⭐️

“全栈最佳实践:Express / Next.js / Go / Python + 生产加固”

覆盖 REST API 设计、实时通信(SSE/WebSocket)、认证流、文件上传。Atlas 用它来保证代码不走野路子。

8. react-native-dev ⭐️⭐️⭐️⭐️

“React Native / Expo 全家桶”

组件、动画、导航、状态管理、性能优化、App Store 部署——Atlas 的移动端能力全靠它。

9. shader-dev ⭐️⭐️⭐️

“GLSL 着色器:Ray Marching + SDF + 粒子系统”

WebGL 创意编程、视觉特效。适合前端需要炫酷效果时加载。


📄 第五章:第三梯队——文档产出四件套

MiniMax M2.7 在结构化内容生成上表现优异,文档四件套是 OhMyOpenAgent 生态的独有优势

10. minimax-pdf ⭐️⭐️⭐️⭐️⭐️

“PDF 设计系统:颜色 → 排版 → 间距,自顶向下流动”

管线 说明
CREATE 从零生成:报告、提案、简历、封面
FILL 智能填写 PDF 表单字段
REFORMAT Markdown/文本一键转专业 PDF

11. minimax-docx ⭐️⭐️⭐️⭐️

“Word 文档三管线:新建 / 填写 / 模板套用,基于 OpenXML SDK”

合同、正式报告、企业文档——格式精确到像素级。

12. minimax-xlsx ⭐️⭐️⭐️⭐️

“零格式丢失编辑 Excel,公式重算 + 专业财务格式”

财务模型、数据报表、透视表——改数据不毁格式。

13. pptx-generator ⭐️⭐️⭐️⭐️

“PPT 全流程:封面 → TOC → 内容 → 章节分隔 → 总结”

PptxGenJS 生成 + 编辑已有 PPTX。技术分享、项目汇报必备。

14. to-prd ⭐️⭐️⭐️

“对话上下文 → 标准 PRD → 发布到 Issue Tracker”

Prometheus 做完规划后,一键输出 PRD。


🌐 第六章:第四梯队——MiniMax 多模态全栈

15. minimax-multimodal-toolkit ⭐️⭐️⭐️⭐️⭐️

“MiniMax 全模态一站生成:🎤语音 + 🎵音乐 + 🎬视频 + 🖼️图片”

这是 Atlas 执行 Agent 的核心武器。在 OhMyOpenAgent 架构中,Atlas 通过 MiniMax CLI 直接调用以下能力:

能力 底层模型 说明
🎤 Speech 2.8 MiniMax TTS 文字转语音、声音克隆、声音设计、多段合成
🎵 Music 2.6 MiniMax Music 原创歌曲、纯音乐
🎬 Hailuo 2.3 MiniMax Video 文生视频、图生视频、首尾帧、主体参考、长视频多场景
🖼️ Image 01 MiniMax Image 文生图、图生图(角色一致性保持)
🔧 FFmpeg 媒体处理 转换、拼接、裁剪、提取

Category 路由:Atlas 根据子任务类型,自动路由到 video-generation / speech-synthesis / music-composition / image-generation category——全部跑在 MiniMax M2.7 上。

16. vision-analysis ⭐️⭐️⭐️⭐️

“MiniMax 视觉理解:图片分析 + OCR + UI 审查”

配合 Multimodal-Looker 智能体(MiniMax M2.7 原生),处理所有视觉任务。触发条件:消息中包含图片路径或 URL。


🚀 第七章:第五梯队——效率跃迁

17. subagent-driven-development ⭐️⭐️⭐️⭐️⭐️

“复杂任务拆解 → 多子代理并行 → Sisyphus 居中调度”

这是 Sisyphus 主控 Agent 的核心 Skill。大型任务会被拆成独立单元,Sisyphus 派发子代理并行执行——DeepSeek v4 Pro 做推理拆分,Atlas(M2.7)或 DeepSeek v4 Flash Agent 并行落地。

18. executing-plans ⭐️⭐️⭐️⭐️

“Prometheus 出计划 → 按检查点分步执行 → 自动 Review”

Prometheus(DeepSeek v4 Pro)规划完成后的执行引擎。每个检查点自动触发 Momus 审查。

19. brainstorming ⭐️⭐️⭐️⭐️

“任何创意工作前强制走需求探索 + 方案设计”

面向 artistry category(MiniMax M2.7)的创意流程。在写代码之前先把需求想清楚。

20. find-skills ⭐️⭐️⭐️

“快速发现和安装新 Skill”

当你想扩展 Agent 能力时,用它搜索可用 Skill。

21. handoff ⭐️⭐️⭐️

“会话交接:当前上下文 → 结构化交接文档”

对话太长要换 Session?一键打包所有上下文,新 Session 无缝续接。


🏗️ 第八章:第六梯队——架构 & 项目管理

22. improve-codebase-architecture ⭐️⭐️⭐️⭐️

“基于 CONTEXT.md 和 ADR,找出架构优化点”

配合 Oracle 的只读分析能力,在不动代码的情况下先分析架构瓶颈。

23. zoom-out ⭐️⭐️⭐️⭐️

“拉远视角,理解局部代码在全局中的位置”

Metis(1M 上下文)或 Oracle 分析陌生代码时的必备视角切换工具。

24. grill-with-docs ⭐️⭐️⭐️

“计划 vs 文档对照审查——用领域语言挑战你的设计”

Prometheus 出计划后、Atlas 执行前,用这个 Skill 做一次压力测试。

25. prototype ⭐️⭐️⭐️

“两路快速原型:终端状态机 + 多风格 UI 并行探索”

方案不确定时先做原型,低成本验证假设。

26. mcp-builder ⭐️⭐️⭐️

“构建 MCP Server:Python FastMCP / Node MCP SDK”

扩展 OhMyOpenAgent 能力边界——把外部 API 封装成 MCP 工具,所有 Agent 都能调用。


🔧 第九章:第七梯队——调试 & 测试

27. webapp-testing ⭐️⭐️⭐️⭐️

“Playwright E2E + 截图 + Console 日志”

前端功能验证、UI 渲染调试。在 Atlas 生成前端代码后,用它做自动验收。

28. triage ⭐️⭐️⭐️

“Issue 状态机:分类 → 优先级 → 分配 → 关闭”

项目管理流程规范化。


⚡ 第十章:内置王牌——无需安装已就绪

这 5 个 Skill 随 OpenCode 系统自带,但你得知道它们有多强:

Skill 模型 亮点
playwright 浏览器全自动化——测试、爬虫、截图、表单填写
frontend-ui-ux 设计师级 UI/UX——无设计稿也能出精品
git-master Git 全操作专家——原子提交、rebase、blame、bisect
review-work 五重并行审查门禁:目标验证 + 代码质量 + 安全审查 + QA 执行 + 上下文挖掘(同时启动 5 个 Agent!)
ai-slop-remover 移除过度注释、无用抽象等 AI 痕迹

⚠️ review-work 是审查链的终极形态——比 review Skill 更强(五重并行 vs 双轴),适合 PR 提交前的最终门禁。它在 OhMyOpenAgent 架构中会同时启动 Oracle、Momus 等多个 Agent 并行审查。


🧭 第十一章:场景速查——什么时候加载哪个 Skill

场景 涉及 Agent 必装 Skill
🔧 日常写代码 Atlas + Sisyphus fullstack-dev + frontend-dev + brainstorming
🧪 写测试 Atlas test-driven-development + webapp-testing
🐛 修 Bug Hephaestus systematic-debugging + diagnose
📦 提交 PR Momus + Oracle review + verification-before-completion + review-work
📝 出文档 Atlas(M2.7) minimax-pdf + minimax-docx + pptx-generator + to-prd
📊 处理数据 Atlas minimax-xlsx
🎙️ 多模态生成 Atlas(M2.7) minimax-multimodal-toolkit
👁️ 图片分析 Multimodal-Looker vision-analysis
🏗️ 重构架构 Oracle + Hephaestus improve-codebase-architecture + zoom-out + grill-with-docs
🚀 大任务拆解 Sisyphus + Prometheus subagent-driven-development + executing-plans
🔄 换 Session Sisyphus handoff
🎨 视觉特效 Atlas(M2.7) shader-dev + frontend-dev
📱 移动开发 Atlas react-native-dev
🔌 自定义工具 mcp-builder
📋 项目管理 triage

💡 第十二章:按 Agent 角色推荐 Skill 组合

不同 Agent 在 OhMyOpenAgent 架构中承担不同职责,加载合适的 Skill 能最大化每个 Agent 的战斗力:

🎯 Sisyphus(主控编排)— DeepSeek v4 Pro

subagent-driven-development  ← 核心:拆解 + 派发 + 调度
executing-plans              ← 按 Prometheus 计划执行
brainstorming                ← 需求澄清
handoff                      ← 长久任务交接

🚀 Atlas(执行主力)— MiniMax M2.7

frontend-dev                 ← 前端(Framer Motion + 媒体生成)
fullstack-dev                ← 全栈(Express/Next.js/Go/Python)
minimax-multimodal-toolkit   ← 语音/音乐/视频/图片
minimax-pdf + docx + xlsx    ← 文档产出
pptx-generator               ← PPT

🔥 Hephaestus(攻坚)— DeepSeek v4 Pro

systematic-debugging         ← 科学调试
diagnose                     ← 专家诊断
improve-codebase-architecture ← 深层重构

🔎 Momus(审查)— MiniMax M2.7

review                       ← 双轴审查
verification-before-completion ← 强制验证

🎯 第十三章:最小必装清单(8 个安装型 + 5 个内置 = 13)

如果只装最核心的,推荐这个组合:

🛡️ verification-before-completion    ← 拒绝假交付(Momus 门禁)
🛡️ test-driven-development          ← 代码有保障(Atlas 约束)
🛡️ systematic-debugging             ← Bug 不求人(Hephaestus 前置)
📄 minimax-pdf                       ← 文档一键出(M2.7 优势)
📄 minimax-multimodal-toolkit        ← 多模态核心(Atlas 武器库)
🎨 frontend-dev                      ← 前端不将就(Atlas 执行)
🎨 fullstack-dev                     ← 全栈通吃(Atlas 执行)
🚀 subagent-driven-development       ← 效率翻倍(Sisyphus 核心)

+ 5 个内置王牌(playwright / frontend-ui-ux / git-master / review-work / ai-slop-remover)

装上这 13 个,你的 DeepSeek v4 + MiniMax M2.7 开发体验会从"能用"直接跃迁到 “恐怖如斯”


👁️ 第十四章:多模态视觉体系——打通 Sisyphus 的"眼睛"

14.1 痛点——Sisyphus 是个"盲人"

OhMyOpenAgent 的多智能体体系有个致命盲区:

你粘贴图片给 Sisyphus(主编排器)
         ↓
Sisyphus 是 DeepSeek v4 Pro(纯文本模型)
         ↓
💥 "Cannot read clipboard" ——图片根本没机会路由给多模态 Agent!

根因:MiniMax M2.7(Atlas 的模型)虽然能做视觉分析,但它不是原生多模态模型——只能通过 MCP 工具(MiniMax_understand_image)"间接"看图。而 opencode 的图片粘贴是发给当前激活的 Agent 的——如果当前是 Sisyphus(DeepSeek v4 Pro),图片在入口就被拒绝了。

14.2 解决方案——双层图片链路

我们需要在两个层面解决问题:

https://github.com/devadathanmb/opencode-minimax-easy-vision

机制 解决什么
🛡️ 入口层 EasyVision 插件拦截 Sisyphus 的图片 → 转 MiniMax MCP 识图 让主编排器也能"看懂"图片,然后智能路由
🚀 直达层 multimodal-looker 切到 MiMo-V2.5(原生全模态) 切到该 Agent 后,图片直通模型,端到端推理
                       你粘贴图片
                           │
              ┌────────────┴────────────┐
              ▼                         ▼
     ┌─────────────────┐      ┌─────────────────────┐
     │  Sisyphus        │      │ multimodal-looker   │
     │  (DeepSeek v4 Pro)│      │  (MiMo-V2.5 🆕)     │
     │  纯文本模型       │      │  原生全模态模型       │
     └────────┬────────┘      └──────────┬──────────┘
              │                          │
     ┌────────▼────────┐        ┌────────▼────────┐
     │ EasyVision 拦截  │        │ 图片直通模型      │
     │ 保存图片到 /tmp   │        │ 310B ViT编码器    │
     │ ↓                │        │ 1M 上下文         │
     │ MCP understand   │        │ ↓                │
     │ _image 分析       │        │ 端到端多模态推理   │
     └────────┬────────┘        └────────┬────────┘
              │                          │
              └──────────┬───────────────┘
                         ▼
                   Sisyphus 编排路由

记得修改 ~/.config/opencode/opencode-minimax-easy-vision.jsonc,给 DeepSeek 加入拦截的名单里。

{
  // Which models this plugin activates for.
  // Wildcards: "*" = all, "provider/*" = all from provider,
  // "*/model" = specific model from any provider, "provider/model" = exact.
  // 拦截所有需要 MCP 识图的模型(包括非原生多模态的 DeepSeek)
  "models": [
    "minimax/*",
    "minimax-cn/*",
    "minimax-coding-plan/*",
    "minimax-cn-coding-plan/*",
    "minimax-token-plan/*",
    "minimax-cn-token-plan/*",
    "opencode-go/deepseek-v4-pro",
    "opencode-go/deepseek-v4-flash"
  ],

  // MCP tool name for image analysis.
  // Format: mcp_<server-key>_<tool>
  "imageAnalysisTool": "mcp_minimax_understand_image",

  // Custom prompt template. Must include at least one variable:
  //   {imageList}  — newline-separated "- Image N: /path"
  //   {imageCount} — number of images
  //   {toolName}   — the configured MCP tool name
  //   {userText}   — the user's original text (may be empty)
  // Leave as null to use the built-in default template.
  "promptTemplate": null,

  // Directory where pasted images are saved before being passed to the MCP tool.
  // Leave as null to use the OS temp directory + "opencode-minimax-vision/".
  "tempDir": null,

  // Delete temp files older than this many hours on plugin startup.
  "cleanupAfterHours": 24
}

14.3 MiMo-V2.5 是什么?

MiMo-V2.5 是 opencode-go(Go 套餐)提供的一款原生全模态模型

指标 数值
总参数 310B(Sparse MoE)
激活参数 15B
上下文窗口 1M tokens
视觉编码器 ViT 7.29亿参数(原生)
输入模态 文本 + 图片 + 视频 + 音频
输出模态 文本
定价 1x(1 token = 1 credit),Go 套餐 $10/月(截至 2026.05)

14.4 三种图片识别路径

# 场景 使用方式 机制
1 🖼️ 在 Sisyphus 粘贴图片 EasyVision 自动拦截 保存到文件 → MiniMax MCP understand_image → 文字返回 → Sisyphus 路由
2 🖼️ 切到 multimodal-looker 粘贴 MiMo-V2.5 原生 ViT 端到端视觉推理(比 MCP 快 3-5x)
3 📂 本地文件路径(如 /tmp/photo.png local-vision category MiniMax MCP understand_image(专用于文件路径)

🔧 第十五章:配置优化实战——skills + prompt_append + vision 三级增强

15.1 Schema 隐藏字段

翻阅 官方 Schema 后发现,除了文档常见的 model/fallback/description,还支持两个关键字段:

字段 类型 适用对象 作用
skills string[] Agent(专属) 预定义该 Agent 默认加载的 Skill 列表
prompt_append string Agent + Category 注入到系统提示词的额外指令文本

15.2 优化效果对比

维度 优化前 优化后
Agent 能力感知 仅描述角色职责 prompt_append 注入能力速查表(子智能体清单+核心规则)
Skill 预关联 skills 字段预关联(Sisyphus 5个、Atlas 10个等)
多模态视觉 粘贴图片即报错 ✅ EasyVision 拦截 + MiMo-V2.5 原生视觉双链路
Category 指引 场景描述 prompt_append 注入 Skill推荐+产出标准

15.3 改动文件清单

文件 改动 作用
oh-my-openagent.json 11 Agent + 15 Category 全部添加 prompt_append Agent 启动时注入能力速查表
oh-my-openagent.json 7 个 Agent 添加 skills 预关联 Sisyphus(5) / Atlas(10) / Hephaestus(3) / Oracle(3) / Momus(2) / Prometheus(1) / Metis(1) / Multimodal-Looker(1)
oh-my-openagent.json multimodal-looker 从之前MiniMax模型切 opencode-go/MiMo-V2.5 + fallback 原生全模态视觉
oh-my-openagent.json 新增 local-vision category 本地文件图片专用 MCP 通道
opencode-minimax-easy-vision.jsonc 模型列表新增 deepseek-v4-pro / deepseek-v4-flash Sisyphus 粘贴图片 → EasyVision 拦截 → MCP 识图

15.4 Sisyphus 的 prompt_append 示例

## ⚡ 你的能力速查表
### 可调度子智能体
- 🔮 Oracle(DeepSeek v4 Pro):只读架构顾问
- 📐 Prometheus(DeepSeek v4 Pro):需求→分步可验证计划
- 🚀 Atlas(MiniMax M2.7):执行主力——全模态管线+全栈开发
- 🔥 Hephaestus(DeepSeek v4 Pro):高难度Bug/深层重构攻坚
- 🔎 Momus(MiniMax M2.7):代码审查——双轴审查+强制验证门禁
- 🔍 Explore(Flash):内部代码搜索
- 📖 Librarian(Flash):外部资料查询
- 👁️ Multimodal-Looker(MiMo-V2.5):原生全模态视觉分析
### 核心规则
- 所有实现必须委托(用task),不自己写代码
- 视觉工作→visual-engineering category
- 并行化一切能并行的
- 完成后:momus审查→verification-before-completion验证

15.5 验收测试结果

测试项 结果
在 Sisyphus 粘贴图片 → EasyVision 拦截 ✅ 通过
MiniMax MCP understand_image 分析截图 ✅ 通过
图片→文字→Sisyphus 智能路由 ✅ 通过
multimodal-looker + MiMo-V2.5 原生视觉 ✅ 通过

📦 附录 A:Skill 仓库索引(一键安装)

以下将文中 28 个安装型 Skill + 5 个内置 Skill 按 GitHub 仓库归类,每个仓库均提供一键安装命令。安装后重启 OpenCode 即可生效。

🏢 仓库一:MiniMax-AI/skills(10 个 Skill)⭐ 主力仓库

仓库地址https://github.com/MiniMax-AI/skills
许可证:MIT
包含 Skill

# Skill 名称 文中章节 类型
1 frontend-dev 第四章 §6 🎨 前端/动画
2 fullstack-dev 第四章 §7 🔧 全栈
3 react-native-dev 第四章 §8 📱 移动端
4 shader-dev 第四章 §9 🎨 着色器
5 minimax-pdf 第五章 §10 📄 PDF
6 minimax-docx 第五章 §11 📄 Word
7 minimax-xlsx 第五章 §12 📊 Excel
8 pptx-generator 第五章 §13 📊 PPT
9 minimax-multimodal-toolkit 第六章 §15 🎤🎵🎬🖼️ 多模态
10 vision-analysis 第六章 §16 👁️ 视觉分析

🔧 一键安装(Linux/macOS/WSL)

# 克隆仓库
git clone https://github.com/MiniMax-AI/skills.git ~/.minimax-skills

# 创建 skills 目录并建立符号链接
mkdir -p ~/.config/opencode/skills
for skill in ~/.minimax-skills/skills/*/; do
  skill_name=$(basename "$skill")
  ln -sfn "$skill" ~/.config/opencode/skills/"$skill_name"
done

echo "✅ MiniMax Skills 安装完成!重启 OpenCode 生效"

🔧 Windows(PowerShell)

git clone https://github.com/MiniMax-AI/skills.git "$env:USERPROFILE\.minimax-skills"
New-Item -ItemType Directory -Force -Path "$env:USERPROFILE\.config\opencode\skills"
Get-ChildItem "$env:USERPROFILE\.minimax-skills\skills" -Directory | ForEach-Object {
  New-Item -ItemType SymbolicLink -Path "$env:USERPROFILE\.config\opencode\skills\$($_.Name)" -Target $_.FullName -Force
}
Write-Host "✅ MiniMax Skills 安装完成!"

🔌 仓库二:code-yeongyu/oh-my-openagent(核心插件 + 5 内置 Skill)

仓库地址https://github.com/code-yeongyu/oh-my-openagent
说明:OhMyOpenAgent 核心插件,提供 11 智能体 + 14 任务分类 + 5 个内置 Skill。这是整套多智能体系统的基石,必须先装。

🔧 安装核心插件

# 方式一:bun(推荐)
bunx oh-my-opencode@latest

# 方式二:npm
npx oh-my-opencode@latest

内置 Skill(无需额外安装,插件自带)

# Skill 文中章节 说明
⚡1 playwright 第十章 浏览器全自动化
⚡2 frontend-ui-ux 第十章 设计师级 UI/UX
⚡3 git-master 第十章 Git 全操作专家
⚡4 review-work 第十章 五重并行审查门禁
⚡5 ai-slop-remover 第十章 AI 代码味清理

👁️ 仓库三:devadathanmb/opencode-minimax-easy-vision(视觉链路插件)

仓库地址https://github.com/devadathanmb/opencode-minimax-easy-vision
说明:让 DeepSeek(纯文本模型)粘贴图片时自动拦截 → MiniMax MCP 识图,打通 Sisyphus 的"眼睛"。详见第十四章。

🔧 一键安装

# 克隆到 opencode 插件目录
git clone https://github.com/devadathanmb/opencode-minimax-easy-vision.git \
  ~/.config/opencode/plugins/opencode-minimax-easy-vision

# 编辑配置,将 DeepSeek 加入拦截名单
# 配置文件路径:~/.config/opencode/opencode-minimax-easy-vision.jsonc

配置示例(opencode-minimax-easy-vision.jsonc

{
  "models": [
    "minimax/*",
    "minimax-cn/*",
    "opencode-go/deepseek-v4-pro",   // ← 关键:DeepSeek 加入拦截
    "opencode-go/deepseek-v4-flash"  // ← 关键:Flash 也加入
  ],
  "imageAnalysisTool": "mcp_minimax_understand_image",
  "cleanupAfterHours": 24
}

🌐 仓库四:社区编排类 Skill(通过 npx skills 安装)

以下编排类 Skill 来自开源社区多个仓库,可通过通用 Skills CLI 一键安装:

🔧 通用安装方式

# 搜索可用 Skill
npx skills find "test-driven-development"

# 安装指定 Skill(示例)
npx skills add <owner/repo> --skill <skill-name> -g -y
# Skill 名称 文中章节 推荐来源 安装命令
11 test-driven-development 第三章 community npx skills find "test-driven-development"
12 verification-before-completion 第三章 superpowers npx skills add obra/superpowers-skills --skill "Verification Before Completion" -g -y
13 systematic-debugging 第三章 community npx skills find "systematic-debugging"
14 review 第三章 community npx skills find "review"
15 diagnose 第三章 mattpocock npx skills add mattpocock/skills --skill diagnose -g -y
16 subagent-driven-development 第七章 superpowers npx skills add obra/superpowers-skills --skill "Subagent-Driven Development" -g -y
17 executing-plans 第七章 superpowers npx skills add obra/superpowers-skills --skill "Executing Plans" -g -y
18 brainstorming 第七章 superpowers npx skills add obra/superpowers-skills --skill brainstorming -g -y
19 find-skills 第七章 community npx skills find "find-skills"
20 handoff 第七章 mattpocock npx skills add mattpocock/skills --skill handoff -g -y
21 improve-codebase-architecture 第八章 mattpocock npx skills add mattpocock/skills --skill improve-codebase-architecture -g -y
22 zoom-out 第八章 mattpocock npx skills add mattpocock/skills --skill zoom-out -g -y
23 grill-with-docs 第八章 mattpocock npx skills add mattpocock/skills --skill grill-with-docs -g -y
24 prototype 第八章 mattpocock npx skills add mattpocock/skills --skill prototype -g -y
25 mcp-builder 第八章 community npx skills find "mcp-builder"
26 webapp-testing 第九章 community npx skills find "webapp-testing"
27 triage 第九章 mattpocock npx skills add mattpocock/skills --skill github-triage -g -y
28 to-prd 第五章 mattpocock npx skills add mattpocock/skills --skill to-prd -g -y

📌 备注:标记为 community 的 Skill 可通过 skills.sh 搜索最新来源。标记为 mattpocock / superpowers 的 Skill 已验证上游仓库存在。

💡 一键安装全部社区 Skill(推荐):在 npx skills find 搜索后逐个安装,或访问 https://skills.sh/ 浏览排行榜挑选。


🗺️ 完整 Skill 来源速查表

┌─────────────────────────────────────────────────────────┐
│                    Skill 来源全景                         │
├─────────────────────┬───────────────────────────────────┤
│ MiniMax-AI/skills   │ 10 个(主力仓库)                  │
│   git clone → ln    │ frontend-dev, fullstack-dev,      │
│                     │ react-native-dev, shader-dev,     │
│                     │ minimax-pdf, minimax-docx,        │
│                     │ minimax-xlsx, pptx-generator,     │
│                     │ minimax-multimodal-toolkit,       │
│                     │ vision-analysis                   │
├─────────────────────┼───────────────────────────────────┤
│ oh-my-openagent     │ 5 个内置 Skill(插件自带)          │
│   核心插件           │ playwright, frontend-ui-ux,       │
│   bunx 一键安装      │ git-master, review-work,          │
│                     │ ai-slop-remover                   │
├─────────────────────┼───────────────────────────────────┤
│ easy-vision 插件     │ 1 个视觉链路插件(独立安装)        │
│   git clone         │ 让 DeepSeek 也能"看图"            │
├─────────────────────┼───────────────────────────────────┤
│ mattpocock/skills   │ 8 个编排类 Skill                  │
│   npx skills add    │ diagnose, handoff, prototype,     │
│                     │ zoom-out, grill-with-docs,        │
│                     │ to-prd, triage,                   │
│                     │ improve-codebase-architecture     │
├─────────────────────┼───────────────────────────────────┤
│ superpowers-skills  │ 4 个流程类 Skill                  │
│   npx skills add    │ brainstorming, subagent-driven-   │
│                     │ development, executing-plans,     │
│                     │ verification-before-completion    │
├─────────────────────┼───────────────────────────────────┤
│ community           │ 6 个通用 Skill                    │
│   npx skills find   │ test-driven-development,          │
│   → skills.sh       │ systematic-debugging, review,     │
│                     │ mcp-builder, webapp-testing,      │
│                     │ find-skills                       │
└─────────────────────┴───────────────────────────────────┘

附录 B:ohmyopencode 配置(优化版——含 skills + prompt_append + vision)

{
  "$schema": "https://raw.githubusercontent.com/code-yeongyu/oh-my-openagent/dev/assets/oh-my-opencode.schema.json",
  "agents": {
    "sisyphus": {
      "model": "opencode-go/deepseek-v4-pro",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "🎯 主控智能体(DeepSeek v4 Pro)——任务拆解与多智能体编排中枢。职责:① 将复杂需求拆分为可并行执行的子任务;② 委托给最合适的子智能体(Atlas执行、Oracle顾问、Explore探索、Momus审查);③ 质量把控与最终决策。核心 Skill:subagent-driven-development(多子代理并行驱动)、executing-plans(按计划执行)、brainstorming(开工前澄清需求)、find-skills(发现新Skill)、handoff(跨Session交接)。可利用MiniMax MCP的web_search获取最新实践。协作模式:Sisyphus拆解 → Prometheus规划 → Atlas执行 → Momus审查 → Oracle架构决策。",
      "skills": [
        "subagent-driven-development",
        "executing-plans",
        "brainstorming",
        "find-skills",
        "handoff"
      ],
      "prompt_append": "## ⚡ 你的能力速查表\n### 可调度子智能体\n- 🔮 Oracle(DeepSeek v4 Pro):只读架构顾问——架构权衡、根因诊断、安全审查\n- 📐 Prometheus(DeepSeek v4 Pro):需求→分步可验证计划\n- 📚 Metis(DeepSeek v4 Pro):1M上下文全局分析\n- 🚀 Atlas(MiniMax M2.7):执行主力——全模态管线(视频/语音/音乐/图片)+ 全栈开发\n- 🔥 Hephaestus(DeepSeek v4 Pro):高难度Bug/深层重构攻坚(2+次失败后调用)\n- 🔎 Momus(MiniMax M2.7):代码审查——双轴审查+强制验证门禁\n- 🔍 Explore(Flash):内部代码搜索(ast_grep/grep/glob)\n- 📖 Librarian(Flash):外部资料查询(MiniMax web_search)\n- 👁️ Multimodal-Looker(MiniMax M2.7):图片分析/OCR/UI审查\n### 核心规则\n- 所有实现必须委托(用task),不自己写代码\n- 视觉工作→visual-engineering category\n- 并行化一切能并行的\n- 完成后:momus审查→verification-before-completion验证"
    },
    "atlas": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🚀 执行主力智能体(MiniMax M2.7,Pro推理兜底)——代码落地 + MiniMax全模态管线。开发Skill全栈覆盖:【前端】frontend-dev(电影级动画Framer Motion/GSAP+媒体生成)、shader-dev(GLSL着色器特效);【全栈】fullstack-dev(Express/Next.js/Go/Python);【移动端】react-native-dev(RN/Expo全家桶);【文档】minimax-pdf(三管线PDF)、minimax-docx(Word文档)、minimax-xlsx(Excel零格式丢失)、pptx-generator(PPT全流程);【多模态】minimax-multimodal-toolkit(Hailuo视频+Speech语音+Music音乐+Image图片一站生成)。通过MCP做视觉分析(understand_image)和资料检索(web_search)。工具:MiniMax CLI(多模态生成)+ 全模态MCP工具集。",
      "skills": [
        "frontend-dev",
        "fullstack-dev",
        "react-native-dev",
        "shader-dev",
        "minimax-multimodal-toolkit",
        "minimax-pdf",
        "minimax-docx",
        "minimax-xlsx",
        "pptx-generator",
        "test-driven-development"
      ],
      "prompt_append": "## ⚡ 你的工具清单\n### 核心Skill(预加载)\n- frontend-dev:电影级前端(Framer Motion/GSAP + AI素材生成)\n- fullstack-dev:全栈(Express/Next.js/Go/Python)\n- react-native-dev:RN/Expo全家桶\n- shader-dev:GLSL着色器特效\n- minimax-multimodal-toolkit:视频(Hailuo)/语音(Speech)/音乐(Music)/图片(Image)一站式生成\n- minimax-pdf/docx/xlsx:文档三件套(零格式丢失)\n- pptx-generator:PPT全流程(封面/目录/内容/总结)\n- test-driven-development:红灯→绿灯→重构\n### 可用工具(直接调用)\n- MiniMax CLI:多模态生成(视频/语音/音乐/图片)\n- MiniMax MCP:understand_image(视觉分析) + web_search(资料检索)\n- Playwright:浏览器自动化测试\n### 关键规则\n- 完成后跑 webapp-testing 验证前端效果\n- 文档类产出用 minimax-pdf/docx/xlsx 而非手写Markdown\n- 前端产出必须带电影级动画"
    },
    "hephaestus": {
      "model": "opencode-go/deepseek-v4-pro",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "🔥 攻坚智能体(DeepSeek v4 Pro)——高难度Bug/深层重构专家。触发条件:① 其他Agent反复失败(2+次);② Oracle诊断出根因后需要高强度编码攻坚;③ 跨模块架构级改动。核心 Skill:systematic-debugging(复现→缩小→假设→打桩→修复→回归六步法)、diagnose(疑难Bug专家诊断)、improve-codebase-architecture(深层架构重构)。Pro的强推理能力确保一击必中,不下补丁式修补。",
      "skills": [
        "systematic-debugging",
        "diagnose",
        "improve-codebase-architecture"
      ],
      "prompt_append": "## ⚡ 你的工作流程\n### 调试六步法(systematic-debugging)\n1. 复现Bug 2. 缩小范围 3. 建立假设 4. 打桩/日志 5. 修复根因 6. 回归测试防复发\n### 何时调用Oracle\n- 2次修复失败后→让Oracle读代码做根因分析\n- 跨模块改动前→让Oracle评审影响面\n### 关键规则\n- 修复根因,不修症状\n- 每步修复后验证(must pass tests)\n- 不改测试来'pass'——那是作弊\n- 3次失败→立即停止→回滚→咨询Oracle"
    },
    "prometheus": {
      "model": "opencode-go/deepseek-v4-pro",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "📐 规划师智能体(DeepSeek v4 Pro)——模糊需求→分步可验证计划。职责:将需求转化为结构化工程任务,标注依赖关系和并行机会,确保每个子任务有明确的验收标准。核心 Skill:executing-plans(计划执行引擎)。可将Skills技能库作为任务拆分的参考模板,输出包含:任务分解、优先级排序、并行执行策略、检查点定义。",
      "skills": [
        "executing-plans"
      ],
      "prompt_append": "## ⚡ 你的规划模板\n### 输出结构\n1. 任务拆解:原子级子任务列表,标注可并行项\n2. 依赖关系:哪些任务必须等前面的完成\n3. 验收标准:每个子任务的'done'条件\n4. 模型推荐:每个任务建议用哪个category/agent\n5. Skill推荐:每个任务建议加载哪些Skill\n### 关键规则\n- 每个子任务必须可独立验证\n- 并行机会必须明确标注\n- 输出保存为 .sisyphus/plans/*.md 格式"
    },
    "oracle": {
      "model": "opencode-go/deepseek-v4-pro",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "🔮 只读顾问智能体(DeepSeek v4 Pro)——不写代码、不做决策、仅提供分析建议。适用场景:① 多系统架构权衡(微服务 vs 单体);② 2次以上调试失败后的根因分析;③ 陌生代码模式的安全/性能审查;④ 技术选型对比评估。核心 Skill:zoom-out(全局视角)、grill-with-docs(计划vs文档对照挑战)、improve-codebase-architecture(架构深化建议)。Pro的最强推理模式专为深度思考场景设计。",
      "skills": [
        "zoom-out",
        "grill-with-docs",
        "improve-codebase-architecture"
      ],
      "prompt_append": "## ⚡ 你的分析边界\n### 你可以做\n- 分析架构/代码模式/性能瓶颈\n- 提出多个方案并给出权衡分析\n- 对照文档挑战现有设计\n- 审查安全问题和潜在风险\n### 你绝不能做\n- 写代码、改文件\n- 做最终决策(由Sisyphus决策)\n- 代替其他Agent执行任务"
    },
    "metis": {
      "model": "opencode-go/deepseek-v4-pro",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "📚 长上下文分析专家(DeepSeek v4 Pro,1M上下文窗口)——全库深度分析。适用场景:① 大型代码库架构审查;② 跨模块依赖追踪;③ 长文档(PRD/ADR)综合评审;④ 一次性消化整个仓库的结构和模式输出全局洞察。核心 Skill:zoom-out(拉远视角理解局部代码在全局中的位置)。不同于Oracle的单点分析,Metis擅长全局视角的系统级审查。",
      "skills": [
        "zoom-out"
      ],
      "prompt_append": "## ⚡ 你的分析策略\n### 优势\n- 1M上下文窗口:可一次性读入整个仓库\n- 全局视角:跨模块依赖追踪、架构全景图\n### 与Oracle分工\n- Metis:全局视角、系统级审查、跨模块分析\n- Oracle:单点深度分析、架构决策权衡、根因诊断\n- 需要全景→Metis;需要深度→Oracle"
    },
    "momus": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🔎 代码审查与批评智能体(MiniMax M2.7,Pro审查兜底)——不为礼貌牺牲质量。能力:① 双轴审查(规范合规+需求对齐);② 利用MiniMax MCP的web_search获取业界最佳实践作为参照基准;③ 给出有据可查的改进建议。核心 Skill:review(双轴审查:Standards+Spec并行)、verification-before-completion(强制验证门禁——声称完成前必须跑验证命令)。触发时机:PR提交前、重大重构后、需要第三方视角时。审查链:review(初步)→ review-work(五重并行终极审查)。",
      "skills": [
        "review",
        "verification-before-completion"
      ],
      "prompt_append": "## ⚡ 你的审查清单\n### 双轴审查(review)\n- Standards轴:代码是否符合项目规范\n- Spec轴:代码是否匹配原始需求\n### 强制验证(verification-before-completion)\n- 触发词:done/complete/finished/fixed→必须先跑验证\n- 验证通过前不说'完成'\n### 审查工具\n- MiniMax MCP web_search:查业界最佳实践做参照\n- lsp_diagnostics:检查Lint/类型错误\n- bash:运行测试/build命令\n### 审查链\n- 日常:review(双轴并行)\n- PR前:review-work(五重并行:Oracle×2 + QA + 上下文挖掘)"
    },
    "explore": {
      "model": "opencode-go/deepseek-v4-flash",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "🔍 极速代码探索(DeepSeek v4 Flash,成本最低速度最快)——内部代码库搜索。能力:闪电级文件搜索、AST模式匹配、代码库结构发现。适用场景:查找特定实现、追踪调用链、扫描代码模式、发现项目约定。可使用MiniMax MCP的web_search查找外部开源代码参考。注意:此为内部搜索Agent,与librarian(外部资料搜索)互补。",
      "prompt_append": "## ⚡ 你的搜索工具箱\n### 内部搜索(代码库)\n- Grep:正则全文搜索\n- Glob:文件名模式匹配\n- ast_grep_search:AST结构化搜索(25种语言)\n- lsp_find_references:查找所有引用\n- lsp_symbols:文档/工作区符号搜索\n### 外部搜索\n- MiniMax MCP web_search:查开源代码参考\n### 互补分工\n- explore → 内部代码库搜索\n- librarian → 外部文档/开源参考查询"
    },
    "librarian": {
      "model": "opencode-go/deepseek-v4-flash",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "📖 文档与外部参考查询(DeepSeek v4 Flash)——外部资料检索。能力:查阅官方API文档、搜索npm/pip/cargo包用法、查找开源实现示例。使用MiniMax MCP的web_search工具检索最新文档和最佳实践。注意:此为外部资料搜索Agent,与explore(内部代码搜索)互补。适合:遇到不熟悉的库/框架时,先查文档再写代码。",
      "prompt_append": "## ⚡ 你的搜索策略\n### 搜索工具\n- MiniMax MCP web_search:实时网页搜索\n- websearch_web_search_exa:语义搜索GitHub等\n- context7_query-docs:Context7文档库查询(先resolve-library-id)\n- grep_app_searchGitHub:GitHub代码搜索\n### 互补分工\n- librarian → 外部文档/API/最佳实践查询\n- explore → 内部代码库搜索"
    },
    "sisyphus-junior": {
      "model": "opencode-go/deepseek-v4-flash",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "👶 Sisyphus辅助(DeepSeek v4 Flash)——处理明确、单一、重复性的子任务。接收Sisyphus明确指令执行,不自行决策。适用:修Lint错误、更新依赖版本、批量重命名、简单格式调整。Flash的低成本适合大量微小任务。",
      "prompt_append": "## ⚡ 你的工作范围\n### 能做\n- 修单文件Lint错误\n- 更新依赖版本号\n- 批量重命名变量/文件\n- 简单格式调整(缩进、换行)\n### 不能做\n- 自行决策架构/设计\n- 跨多文件的复杂改动\n- 需要逻辑推理的任务"
    },
    "multimodal-looker": {
      "model": "opencode-go/mimo-v2.5",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "👁️ 原生全模态视觉分析智能体(MiMo-V2.5,310B参数/15B激活/1M上下文)——支持直接接收粘贴的图片、无需MCP中转。能力:文本+图片+视频+音频理解,原生ViT(7.29亿参数)视觉编码器。适用:粘贴图片分析、截图审查、UI评审、OCR提取、图表解析。核心 Skill:vision-analysis(结构化视觉分析报告)。注意:仅做视觉理解(look),不生成图片(生成用 image-generation category + Atlas)。如MiMo-V2.5图片路由未生效,自动fallback到MiniMax M2.7 + MCP understand_image。",
      "skills": [
        "vision-analysis"
      ],
      "prompt_append": "## ⚡ 你是 MiMo-V2.5——原生全模态模型\n### 原生能力(直接接收,无需MCP)\n- 图片输入:粘贴截图/设计稿/图表直接理解\n- 视频理解:视频帧分析\n- 音频理解:音频内容转录与分析\n### 优势\n- 310B总参数/15B激活(Sparse MoE),1M上下文\n- 7.29亿参数ViT原生视觉编码——比MCP中转快3-5x\n- 端到端理解:图片和文字在同一上下文中推理\n### 备用路径(fallback到MiniMax时)\n- MiniMax_understand_image:MCP图片分析(JPEG/PNG/WebP)\n- vision-analysis技能:结构化视觉报告\n### 不做什么\n- 不生成图片/视频/音频(那是 atlas + image-generation 的活)"
    }
  },
  "categories": {
    "visual-engineering": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🎨 前端/UI/动画/图片生成(MiniMax M2.7执行,Pro推理兜底)。推荐 Skill:frontend-dev(电影级动画Framer Motion/GSAP+AI媒体素材生成)、frontend-ui-ux(设计师级UI/UX)、shader-dev(GLSL着色器特效)、minimax-multimodal-toolkit(通过MiniMax CLI生成图片/视频素材)。适用:着陆页、营销站、产品页、仪表板、媒体素材生成、电影级滚动动画。不适用:纯后端逻辑。",
      "prompt_append": "## 🎨 前端任务必加载Skill\n- frontend-dev:电影级动画(Framer Motion/GSAP)+ AI媒体素材生成\n- frontend-ui-ux:设计师级UI/UX(无设计稿也能出精品)\n- shader-dev:GLSL着色器特效(按需)\n- minimax-multimodal-toolkit:通过MiniMax CLI生成图片/视频素材\n- webapp-testing:Playwright E2E验证前端效果\n### 产出标准\n- 必须带动画效果\n- 响应式设计\n- E2E测试通过"
    },
    "multimodal": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🌐 全模态生成与理解(MiniMax M2.7一站式)。推荐 Skill:minimax-multimodal-toolkit。能力:通过MiniMax CLI调用Hailuo视频生成、Speech语音合成(TTS/声音克隆/多段合成)、Music音乐创作(歌曲/纯音乐)、Image图片生成;通过MCP的understand_image做视觉分析。适用:需要同时产出多种媒体格式的复杂任务。",
      "prompt_append": "## 🌐 全模态任务必加载Skill\n- minimax-multimodal-toolkit:一站式全模态生成\n### MiniMax CLI命令速查\n- 视频生成→minimax video generate\n- 语音合成→minimax speech generate\n- 音乐创作→minimax music generate\n- 图片生成→minimax image generate"
    },
    "video-generation": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🎬 Hailuo 2.3 视频生成(MiniMax M2.7)。推荐 Skill:minimax-multimodal-toolkit。通过MiniMax CLI的视频生成命令,支持:文本到视频(text-to-video)、图片到视频(image-to-video)、首尾帧视频(start-end frame)、主题参考视频(subject reference)、模板化视频、长视频多场景编排。",
      "prompt_append": "## 🎬 视频生成必加载Skill: minimax-multimodal-toolkit\n### 支持模式\n- text-to-video:文本直接生成视频\n- image-to-video:图片+描述生成视频\n- start-end frame:首尾帧控制\n- subject reference:主题参考保持一致性\n- long-form:多场景长视频编排"
    },
    "speech-synthesis": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🎙️ Speech 2.8 语音合成(MiniMax M2.7)。推荐 Skill:minimax-multimodal-toolkit。通过MiniMax CLI的语音合成命令,支持:文本转语音(TTS)、声音克隆、声音设计、多段合成拼接。适用:配音、播客、有声书、语音助手。",
      "prompt_append": "## 🎙️ 语音合成必加载Skill: minimax-multimodal-toolkit\n### 支持能力\n- TTS:文本→自然语音\n- 声音克隆:从样本克隆音色\n- 声音设计:自定义音色参数\n- 多段合成:拼接多段语音为长音频"
    },
    "music-composition": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🎵 Music 2.6 音乐创作(MiniMax M2.7)。推荐 Skill:minimax-multimodal-toolkit。通过MiniMax CLI的音乐生成命令,根据文本描述生成原创歌曲(带歌词+人声)或纯音乐(器乐演奏)。适用:BGM、主题曲、广告配乐。",
      "prompt_append": "## 🎵 音乐创作必加载Skill: minimax-multimodal-toolkit\n### 支持模式\n- 歌曲(song):带歌词+人声演唱\n- 纯音乐(instrumental):器乐演奏\n- 风格描述:如'中国风电音'、'钢琴叙事曲'"
    },
    "image-generation": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🖼️ Image 01 图片生成(MiniMax M2.7)。推荐 Skill:minimax-multimodal-toolkit。通过MiniMax CLI的图片生成命令,支持:文本到图片(text-to-image)、图片到图片(image-to-image)、角色参考图生成。适用:营销图、概念图、角色设计、插图。",
      "prompt_append": "## 🖼️ 图片生成必加载Skill: minimax-multimodal-toolkit\n### 支持模式\n- text-to-image:文本描述生成图片\n- image-to-image:参考图+描述生成新图\n- character reference:角色一致性参考生成"
    },
    "local-vision": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/mimo-v2.5"
      ],
      "description": "📂 本地图片文件识别(MiniMax M2.7 + MCP understand_image)——专门处理本地文件路径的图片。使用MiniMax MCP的MiniMax_understand_image工具对本地图片文件(JPEG/PNG/WebP)进行内容分析、OCR文字识别、图表数据提取。推荐 Skill:vision-analysis(结构化视觉分析报告)。与 vision-analysis 区别:本类别聚焦本地文件路径图片,通过MCP工具调用而非原生视觉模型。适用:本地截图分析、图片文件批量处理、文档扫描件识别。",
      "prompt_append": "## 📂 本地图片识别专用通道\n### 工具\n- MiniMax_understand_image:通过文件路径分析图片\n### 适用场景\n- 明确提供本地文件路径的图片(如 /tmp/screenshot.png)\n- 大量图片文件的批量分析\n- 需要结构化OCR输出的文档扫描件\n### 与 vision-analysis 的区别\n- local-vision:专门走 MCP 文件路径分析(专用于本地文件)\n- vision-analysis:通用视觉理解(可直接接收粘贴的图片)\n### 不做什么\n- 不处理非文件路径的图片(粘贴图片→用 vision-analysis)\n- 不生成图片(生成→用 image-generation)"
    },
    "vision-analysis": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "👁️ 视觉理解与分析(MiniMax M2.7)。推荐 Skill:vision-analysis(结构化视觉分析报告)。使用MiniMax MCP的MiniMax_understand_image工具进行:图片内容分析、OCR文字识别、UI界面审查、图表数据提取、设计稿评审、照片场景描述。注意:这是视觉理解类别,不是图片生成——生成图片请用 image-generation category。",
      "prompt_append": "## 👁️ 视觉分析必加载Skill: vision-analysis\n### 分析工具\n- MiniMax_understand_image:核心视觉分析API\n### 输出格式\n- 结构化报告:分类描述+关键发现+建议\n### 不要混淆\n- vision-analysis=图片理解\n- image-generation=图片生成"
    },
    "web-research": {
      "model": "opencode-go/deepseek-v4-flash",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7",
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🌐 上网搜索与资料查找(DeepSeek v4 Flash快速搜索,复杂分析回退到Pro)。工具:MiniMax MCP的web_search(实时搜索)、websearch_web_search_exa(语义搜索GitHub等)。适用:查最新API文档、找开源实现、调研技术方案、获取业界最佳实践、验证技术决策。策略:先用Flash低成本搜,结果不满足时fallback到Pro做深度分析。",
      "prompt_append": "## 🌐 搜索策略\n### 工具选择\n- MiniMax_web_search:中文/实时信息搜索\n- websearch_web_search_exa:英文/语义搜索\n- context7_query-docs:官方文档库查询\n- grep_app_searchGitHub:GitHub代码搜索\n### 成本策略\n- 先用Flash搜(低成本)\n- 结果不足→fallback到Pro做深度分析"
    },
    "quick": {
      "model": "opencode-go/deepseek-v4-flash",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "⚡ 快速修复(DeepSeek v4 Flash最低成本)——单文件typo、简单配置修改、明确小改动。适用:拼写错误、依赖版本号更新、单行配置调整。不适用:需要多文件协调、逻辑推理、架构变更的任务——这些请用 deep 或 ultrabrain。",
      "prompt_append": "## ⚡ 快速修复边界\n### 能做\n- 单文件typo/语法错误\n- 单行配置修改\n- 依赖版本号更新\n### 不能做\n- 多文件协调改动→用 deep\n- 逻辑推理/架构变更→用 ultrabrain\n- 代码重构→用 deep"
    },
    "deep": {
      "model": "opencode-go/deepseek-v4-pro",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "🔬 自主深度研究(DeepSeek v4 Pro强推理)——目标驱动的端到端问题解决。适用:需要自主探索、多步推理、跨文件实现的复杂研究型任务。Pro的强推理能力确保分析的深度和准确性。适合:调研型任务、复杂功能实现探索、多方案对比验证。",
      "prompt_append": "## 🔬 深度研究策略\n### 方法论\n1. 先Explore探索代码库结构\n2. 再Librarian查外部最佳实践\n3. Pro推理整合方案\n4. 输出有据可查的结论\n### 与ultrabrain区别\n- deep:研究+实现(有明确输出)\n- ultrabrain:纯推理(算法/架构/逻辑难题)"
    },
    "artistry": {
      "model": "minimax-cn-coding-plan/MiniMax-M2.7",
      "fallback": [
        "opencode-go/deepseek-v4-pro"
      ],
      "description": "🎭 创意突破(MiniMax M2.7创造性思维)——超越常规模式,用非传统、创新性方法解决复杂问题。推荐 Skill:brainstorming(创意工作前强制需求探索+方案设计)。M2.7的创造性思维擅长跳出框架的解决方案。适用:需要打破常规的设计方案、创新架构探索、非传统解法。",
      "prompt_append": "## 🎭 创意流程\n### 必加载Skill: brainstorming\n1. 需求探索:理解用户真实意图\n2. 方案发散:3+个不同方向的方案\n3. 方案评估:可行性/创新性/成本\n4. 原型验证:低成本快速试错\n### 与其他category区别\n- artistry=跳出框架的创新方案\n- deep=深入研究+落地实现\n- ultrabrain=硬核逻辑推理"
    },
    "ultrabrain": {
      "model": "opencode-go/deepseek-v4-pro",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "🧠 硬核推理(DeepSeek v4 Pro最强模式)——仅用于真正困难、逻辑密集型任务。给明确目标而非分步指令,让Pro自行推理最优路径。适用:复杂算法设计、深层架构决策、多系统协同难题、高难度数学/逻辑问题。不适用:日常编码、简单重构——这些请用 deep。",
      "prompt_append": "## 🧠 硬核推理策略\n### 适用场景\n- 复杂算法设计与优化\n- 多系统架构权衡决策\n- 高难度数学/逻辑证明\n- 分布式系统协同方案\n### 与deep区别\n- ultrabrain:给目标→自己推理最优路径(不干预)\n- deep:自主探索+分步实现(可干预)\n### 不要滥用\n- 日常代码→用 quick/deep\n- 简单算法→用 deep"
    },
    "unspecified-low": {
      "model": "opencode-go/deepseek-v4-flash",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "📦 未分类低难度任务(DeepSeek v4 Flash)——不属于特定类别但工作量小的通用任务。Flash的低成本确保效率。适用:不属于以上任何特定类别的小型任务。如不确定难度,先看是否匹配 quick/deep 等其他类别。",
      "prompt_append": "## 📦 使用提醒\n- 这是fallback类别,优先匹配 quick/deep 等专项类别\n- 仅用于小型通用任务\n- 如发现任务有明确特征→切换到适配的category"
    },
    "unspecified-high": {
      "model": "opencode-go/deepseek-v4-pro",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "📦 未分类高难度任务(DeepSeek v4 Pro)——不属于特定类别但需要强推理的通用任务。Pro的深度思考能力确保输出质量。适用:不属于以上任何特定类别但复杂度较高的任务。如不确定难度,优先匹配 deep/ultrabrain/artistry 等专项类别。",
      "prompt_append": "## 📦 使用提醒\n- 这是fallback类别,优先匹配 deep/ultrabrain/artistry 等专项类别\n- 仅用于高复杂度通用任务\n- 如发现任务有明确特征→切换到适配的category"
    },
    "writing": {
      "model": "opencode-go/deepseek-v4-pro",
      "fallback": [
        "minimax-cn-coding-plan/MiniMax-M2.7"
      ],
      "description": "✍️ 文档与写作(DeepSeek v4 Pro语感和逻辑)——专业技术写作。产出:技术文档、设计说明、API文档、Release Notes、架构决策记录(ADR)、PRD。推荐 Skill:minimax-pdf(专业PDF)、minimax-docx(Word文档)、pptx-generator(PPT演示)、to-prd(需求文档)。Pro的语感和逻辑性确保文档清晰准确。",
      "prompt_append": "## ✍️ 写作任务Skill选择\n### 文档类型→推荐Skill\n- 技术报告/设计文档→minimax-pdf(专业排版)\n- Word文档/合同→minimax-docx\n- PPT演示→pptx-generator\n- PRD需求文档→to-prd\n- 纯Markdown→直接写(不需要额外Skill)\n### 关键规则\n- 专业文档必须用对应Skill生成(不用手写Markdown)\n- 排版美观度是验收标准之一"
    }
  }
}
Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐