一、项目概述

MiniMax Skills 是一个面向 AI 编程工具(Claude Code、Cursor、Codex 等)的开发技能库。它为 AI 代理提供结构化的开发指导,使 AI 能够按照最佳实践完成特定领域的开发任务。

GitHub工程地址:https://github.com/MiniMax-AI/skills/tree/main/skills
截图:
github截图

二、核心架构

2.1 技能结构

每个技能遵循统一的目录规范:

skill-name/
├── SKILL.md           # 入口文件(必须),含 YAML 前置元数据
├── references/        # 参考文档,详细指南
├── scripts/           # 辅助脚本(Python/JS/C#/Bash)
├── templates/         # 输出模板
├── assets/            # 静态资源
└── design/            # 设计规范

2.2 SKILL.md 规范

---
name: skill-name           # 与目录名一致(kebab-case)
description: >             # 触发条件描述,AI 代理据此判断何时激活
license: MIT
metadata:
  version: "1.0"
  category: document-generation
---

2.3 自动激活机制

  • AI 代理解析 description 字段中的触发关键词
  • 根据用户意图自动匹配并加载对应技能
  • 技能内部通过路由表引导至正确的处理流程

三、文档相关技能分析

3.1 minimax-pdf

维度 描述
功能 PDF 创建(15种封面风格)、表单填写、文档重排
技术栈 Python (reportlab/matplotlib) + Node.js (封面渲染)
设计系统 Token-based 设计系统,颜色/字体/间距由文档类型推导
内容模型 JSON-based content blocks (h1/h2/body/table/chart/flowchart 等)
路由 CREATE → 从零生成 / FILL → 填写表单 / REFORMAT → 重新排版
脚本链 palette.py → cover.py → render_cover.js → render_body.py → merge.py

关键特点:

  • 完整的设计 Token 系统,支持 15 种文档类型(report/proposal/resume 等)
  • 丰富的内容块类型:标题、正文、列表、表格、图表、流程图、数学公式、代码块
  • 自动配色:根据文档语义上下文选择强调色
  • 覆盖封面 + 正文 + 合并的完整流水线

3.2 minimax-docx

维度 描述
功能 DOCX 创建、编辑、模板套用
技术栈 OpenXML SDK (.NET / C#)
路由 Pipeline A: CREATE / Pipeline B: FILL-EDIT / Pipeline C: FORMAT-APPLY
特色 支持 CJK 排版、XSD 验证门控、GB/T 9704-2012 公文标准

关键特点:

  • 三条流水线覆盖所有场景
  • C# 直接编写路径,适合复杂结构操作
  • CLI 命令行模式适合简单操作
  • 严格的验证管道(XSD 验证)

3.3 minimax-xlsx

维度 描述
功能 Excel 读取/创建/编辑/修复/验证
技术栈 Python (pandas + XML 直接编辑)
核心原则 零格式损失、公式优先、XML 直接编辑
路由 READ / CREATE / EDIT / FIX / VALIDATE

关键特点:

  • 绝不使用 openpyxl 往返(会损坏 VBA/数据透视表)
  • XML 解包→编辑→重打包的安全编辑模式
  • 财务色彩标准(蓝色硬编码、黑色公式、绿色跨表引用)
  • 专用工具脚本(添加列、插入行、移位行等)

3.4 pptx-generator

维度 描述
功能 PPT 创建/编辑/读取
技术栈 PptxGenJS (创建) + XML 工作流 (编辑) + markitdown (读取)
幻灯片类型 封面页、目录页、内容页、分节页、总结页

3.5 minimax-multimodal-toolkit

维度 描述
功能 语音/音乐/视频/图片生成
API 提供方 MiniMax 多模态 API
场景 TTS、声音克隆、音乐生成、文生视频、图生视频

四、技能系统的优势

  1. 结构化工作流 — 每个技能都有明确的路由表和步骤指南
  2. 自动激活 — 基于 description 字段的关键词触发
  3. 参考文档体系 — references/ 提供的详细指南确保质量
  4. 脚本辅助 — scripts/ 目录的工具脚本处理重复性任务
  5. 设计系统 — 内建的设计 Token 确保输出视觉一致性

五、可改进的方向

  1. PDF 引擎依赖 — 当前依赖 reportlab + matplotlib,缺乏专业 PDF 引擎支持
  2. 文档操作底层 — 缺少原生 PDF 操作能力(加密、签名、压缩、OCR 等)
  3. 格式转换 — 无内建的跨格式转换能力
  4. 安全特性 — 缺少文档级安全控制(权限、水印、密码保护)
  5. 性能 — 脚本链式调用效率可优化
Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐