CANNBot Skills

【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 【免费下载链接】cannbot-skills 项目地址: https://gitcode.com/cann/cannbot-skills

📢 项目概述

项目定位

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块,目前已覆盖 Ascend C / PyPTO / TileLang 算子开发流程和 NPU 模型推理端到端优化。

目标用户

  • CANN 社区开发者
  • 昇腾 NPU 平台 AI 应用开发者
  • Ascend C / PyPTO / TileLang 算子开发者
  • 使用昇腾 NPU 进行模型推理优化的开发者
  • 希望贡献 Skills / Agents 的社区贡献者

🔥 最新动态

  • 2026-05-07 — 新增kernel直调工程接入ACLNN/GEIR接口skill(ascendc-direct-invoke-to-registry-invoke),支持kernel直调形式改造成自定义算子工程。
  • 2026-05-06 — 新增算子注册调用的开发工作流(ops-registry-invoke),支持 ACLNN 和 GEIR 两种接入方式,覆盖需求分析到代码检视全流程。
  • 2026-04-30 — 【代码仓库更名】https://gitcode.com/cann/skills 更名为 https://gitcode.com/cann/cannbot-skills ,原名称和路径可继续访问,建议使用新名称和路径。
  • 2026-04-29 — 新增自定义算子注册调用的脚手架工程(ascendc-registry-invoke-template),支持通过 ACLNN 和 GEIR 接入。
  • 2026-04-28 — 新增支持 TRAE 安装。
  • 2026-04-25 — 增强 ascendc-precision-debug 和 ascendc-runtime-debug 的调试能力。
  • 2026-04-24 — 新增 Ascend C 性能调优知识货架。
  • 2026-04-23 — 在 README.md 新增 Skills 的使用样例。
  • 2026-04-21 — 修复测试框架并解决识别到的多项校验问题。
  • 2026-04-20 — 新增 regbase 配置最佳实践,修复环境检查设备计数 bug,统一算子目录命名(ops → operators)。
  • 2026-04-18 — 修复 ops-profiling 技能名称不一致的问题。

详细变更记录,详见 CHANGELOG.md 文件。

⚡️快速开始

方式一:脚本安装

git clone https://gitcode.com/cann/cannbot-skills.git
cd cannbot-skills
场景 命令 文档
AscendC Kernel<<<>>>直调 cd plugins-official/ops-direct-invoke && bash init.sh project <opencode\|claude> 更多安装方式和使用参考 quickstart
AscendC 算子注册调用 cd plugins-official/ops-registry-invoke && bash init.sh project <opencode\|claude> 更多安装方式和使用参考 quickstart
PyPTO 算子 cd plugins-official/pypto-op-orchestrator && bash init.sh project <opencode\|claude> 更多安装方式和使用参考 quickstart
NPU 推理优化 cd model/teams/infer-model-optimize-team && bash init.sh project <opencode\|claude> 更多安装方式和使用参考 quickstart

方式二:Plugin 安装

仅支持 Claude Code,且仅部分场景提供 Plugin。

Claude Code
  1. 注册 marketplace(首次):/plugin marketplace add https://gitcode.com/cann/cannbot-skills.git
  2. 按场景安装对应插件:
场景 命令
AscendC Kernel<<<>>>直调 /plugin install ops-direct-invoke@cannbot
AscendC 算子注册调用 暂不支持
PyPTO 算子 /plugin install pypto-op-orchestrator@cannbot
NPU 推理优化 暂不支持
  1. 激活:/reload-plugins,然后新开会话 或 /clear

方式三:手动安装

克隆仓库后,按需将 skills/ 或 agents/ 目录下所需的模块软链接或复制到对应工具的配置路径下。目录结构需参考各 Agent 框架的约定,例如 Claude Code 的项目级结构为 {your-project-path}/.claude/skills/{your-project-path}/.claude/agents/

git clone https://gitcode.com/cann/cannbot-skills.git
# 示例:将 ascendc-npu-arch skill 拷贝到你的 Claude Code 项目
cp -r cannbot-skills/ops/ascendc-npu-arch {your-project-path}/.claude/skills/

🔍 项目架构设计

整体架构

skills/
├── ops/                    # 算子 Skills(正式版:Ascend C + PyPTO)
├── ops-lab/               # 算子 Skills(实验 / 非正式版)
├── model/                 # 模型推理优化
│   ├── skills/            # 推理优化技能模块
│   ├── agents/            # 子 Agent(analyzer / implementer / reviewer)
│   └── teams/             # 多 Agent 协同
│       └── infer-model-optimize-team/  # NPU 推理端到端优化流程
│           ├── model-infer-optimize/   # 工作流入口 Skill
│           └── hooks/                  # Hook 约束脚本
└── tests/                 # 自动化测试框架

逻辑架构视图

项目遵循三层架构:Teams 编排 Agents,Agents 绑定 Skills。以下视图展示各层组件及其关联关系。

Ascend C 算子开发
╔══════════════════════════════════════════════════════════════════════════════╗
║                              TEAMS(应用编排层)                              ║
╠══════════════════════════════════════════════════════════════════════════════╣
║                                                                              ║
║  ┌─────────────────────────────┐        ┌─────────────────────────────┐      ║
║  │  ops-direct-invoke          │        │  ops-registry-invoke       │      ║
║  │  Kernel 直调开发流程         │        │  算子注册调用开发流程           │      ║
║  └──────┬──────┬──────┬────────┘        └──────┬──────┬──────┬────────┘      ║
║         │      │      │                        │      │      │               ║
╚═════════╪══════╪══════╪════════════════════════╪══════╪══════╪═══════════════╝
          │      │      │                        │      │      │
          ▼      ▼      ▼                        ▼      ▼      ▼
╔══════════════════════════════════════════════════════════════════════════════╗
║                             AGENTS(角色执行层)                              ║
╠══════════════════════════════════════════════════════════════════════════════╣
║                                                                              ║
║  ┌──────────────┐  ┌──────────────┐  ┌──────────────┐  ┌──────────────┐      ║
║  │  architect   │  │  developer  │  │  reviewer    │  │  tester     │      ║
║  │   方案设计    │  │   代码开发   │  │   代码检视    │  │   代码测试    │      ║
║  └──────────────┘  └──────────────┘  └──────────────┘  └──────────────┘      ║
║                                                                              ║
╚══════════════════════════════════════════════════════════════════════════════╝
             │ │ │ │       │ │ │ │       │ │ │ │       │ │ │ │
             ▼ ▼ ▼ ▼       ▼ ▼ ▼ ▼       ▼ ▼ ▼ ▼       ▼ ▼ ▼ ▼
╔═══════════════════════════════════════════════════════════════════════════════╗
║                             SKILLS(知识能力层)                               ║
╠═══════════════════════════════════════════════════════════════════════════════╣
║                                                                              ║
║  ┌─ 知识库类 ──────────────────────────────────────────────────────────────┐  ║
║  │  npu-arch             NPU 架构知识与芯片映射                             │  ║
║  │  tiling-design        Tiling 设计方法论                                 │  ║
║  │  api-best-practices   API 使用最佳实践                                   │  ║
║  │  ops-precision-standard 算子精度标准                                     │  ║
║  └─────────────────────────────────────────────────────────────────────────┘ ║
║                                                                               ║
║  ┌─ 工程模板类 ────────────────────────────────────────────────────────────┐  ║
║  │  registry-invoke-to-direct-invoke  注册算子直调改造模板                   │   ║
║  │  direct-invoke-template            Kernel直调工程模板                     │   ║
║  └────────────────────────────────────────────────────────────────────────┘  ║
║                                                                               ║
║  ┌─ 调试与测试类 ──────────────────────────────────────────────────────────┐  ║
║  │  precision-debug      精度调试与症状速查                                 │   ║
║  │  runtime-debug        运行时错误码解析                                   │  ║
║  │  ops-profiling        算子性能采集分析                                   │   ║
║  └────────────────────────────────────────────────────────────────────────┘  ║ 
║                                                                               ║
║  ┌─ 测试开发类 ────────────────────────────────────────────────────────────┐  ║
║  │  st-design            ST 测试用例设计                                   │   ║
║  │  ut-develop           UT 开发与覆盖率增强                               │   ║
║  │  code-review          代码检视规则                                      │  ║
║  └────────────────────────────────────────────────────────────────────────┘   ║
║                                                                              ║
║  ┌─ 工具辅助类 ────────────────────────────────────────────────────────────┐   ║
║  │  env-check            NPU 设备查询与环境验证                             │  ║
║  │  task-focus           长任务聚焦防迷失                                   │   ║
║  └─────────────────────────────────────────────────────────────────────────┘  ║
║                                                                              ║
╚═══════════════════════════════════════════════════════════════════════════════╝
PyPTO 算子开发
╔══════════════════════════════════════════════════════════════════════════════╗
║                              TEAMS(应用编排层)                             ║
╠══════════════════════════════════════════════════════════════════════════════╣
║                                                                              ║
║                    ┌─────────────────────────────────┐                       ║
║                    │      pypto-op-orchestrator      │                       ║
║                    │      PyPTO 算子开发流程         │                       ║
║                    └──────┬──────────┬──────────┬────┘                       ║
║                           │          │          │                            ║
╚═══════════════════════════╪══════════╪══════════╪════════════════════════════╝
                            │          │          │
                            ▼          ▼          ▼
╔══════════════════════════════════════════════════════════════════════════════╗
║                             AGENTS(角色执行层)                             ║
╠══════════════════════════════════════════════════════════════════════════════╣
║                                                                              ║
║             ┌──────────────┐  ┌──────────────┐  ┌──────────────┐             ║
║             │  analyst     │  │  developer   │  │  perf-tuner  │             ║
║             │  需求与设计  │  │  实现与精度  │  │  性能调优    │             ║
║             └──────────────┘  └──────────────┘  └──────────────┘             ║
║                                                                              ║
╚══════════════════════════════════════════════════════════════════════════════╝
                     │ │ │           │ │ │           │ │ │
                     ▼ ▼ ▼           ▼ ▼ ▼           ▼ ▼ ▼
╔═══════════════════════════════════════════════════════════════════════════════╗
║                             SKILLS(知识能力层)                              ║
╠═══════════════════════════════════════════════════════════════════════════════╣
║                                                                               ║
║  ┌─ 需求与设计 ────────────────────────────────────────────────────────────┐  ║
║  │  intent-understand    需求意图理解与规格生成                            │  ║
║  │  api-explore          API 可行性探索与分析                              │  ║
║  │  op-design            算子方案设计生成                                  │  ║
║  └─────────────────────────────────────────────────────────────────────────┘  ║
║                                                                               ║
║  ┌─ 实现与验证 ────────────────────────────────────────────────────────────┐  ║
║  │  golden-generate      Golden 参考实现生成                               │  ║
║  │  op-develop           算子代码实现与调试                                │  ║
║  │  precision-debug      精度问题诊断                                      │  ║
║  │  precision-compare    精度对比分析                                      │  ║
║  └─────────────────────────────────────────────────────────────────────────┘  ║
║                                                                               ║
║  ┌─ 性能调优 ──────────────────────────────────────────────────────────────┐  ║
║  │  op-perf-tune         算子性能分析与调优                                │  ║
║  └─────────────────────────────────────────────────────────────────────────┘  ║
║                                                                               ║
╚═══════════════════════════════════════════════════════════════════════════════╝

🚀 Skills 技能库

Ascend C 算子开发

Skill 功能 使用样例
ascendc-api-best-practices API 使用最佳实践、参数限制
ascendc-npu-arch NPU 架构知识、芯片型号映射
ascendc-docs-search API 文档索引 + 在线搜索
ascendc-env-check NPU 设备查询、CANN 环境验证
ascendc-tiling-design Tiling 和 Kernel 设计方法论,按算子类别分类
ascendc-precision-debug 精度调试,症状-原因速查、常见陷阱
ascendc-runtime-debug 运行时错误调试,错误码解析、Kernel 挂起排查
ascendc-ut-develop UT 单元测试用例开发与覆盖率增强
ascendc-st-design aclnn 接口测试用例设计、L0 / L1 测试用例生成
ascendc-code-review 代码检视方法论、5 大类别规范
ascendc-task-focus 任务聚焦,解决长任务“迷失在中间”的问题
ascendc-whitebox-design 白盒测试用例设计与生成
ascendc-registry-invoke-template 完整自定义算子工程模板,提供标准工程结构、代码模板、UT/ST 样例和多芯片架构参考
ascendc-registry-invoke-to-direct-invoke 注册调用算子转 <<<>>> kernel 直调 查看
ascendc-direct-invoke-to-registry-invoke <<<>>> kernel 直调转注册调用算子 查看
ascendc-direct-invoke-template Kernel 直调工程模板,提供验证过的样例工程和修改指南
ops-profiling NPU 性能采集与分析,CSV 指标解读、瓶颈定位、优化建议
ops-precision-standard 算子精度标准,按 dtype 分类提供 atol/rtol 精度比对标准
ascendc-docs-gen 算子文档写作参考,支持需求分析、详细设计等多个标准模版
cann-simulator NPU 仿真器技能。提供 CANN Simulator 的使用指导,包括精度仿真、性能仿真、流水线分析。

PyPTO 算子开发

Skill 功能
pypto-op-design 算子方案设计生成
pypto-op-develop 算子代码实现与测试
pypto-golden-generate Golden 参考实现生成
pypto-intent-understand 需求意图理解与规格生成
pypto-api-explore API 可行性探索与分析
pypto-precision-debug 精度问题代码层排查
pypto-precision-compare 精度中间结果对比分析
pypto-op-perf-tune 算子性能分析与自动调优

NPU 模型推理优化

Skill 功能
model-infer-optimize 端到端优化编排入口,阶段 0-5 全流程
model-infer-migrator 框架适配与部署基线建立
model-infer-parallel-analysis 并行策略分析(TP/EP/DP)
model-infer-parallel-impl 并行切分实施
model-infer-kvcache KVCache 优化 + FA 替换
model-infer-fusion torch_npu 融合算子分析与替换
model-infer-graph-mode torch.compile 图模式适配
model-infer-precision-debug NPU 推理精度诊断
model-infer-runtime-debug NPU 运行时错误诊断
model-infer-multi-stream 多流并行优化
model-infer-prefetch 权重预取适配
model-infer-superkernel SuperKernel 适配

🚀 Agents 智能代理

Ascend C 算子开发

Agent 功能
ascendc-ops-architect 算子架构师,支持需求分析和方案设计两种场景
ascendc-ops-developer 算子开发者,支持代码实现、编译测试和精度验证
ascendc-ops-tester 算子测试者,支持ST/UT用例生成与执行
ascendc-ops-reviewer 代码检视专家,支持快速检视和全功能检视两种模式
ascendc-kernel-architect Kernel直调架构师,支持需求分析、API验证、方案设计
ascendc-kernel-developer Kernel直调开发者,支持代码实现、编译测试、性能采集、文档编写
ascendc-kernel-reviewer Kernel直调审查者,支持独立构建验证、7维度评分、精度验证

PyPTO 算子开发

Agent 功能
pypto-op-analyst 需求分析与方案设计
pypto-op-developer 算子代码实现与精度调试
pypto-op-perf-tuner 性能分析与调优

NPU 模型推理优化

Agent 功能
model-infer-analyzer 模型分析、方案设计、并行策略推荐
model-infer-implementer 代码改造、调试修复
model-infer-reviewer 精度验证、性能对比

🛠️ 测试框架

自动化测试验证 Skills 和 Agents 的正确性,确保技能模块和智能代理的行为符合预期。 详见 tests/README.md

💬相关信息

💖 免责声明

感谢您关注 CANNBot Skills 项目,我们希望这些技能和知识能帮助您更好地进行 CANN 开发^_^

在使用之前,请您了解:

  1. 关于功能满足度:由于技术快速更新迭代,部分内容可能无法完全适用于所有场景。 本开源社区的功能和文档正在持续更新和完善、丰富场景中,如果想提出需求、发现问题、贡献想法,非常欢迎提 Issue、讨论来告诉我们,共创共建。

  2. 关于自动生成:自动代码生成工具所产出的内容,其完整性、准确性、合规性,受模型类型、模型版本、Skills 能力、语料质量、输入指令、运行环境等多种因素影响,无法保证完全精准、尽善尽美。所有生成代码作为辅助研发使用,请开发者务必进行测试验证、安全审查后再投入使用。

🤝 联系我们

需求、问题、咨询、任务、文档

通过GitCode【Issues】提交。

社区互动

通过GitCode【讨论】参与交流。

联系我们

【微信交流群】

【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 【免费下载链接】cannbot-skills 项目地址: https://gitcode.com/cann/cannbot-skills

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐