通过AI大模型对IT系统蒸馏:构建独立Skills技能包的实操方案
本文整理自 B 站「通过AI大模型对IT系统蒸馏-构建提供业务能力的Skills技能包」,通过音视频总结整理工具 Ai好记 进行视频转图文整理,以下为精炼整理后的内容。
为什么要蒸馏
蒸馏的核心目的,是把一个业务系统变成没有前端页面的「能力提供中心」。
说白了,就是把整个业务系统的底层能力通过 API 接口暴露给 AI 大模型,让它能用自然语言直接操作业务系统。
关键原则是:不直接把数据库暴露给 AI。而是把业务系统通过 API 接口能力包装好再交给 AI 调用。AI 只跟 API 打交道,碰不到底层的数据库和数据表。
蒸馏的输入
蒸馏不是凭空搞出来的,需要喂原始资料给 AI。可用的输入包括:
- 原始需求文档
- 架构设计文档
- 源代码
- 接口文档
- 本体模型文档
把这些资料投喂给 AI,AI 基于这些文档进行蒸馏,最终会生成一套完整的 Markdown 文档,统一放到 distilled/ 目录下。
蒸馏产出的文档结构
蒸馏完成后会得到以下内容:
- API 接口蒸馏:把业务系统的接口抽象成 AI 可调用的能力
- 领域对象蒸馏:明确核心业务对象和关系
- 参考数据结构和数据模型:提供数据结构定义
- 枚举值表:列举业务中的常量与枚举
- 原始需求蒸馏:保留原始业务需求上下文
- 整体业务系统蒸馏:系统性的全景描述
蒸馏的六条原则
1. 语义层和明细层分离
整套蒸馏文档支持渐进式推理和惰性加载——核心语义层常驻内存,明细层按需调用。不用一次性加载全部。
2. 粗颗粒度 API 接口
不是把每个数据库表都发布成一个 CRUD 接口,而是以领域对象 + 业务用例为颗粒度,提供粗粒度的 API。比如「创建合同」而不是「INSERT INTO contract」。
3. 规则标注
每条规则都必须标注:谁来定这条规则、谁来保证它被执行。
4. 事实优先级明确
蒸馏出来的信息要有明确的优先级排序,不把次要信息和核心规则混在一起。
5. 权限分解
不同能力的访问权限要明确区分,AI 不能越权操作。
6. 可验证
每个蒸馏结果都要能验证——人工或自动化检查都可以,但必须可验证。
蒸馏流程:S0 到 S6
整个过程分七步:
- S0:已有资料盘点
- S1:抽象核心对象关系
- S2:立项规则
- S3:抽取核心 API 接口列表
- S4:形成关联明细数据
- S5:引用和编排
- S6:迭代和验证
三层产出结构
最终形成的蒸馏产出分为三个层级:
语义层(L1) ← 常驻内存,包含核心元数据和业务语义
│
API 能力层(L2) ← 提供粗粒度业务 API 接口
│
明细层(L3) ← 按需加载,包含详细的参考数据
- L1 语义层:常驻内存,快速响应
- L2 API 能力层:封装好的业务 API
- L3 明细层:按需加工使用
蒸馏后的使用流程
用户通过自然语言发出请求(比如「查一下合同编号为 XXXX 的详细信息」),整个流程是这样的:
- 自然语言请求对接大模型
- 大模型加载蒸馏技能包的 L1 语义层
- 意图识别完成,确定需要调用哪些底层 API 接口
- 调用 API 能力层,跨多个接口组装数据
- 访问数据库查询具体数据
- 结果整合返回给用户
整个过程的好处两句话就能说清楚:
- 数据库隔离:AI 不直接访问数据库,安全风险大幅降低
- 响应快:L1 常驻内存,L3 按需加载,避免了所有数据一次性加载的损耗
实测效果演示
基于这套蒸馏方案,作者做了一个合同管理的演示:
- 「帮我查询最新的 5 条合同信息」→ 立刻列出
- 「帮我查某个编号的合同详细信息和基本信息」→ 完整展现
- 「帮我统计已签订合同的总金额」→ 自动统计
- 「帮我把上图转变成多列的柱状图」→ 图表自动生成
- 「合同管理的端到端流程是怎样的」→ 完整流程回应
AI 对自然语言的语义理解很准确。遇到复杂需求,它会自动拆解为多个步骤,每一步调用不同的 API,在能力层内部做好接口组装。
小结
蒸馏技能包的核心价值在于:让大模型以标准化、可控的方式对接已有的 IT 系统。不是推翻重来,而是在现有系统之上加一层 AI 可理解的能力层。企业已有的业务逻辑、权限体系、数据模型不需要变,只需要蒸馏成标准化的技能包。
如果你手头有现成的业务系统,可以试试这套蒸馏流程——把原始需求文档、接口文档喂给 AI,生成蒸馏文档,然后打包成技能包,用自然语言测试一下效果。
FAQ
蒸馏和传统 API 网关有什么区别?
API 网关管的是路由和流量,蒸馏管的是 AI 的理解层面——告诉大模型每个 API 是做什么的、怎么调用、参数怎么传、返回怎么解析。
蒸馏后原来的 UI 还有用吗?
有用。蒸馏不代表去掉前端,而是多了一个 AI 入口。原来该用 UI 的继续用,AI 适合的场景走自然语言,两者并行。
这套方案适合多大体量的系统?
理论上不限规模。但从实操角度,建议先从一个业务域(比如合同管理、订单管理)开始试点,验证后再扩展。
以上内容由 Ai好记 转录整理。Ai好记 是一款音视频转图文笔记的AI知识库工具,支持解析B站、抖音、小宇宙等平台链接及本地/网盘音视频文件,转写后自动生成精华速览、思维导图和结构化笔记等内容,帮助你把几小时的视频内容变成可搜索、可复习的图文笔记。
更多推荐




所有评论(0)