Phi-3 Forest Laboratory 构建技能创造器(Skill Creator):低代码定义AI能力

你有没有想过,让一个AI智能体帮你订咖啡、整理邮件或者生成周报?听起来很酷,但一想到要写一堆复杂的代码、定义各种规则,是不是瞬间就头大了?

这正是很多开发者和业务人员面临的困境。AI智能体的潜力巨大,但构建一个真正能用的“技能”,往往需要跨越编程、API集成、逻辑设计等多重门槛。有没有一种方法,能让定义AI技能像搭积木一样简单?

今天,我们就来聊聊Phi-3 Forest Laboratory里的一个“神器”——技能创造器(Skill Creator)。它的核心目标,就是让你用最少的代码,甚至不用写代码,就能教会AI智能体一项新本领。

1. 从想法到技能:传统路径的“拦路虎”

在深入技能创造器之前,我们先看看传统方式定义一个AI技能有多麻烦。

假设你想让智能体学会“发送一封带有附件的邮件”。一个完整的技能至少包含这几个部分:

  1. 意图理解:智能体得明白用户说“帮我发个邮件”是什么意思。
  2. 参数提取:收件人、主题、正文、附件路径,这些信息从哪里来?怎么验证邮箱格式对不对?
  3. 执行逻辑:调用哪个邮件服务的API?怎么处理认证?附件怎么上传?
  4. 错误处理:网络断了怎么办?附件太大怎么办?收件人邮箱不存在怎么办?
  5. 结果反馈:发送成功了怎么告诉用户?失败了又该怎么提示?

这一套流程下来,即使对一个有经验的开发者,也得花上不少时间查阅文档、调试代码。对于没有技术背景的业务专家来说,更是无从下手。他们最清楚业务需要什么“技能”,却卡在了实现的最后一公里。

技能创造器要解决的,就是这个问题。它试图在“我有一个好想法”和“AI真的学会了这个技能”之间,架起一座低代码甚至零代码的桥梁。

2. 技能创造器初探:图形化与自然语言双引擎

那么,Phi-3 Forest Laboratory的技能创造器到底长什么样?怎么用?简单来说,它为你提供了两条定义技能的“捷径”。

2.1 图形化组装:像画流程图一样定义技能

对于有明确流程的技能,图形化界面是最直观的方式。你不需要写任何语法,只需要在画布上拖拽几个“节点”,并把它们连起来。

整个界面可能分为几个区域:

  • 技能触发器:定义什么情况下启动这个技能。比如,当用户输入中包含“发邮件”、“发送邮件给”等关键词时。
  • 参数配置面板:像填表格一样,定义技能需要的所有输入。对于“发邮件”技能,你会看到“收件人”、“主题”、“正文”、“附件”等字段。你还可以为每个字段指定类型(文本、数字、文件路径)、是否必填,以及简单的验证规则(如“必须包含@符号”)。
  • 逻辑编排画布:这是核心区域。你可以从侧边栏拖入各种预置的“动作块”。
    • 获取参数块:从用户输入或上下文中提取出“收件人”、“主题”等信息。
    • 验证块:检查邮箱格式是否合法。
    • API调用块:这里你可以选择一个预置的“发送邮件”API模板(例如基于SMTP或某个云服务商的API),然后只需要填入你的服务器地址、认证密钥等信息。
    • 条件判断块:如果发送成功,则…;如果失败,则…
    • 响应块:定义最终返回给用户的消息。

你只需要用连线把这些块按照执行顺序连接起来,一个技能的骨架就完成了。这就像在绘制一个可视化的程序流程图,但背后生成的,是实实在在的可执行代码框架。

2.2 自然语言描述:用说话的方式“教”AI

如果你觉得拖拽模块还不够简单,或者你想定义的技能逻辑比较独特,没有现成的模块,那么可以试试直接“告诉”AI。

在技能创造器的另一个界面,有一个大大的输入框。你可以用自然语言描述你想要的技能。

例如,你可以输入:

“创建一个名为‘智能周报生成器’的技能。它每周五下午自动运行,从Jira读取我名下本周状态为‘已完成’的任务,从GitLab提取我本周的代码提交记录,然后整理成一份格式清晰的Markdown周报,最后通过邮件发送给我和我的主管。”

接下来,Phi-3模型就会开始它的表演。它会尝试理解你的描述,并自动生成以下内容:

  1. 技能元信息:名称、描述、触发方式(定时任务)。
  2. 参数列表:可能会询问你Jira和GitLab的访问令牌、主管的邮箱等。
  3. 伪代码/代码框架:它会生成一个Python函数的大致结构,里面用注释标明了关键步骤:
    def generate_weekly_report(jira_token, gitlab_token, manager_email):
        # 步骤1: 使用 jira_token 调用 Jira API,查询本周已完成的任务
        # 步骤2: 使用 gitlab_token 调用 GitLab API,查询本周的提交记录
        # 步骤3: 将任务和提交记录整理为 Markdown 格式文本
        # 步骤4: 调用邮件发送函数,将周报发送给指定邮箱
        # 步骤5: 返回执行结果状态
        pass
    
  4. API接口描述草案:它可能会建议这个技能对外提供一个REST API,并生成大致的OpenAPI规范片段,说明如何调用这个技能。

当然,AI生成的只是一个高度智能化的“草稿”。它可能无法一次性完美处理所有细节(比如具体的API调用参数),但它为你完成了最耗时的结构化设计基础代码填充工作。你要做的,是在这个草稿的基础上,补充一些具体的实现细节(比如填写真实的API端点),或者调整一些逻辑。

3. 技能创造器的核心助力:Phi-3模型做了什么?

在整个过程中,Phi-3模型扮演着“智能助手”和“代码生成器”的双重角色。它的能力渗透在每一个环节:

  • 理解与拆解:当你用自然语言描述时,Phi-3首先理解你的意图,并将模糊的需求拆解成“触发条件”、“输入参数”、“执行步骤”、“输出结果”等结构化要素。
  • 逻辑推断与补全:当你只说“发邮件”,Phi-3会根据常识推断出可能需要“收件人”、“主题”、“正文”等参数。当你配置一个API调用块时,它可能会提示你“这个API通常还需要一个Authorization头”。
  • 代码生成与模板填充:这是它的看家本领。根据图形化编排的逻辑或自然语言描述的结构,Phi-3能够生成对应编程语言(如Python)的代码框架。它知道如何组织函数、定义参数、添加基本的错误处理(try-catch块),并插入对应的库引用和API调用模板。
  • 文档与规范生成:一个完整的技能还需要使用说明。Phi-3可以辅助生成技能的描述文档、API接口文档(Swagger/OpenAPI格式),甚至是如何在对话中调用这个技能的示例语句。

本质上,技能创造器是将Phi-3强大的代码生成和理解能力,封装成了一个面向特定领域(技能定义)的友好界面。 它把“从头开始写一个程序”的挑战,降低为“描述需求”和“确认细节”的对话。

4. 实战演练:三步创建一个“会议纪要生成”技能

光说不练假把式。我们来看一个更具体的例子:创建一个“会议纪要生成”技能。

第一步:自然语言描述 我们在创造器的输入框里写下:

“创建一个技能,能根据一场在线会议的录音文件(或文字转录稿),自动提取关键议题、讨论要点、决策事项和待办任务(Action Items),并生成结构清晰的会议纪要。”

第二步:Phi-3生成技能草稿 点击生成后,技能创造器会展示Phi-3为我们构建的草稿:

  1. 技能名称Meeting_Minutes_Generator
  2. 输入参数
    • audio_file (可选,音频文件)
    • transcript_text (可选,文字稿)
    • meeting_topic (可选,会议主题,用于辅助理解)
  3. 处理逻辑框架
    • 如果提供了audio_file,先调用语音转文本服务。
    • 对文本进行总结,提取“关键议题”。
    • 识别文本中关于“决定”、“同意”、“通过”等表述,提取为“决策事项”。
    • 识别文本中“需要”、“负责”、“下周前完成”等表述,提取为“待办任务”。
    • 将以上内容填充到一个预设的Markdown模板中。
  4. 输出:一份Markdown格式的会议纪要文本。

同时,它会生成一个包含了上述逻辑注释的Python函数框架,并提示我们需要接入一个语音转文本API(如OpenAI Whisper)和一个文本总结/提取的LLM API。

第三步:图形化微调与发布 我们可以在图形界面中,对Phi-3生成的草稿进行微调。比如:

  • 在“参数验证”区域,增加规则:audio_filetranscript_text不能同时为空。
  • 在逻辑画布中,将“调用文本总结LLM”这个动作块,从通用的ChatGPT调用块,替换为我们内部部署的某个专用总结模型块。
  • 最后,点击“发布”,这个技能就会被封装成一个API,或者直接注册到你的AI智能体技能库中,等待被调用。

5. 技能创造器的价值与边界

通过上面的介绍,你应该能感受到技能创造器的魅力了。它的核心价值在于:

  • 极大降低门槛:让业务专家、产品经理等非专业开发者也能参与定义AI能力,将领域知识快速转化为生产力。
  • 提升开发效率:即使是专业开发者,也能借助它快速原型化一个技能,避免重复的脚手架代码编写。
  • 促进标准化:通过统一的界面和框架创建技能,有利于团队内部技能的复用、管理和迭代。

当然,它也不是万能的。目前这类工具通常更擅长处理结构化程度高、逻辑相对标准的技能(如数据查询、信息发送、内容格式化)。对于需要复杂决策、深厚领域知识或创造性思维的技能,它生成的更多是一个“模板”或“起点”,仍然需要开发者进行大量的深度定制和优化。

6. 总结

Phi-3 Forest Laboratory的技能创造器,代表了一种令人兴奋的方向:让AI来帮助人们构建更多的AI能力。它把定义技能的权力,从代码编辑器转移到了更贴近人类思维的自然语言和可视化界面。

这不仅仅是效率工具,更是一种思维方式的转变。未来,我们构建AI应用的过程,可能会更像是在“培训”或“指导”一个数字员工,告诉它“我需要你学会做这个,做那个”,而不是一行行地为其编写指令。

如果你正在探索AI智能体的开发,或者苦于如何将业务需求快速转化为自动化能力,不妨关注一下这类低代码技能定义平台。从用一个简单的技能开始尝试,你可能会发现,让人工智能为你工作,比想象中要容易那么一点点了。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

Logo

小龙虾开发者社区是 CSDN 旗下专注 OpenClaw 生态的官方阵地,聚焦技能开发、插件实践与部署教程,为开发者提供可直接落地的方案、工具与交流平台,助力高效构建与落地 AI 应用

更多推荐