填槽:这个概念大家都比较熟悉,那么在有了能够理解人类语言的大模型下,填槽的实用价值进一步扩大,因为我们现在通过大模型可以把不确定的、非结构化的数据解析成结构化数据,下面将通过一个样例讲解


一、创建流程

1.1 新建项目

创建智能体
在这里插入图片描述

1.2 创建配置

在这里插入图片描述

1.3 配置提示词

这里非常重要,需要明确填充的关键字段、数据格式等
在这里插入图片描述

提示词设计技巧

  • 字段设计层级化:将关联字段分组(如将用户信息分为基础属性/家庭关系)
  • 明确数据类型:标注字段需要字符串/数组/布尔值等类型
  • 添加示例:在提示词中包含1-2个完整解析样例
  • 约束输出格式:使用JSON Schema描述数据结构

二、效果展示

2.1 对话内容

顾客:你好,我最近想换个手机,不过对苹果的手机不太了解,一直用的是华为。我听朋友说 iPhone 挺好的,但我不知道适不适合我。
店员:您好,欢迎光临!没关系,换手机确实是大事,很多人换品牌都会有顾虑。那您可以说说平时对手机的需求,或者有哪些功能是您特别看重的?我可以帮您推荐适合的型号。
顾客:嗯,我平时用手机主要是拍照、工作、看视频和社交。之前用的华为拍照特别好,屏幕也挺舒服的,续航也挺长。我担心苹果手机在这些方面会不如华为,尤其是电池和拍照,毕竟我每天都要用很久。
店员:您提到的这些功能都是很重要的。其实,iPhone 的拍照和续航这两点都有非常多的改进。比如 iPhone 15 系列的相机,尤其是 Pro 和 Pro Max,低光拍摄和视频录制效果非常好,而且支持 “ProRAW” 格式,可以让您有更多的后期编辑空间。而且我们还加入了智能 HDR,可以让照片在不同光线下的表现更自然。
顾客:可是华为的照片总是感觉特别鲜艳,苹果会不会太 “真实” 了,照片看起来不够亮丽?我喜欢那种颜色饱和一些的感觉。
店员:您提到的颜色问题,确实很多人刚从其他品牌转到 iPhone 会有这样的感觉。苹果的相机在色彩还原方面是更接近真实场景的,特别是在自然光线下表现得很优秀。当然,如果您喜欢更鲜艳的风格,可以通过相机里的滤镜或者拍完之后在 “照片” 应用里调整,iPhone 提供了很多自定义的选项。

2.3 大模型输出结果

大模型会把符合要求的数据填充到对应的字段,这个工作节点就可以提供给后续的节点使用

{
“顾客的姓名”: “”,
“顾客的性别”: “”,
“顾客的年龄”: “”,
“顾客的年龄段”: “”,
“顾客的长期居住地”: “”,
“顾客的户口所在地”: “”,
“顾客的手机号码”: “”,
“顾客的手机号码归属地”: “”,
“顾客的身份证号码”: “”,
“顾客是否已成年”: “”,
“顾客是否已婚”: “”,
“顾客是否有小孩”: “”,
“顾客的小孩数量”: “”,
“顾客的小孩 1 的性别”: “”,
“顾客的小孩 1 的年龄”: “”,
“顾客的小孩 2 的性别”: “”,
“顾客的小孩 2 的年龄”: “”,
“顾客的小孩 3 的性别”: “”,
“顾客的小孩 3 的年龄”: “”,
“顾客是否与父母住在一起”: “”,
“顾客是否与父母住在同一个城市”: “”,
“顾客的父亲是否健在”: “”,
“顾客父亲的年龄”: “”,
“顾客的母亲是否健在”: “”,
“顾客母亲的年龄”: “”,
“顾客是否有兄弟姐妹”: “”,
“顾客的兄弟姐妹是否住在同一个城市”: “”,
“顾客本次来访的目的”: “想换手机,咨询苹果手机是否适合自己”,
“顾客本次咨询过的产品都有哪些”: “iPhone 手机(具体涉及 iPhone 15 系列 Pro、iPhone 15 系列 Pro Max)”,
“顾客本次咨询过的服务都有哪些”: “”,
“顾客本次表达的担忧都有哪些”: “担心苹果手机在拍照(颜色不够鲜艳,不符合自身偏好的饱和风格)、电池续航方面不如华为手机,尤其是每天长时间使用的场景下”,
“顾客本次是否产生了消费行为”: “否”,
“顾客本次的消费金额”: “”,
“顾客本次的支付方式”: “”,
“顾客本次决定消费的关键因素是什么”: “”,
“顾客本次是否反复犹豫价格”: “”,
“顾客本次最阻碍消费的唯一核心担忧要素是什么”: “苹果手机的拍照颜色不够鲜艳(自身偏好颜色饱和风格,担心苹果拍照过于真实)及续航能力不足”,
“顾客本次是否比较了其他同类产品或服务”: “是(比较了华为手机)”,
“顾客本次是如何描述其他同类产品的优势”: “华为手机拍照特别好(颜色鲜艳)、屏幕舒服、续航能力强”,
“顾客是否已经购买了其他同类产品”: “是(一直使用华为手机)”,
“顾客本次是否在犹豫选择我们的产品”: “是(不确定苹果手机是否适合自己)”,
“顾客本次比较同类产品时,是被我们产品的哪些特性吸引”: “iPhone 15 系列 Pro/Pro Max 的低光拍摄效果好、视频录制效果好;支持 “ProRAW” 格式,可提供更多后期编辑空间;智能 HDR 功能,使照片在不同光线下表现更自然;可通过相机滤镜或 “照片” 应用自定义调整照片颜色,满足鲜艳风格需求;续航能力有改进”,
“顾客本次是否在同类产品的比较中选择了我们的产品”: “否”,
“顾客本次产生的投诉都有哪些”: “”,
“顾客本次提出的质疑都有哪些”: “”,
“顾客本次提出的不满都有哪些”: “”,
“顾客本次来访的需求是否都被解决”: “未明确提及”,
“顾客本次来访是否约定的未来其他事项”: “”
}


三、结构化转换核心技术解析

3.1 字段设计原则

有效的结构化转换始于合理的字段设计:

  • 正交性原则:确保字段间无重叠(如"担忧问题"与"决策因素"分离)
  • 颗粒度控制:平衡细节与实用性(如"小孩数量"比单独记录每个小孩更实用)
  • 动态字段支持:使用${variable}语法处理不确定数量的数据(如小孩信息)
  • 业务场景映射:字段需直接服务于业务目标(如销售场景关注"决策因素")
3.2 提示词工程技巧

提升解析准确率的关键提示词技巧:

技巧 示例 作用
否定约束 “不做推测,仅提取明确信息” 防止模型过度解读
格式指令 “使用JSON格式,字符串最长20字符” 控制输出规范
关键词引导 “特别注意’担心’、'不如’等关键词” 提升关键信息捕获率
容错声明 “若信息缺失则留空” 避免模型虚构数据
3.3 后处理策略

原始模型输出需二次处理确保数据质量:

def postprocess(output):
    # 清理无效字段
    if output["顾客的姓名"] == "unknown": 
        del output["顾客的姓名"]
    
    # 转换数据类型
    output["顾客是否已婚"] = bool(output["顾客是否已婚"])
    
    # 合并关联字段
    output["家庭成员"] = {
        "父母": output.get("顾客是否与父母住在一起"),
        "子女": parse_children(output)
    }
    return output

常见问题解决方案

  • 信息冲突:设置优先级规则(如最后提及的信息优先)
  • 模糊表述:添加置信度评分字段(如"颜色问题": {“value”: “不够鲜艳”, “confidence”: 0.8})
  • 方言处理:在预处理层添加本地化术语映射表

四、核心应用场景解析

4.1 客户服务优化

痛点解决

  • 自动识别客户投诉焦点(如"电池续航不足")
  • 提取服务关键词生成工单标签(技术咨询/产品比较)
4.2 销售洞察分析

数据价值点

  • 实时捕捉客户决策因素(价格敏感度/功能偏好)
  • 竞品比较分析(华为 vs 苹果提及频次对比)
4.3 合规风控审计

关键检测项

  • 敏感词监控(“欺诈”、"退款"等风险词)
  • 服务规范检测(是否完整告知退换货政策)
4.4 产品改进反馈

创新应用

  • 功能需求挖掘(用户自发提出的改进建议)
  • 痛点聚类分析(电池/拍照/系统卡顿等分类统计)

五、总结与最佳实践

通过本工作流实现高效结构化转换的核心在于三层设计

  1. 数据层:精心设计字段结构,确保业务价值
  2. 模型层:通过约束性提示词控制输出质量
  3. 工程层:添加数据清洗和格式化后处理

最佳实践建议:

  • 场景驱动设计:根据业务目标反向设计字段(如销售场景聚焦决策因素)
  • 动态字段扩展:预留10%自定义字段应对新兴需求
  • 置信度机制:为关键字段添加可信度评分(<0.7需人工复核)
  • 多维度验证:结合业务指标评估解析效果(如销售转化率相关性)

关注【Python游侠】,在公众号后台回复"对话内容解析",获取提示词文件!

Logo

更多推荐