Task03 团队实战:RACE 提示词框架在 Python 数据分析中的应用
一、 任务背景
在本次 Task03 的智能工具实践中,我负责探索和总结 RACE 框架 (Role-Action-Context-Expectation)。为了让理论与实践相结合,我设定了一个具体的任务目标:基于数据进行编程(Python),通过构建一个典型的电商销售数据分析场景,来测试 RACE 框架在引导大语言模型生成高质量代码时的实际效果。
二、 RACE 框架解析
RACE 框架通过四个核心要素,为 AI 提供了极强的指令约束,有效减少了模型的“幻觉”输出。它特别适用于代码开发、自动化脚本和分步骤数据分析等需要精确执行的场景。
• Role (角色):为 AI 设定一个具体的专家身份或视角。
• Action (行动):明确告诉 AI 需要执行的具体任务或操作指令。
• Context (上下文):提供必要的背景信息、数据概况或当前的运行环境限制。
• Expectation (期望):严格定义输出的标准,包括结果格式、内容细节和质量要求。
三、 构建结构化提示词
针对上述“基于数据进行编程”的目标,我构建了如下的结构化提示词:
1. Role (角色)
你是一位资深的数据科学与Python编程专家,精通Pandas、NumPy以及常用的机器学习库(如Scikit-learn)。
2. Action (行动)
请根据用户的需求,编写一个高效、规范且带有详细注释的Python脚本。该脚本需要能够完成指定的数据清洗、统计分析及基础可视化任务。
3. Context (上下文)
1. 数据源:用户提供一个名为 sales_data.csv 的文件。
2. 数据结构:文件包含以下列:OrderID (订单ID), CustomerName (客户名), ProductCategory (产品类别), Quantity (数量), UnitPrice (单价), OrderDate (订单日期)。
3. 环境限制:假设运行环境已安装 Pandas, NumPy, Matplotlib 库。
4. Expectation (期望)
1. 数据处理:读取CSV文件,处理缺失值(若存在则填充0),并将OrderDate转换为日期时间格式。
2. 统计分析:计算每个ProductCategory的总销售额(Total Sales)和销售数量(Total Quantity)。
3. 可视化输出:生成一个柱状图,展示各类别产品的销售额对比。
4. 代码质量:代码必须包含必要的注释,且变量命名需符合PEP8规范。
四、 模型选择与测试分析
• 选用模型:DeepSeek-Coder-V2 / GPT-4o
• 选择理由:这两个模型在代码生成方面具有极强的逻辑理解能力和准确性,能够很好地处理带有特定上下文要求的编程任务。
生成结果分析:
通过 RACE 框架的引导,大语言模型成功输出了完整、可立即运行的Python脚本。具体表现为:
1. 代码准确性:模型生成的代码语法正确,成功包含了数据读取(pd.read_csv)、缺失值处理(.fillna(0))以及日期转换(pd.to_datetime)的核心逻辑。
2. 逻辑完整性:代码准确计算了各品类的销售额(通过 Quantity * UnitPrice 分组求和),并正确调用了 Matplotlib 库绘制了柱状图,完整覆盖了任务需求。
3. 易读性:代码包含了清晰的注释,变量命名直观,符合 PEP8 规范,易于理解和后续复用。
五、 总结与适用场景
经过本次实践验证,RACE 框架展现出了显著的优越性。它非常适合需要精确输出和复杂上下文的任务。在实际应用中,RACE 框架可以广泛应用于:
1. 代码开发与调试:当需要让 AI 辅助编写特定功能的脚本,且对输入输出有明确的规范和格式要求时。
2. 自动化脚本生成:为特定的数据文件或业务逻辑快速生成标准化的处理流程。
3. 复杂数据分析任务:当任务涉及多个步骤(如清洗 -> 分析 -> 可视化)且需要严格控制上下文环境时。
更多推荐



所有评论(0)