Task03 团队实战：RACE 提示词框架在 Python 数据分析中的应用

善良的小组

328人浏览 · 2026-05-16 16:55:26

善良的小组 · 2026-05-16 16:55:26 发布

一、任务背景

在本次 Task03 的智能工具实践中，我负责探索和总结 RACE 框架 (Role-Action-Context-Expectation)。为了让理论与实践相结合，我设定了一个具体的任务目标：基于数据进行编程（Python），通过构建一个典型的电商销售数据分析场景，来测试 RACE 框架在引导大语言模型生成高质量代码时的实际效果。

二、 RACE 框架解析

RACE 框架通过四个核心要素，为 AI 提供了极强的指令约束，有效减少了模型的“幻觉”输出。它特别适用于代码开发、自动化脚本和分步骤数据分析等需要精确执行的场景。

• Role (角色)：为 AI 设定一个具体的专家身份或视角。

• Action (行动)：明确告诉 AI 需要执行的具体任务或操作指令。

• Context (上下文)：提供必要的背景信息、数据概况或当前的运行环境限制。

• Expectation (期望)：严格定义输出的标准，包括结果格式、内容细节和质量要求。

三、构建结构化提示词

针对上述“基于数据进行编程”的目标，我构建了如下的结构化提示词：

1. Role (角色)

你是一位资深的数据科学与Python编程专家，精通Pandas、NumPy以及常用的机器学习库（如Scikit-learn）。

2. Action (行动)

请根据用户的需求，编写一个高效、规范且带有详细注释的Python脚本。该脚本需要能够完成指定的数据清洗、统计分析及基础可视化任务。

3. Context (上下文)

1. 数据源：用户提供一个名为 sales_data.csv 的文件。

2. 数据结构：文件包含以下列：OrderID (订单ID), CustomerName (客户名), ProductCategory (产品类别), Quantity (数量), UnitPrice (单价), OrderDate (订单日期)。

3. 环境限制：假设运行环境已安装 Pandas, NumPy, Matplotlib 库。

4. Expectation (期望)

1. 数据处理：读取CSV文件，处理缺失值（若存在则填充0），并将OrderDate转换为日期时间格式。

2. 统计分析：计算每个ProductCategory的总销售额（Total Sales）和销售数量（Total Quantity）。

3. 可视化输出：生成一个柱状图，展示各类别产品的销售额对比。

4. 代码质量：代码必须包含必要的注释，且变量命名需符合PEP8规范。

四、模型选择与测试分析

• 选用模型：DeepSeek-Coder-V2 / GPT-4o

• 选择理由：这两个模型在代码生成方面具有极强的逻辑理解能力和准确性，能够很好地处理带有特定上下文要求的编程任务。

生成结果分析：

通过 RACE 框架的引导，大语言模型成功输出了完整、可立即运行的Python脚本。具体表现为：

1. 代码准确性：模型生成的代码语法正确，成功包含了数据读取（pd.read_csv）、缺失值处理（.fillna(0)）以及日期转换（pd.to_datetime）的核心逻辑。

2. 逻辑完整性：代码准确计算了各品类的销售额（通过 Quantity * UnitPrice 分组求和），并正确调用了 Matplotlib 库绘制了柱状图，完整覆盖了任务需求。

3. 易读性：代码包含了清晰的注释，变量命名直观，符合 PEP8 规范，易于理解和后续复用。

五、总结与适用场景

经过本次实践验证，RACE 框架展现出了显著的优越性。它非常适合需要精确输出和复杂上下文的任务。在实际应用中，RACE 框架可以广泛应用于：

1. 代码开发与调试：当需要让 AI 辅助编写特定功能的脚本，且对输入输出有明确的规范和格式要求时。

2. 自动化脚本生成：为特定的数据文件或业务逻辑快速生成标准化的处理流程。

3. 复杂数据分析任务：当任务涉及多个步骤（如清洗 -> 分析 -> 可视化）且需要严格控制上下文环境时。

亚马逊云科技技术品牌专区

更多推荐

cover

企业AI真正缺的不是工具，而是一次面对面的交流——一名云计算从业者的几点观察

亚马逊云科技技术品牌专区

cover

人工智能训练师-培训需求分析

亚马逊云科技技术品牌专区

cover

AI Agent：自主智能体的工作原理与应用全景

亚马逊云科技技术品牌专区

所有评论(0)

查看更多评论

善良的小组

已为社区贡献1条内容