
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本章聚焦AI智能体开发前两步——制定规范与构建数据集。针对"评论有效性甄别"任务,首先使用Claude Code生成结构化评测规范,定义具体性、可验证性等4个核心维度及其判定标准,强调人工审核的关键作用。随后指导构建黄金标准测试集:通过AI批量生成候选评论数据后,需人工依据规范标注"有效/无效"标签,并提供数据质量检查清单(覆盖边界案例、正负均衡等),为后续Prompt开发奠定基准基础。

本章介绍了AI辅助编程工具Claude Code和Trae的开发环境配置与基本使用。内容包括:系统要求检查、Python虚拟环境创建、API密钥安全管理方法;Claude Code的安装配置及通过自然语言指令生成Python函数的实践;Trae IDE的安装及SOLO模式的初体验;最后对比了两款工具的特点和适用场景。读者将获得可运行的开发环境,并完成首次AI生成代码的体验,为后续AI智能体开发打下

本章指导读者利用Claude Code生成首个“评论甄别智能体”的核心代码。通过自然语言指令,AI自动生成包含系统提示词(prompt_template.txt)和Python脚本(comment_agent.py)的两个文件,实现评论有效性判断功能。

一套系统化开发AI智能体的方法论。其核心思想是"规范即基准",强调通过结构化文档(定义输入输出、评测维度、边界规则等)作为开发基准,确保可重复性和客观性。Harness工程采用四层架构(决策层、驾驭层、执行层、业务层)和工业级五步流程(规范定义→数据构建→智能体开发→自动化评测→迭代优化),并设计三层评测指标(基础工程指标、核心业务指标、场景定制指标)。

这是一本“工程书”。我们的目标是让你驾驭AI——用规范代替直觉,用数据代替拍脑袋,用自动化评测代替人眼检查,用可追溯的迭代代替“碰运气式”修改。开发一个可评测、可迭代的智能体系统,建立一套不依赖任何工具的工程化思维。

本章介绍了AI辅助编程工具Claude Code和Trae的开发环境配置与基本使用。内容包括:系统要求检查、Python虚拟环境创建、API密钥安全管理方法;Claude Code的安装配置及通过自然语言指令生成Python函数的实践;Trae IDE的安装及SOLO模式的初体验;最后对比了两款工具的特点和适用场景。读者将获得可运行的开发环境,并完成首次AI生成代码的体验,为后续AI智能体开发打下

一套系统化开发AI智能体的方法论。其核心思想是"规范即基准",强调通过结构化文档(定义输入输出、评测维度、边界规则等)作为开发基准,确保可重复性和客观性。Harness工程采用四层架构(决策层、驾驭层、执行层、业务层)和工业级五步流程(规范定义→数据构建→智能体开发→自动化评测→迭代优化),并设计三层评测指标(基础工程指标、核心业务指标、场景定制指标)。

本文介绍如何构建一个产品需求文档多智能体评审系统。系统包含4个专业评审角色(产品经理、研发工程师、测试工程师、运营经理)、1个汇总报告Agent和1个评测审计Agent。通过明确的角色分工,实现PRD的自动化多维度评审,解决传统人工评审效率低、标准不一的问题。文章详细阐述了系统架构设计、角色职责划分、测试数据集构建方法,以及黄金评审标准的制定流程。

本章介绍如何让AI Agent具备自我扩展能力,即在发现能力缺口时自动生成并注册新工具。核心流程包括:Agent识别重复需求→生成工具代码→保存到tools目录→动态注册到ToolManager。通过为Agent添加register_tool特殊工具和修改系统提示词,使其能够将常用逻辑(如计算成绩波动率)持久化为可复用工具。关键实现涉及动态导入模块(importlib)、路径安全检查、工具定义规范

本文是《AI应用工程化实战教程》第3章,指导读者配置DeepSeek API Key并实现首个具备文件读取功能的Agent。通过AI辅助编程工具Trae生成带read_file工具的Agent脚本,包含完整工具调用循环。








