logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

字节面试官追问:“你的Agent调了三个工具就死循环了,异常处理在哪写的?”我:啊?还要写这个?

以前问的是“Selenium怎么定位元素”,后来问“接口自动化框架怎么设计”。那一刻,空气突然安静。这不是段子,这是2026年测试工程师面试的真实切片。当你还在用AI生成脚本的时候,大厂已经在考察你了。

文章图片
#人工智能
一套Skills库干掉30%手工测试,老板已经在问了

上个月技术复盘会,老板突然问了一个让所有测试组长后背发凉的问题:“听说隔壁团队搞了一套什么Skills库,手工测试量直接砍掉30%?我们什么时候也能这样?会议室安静了三秒。没人敢接话。因为大家心里清楚,自己团队还在手工点来点去,偶尔写几个半自动脚本。隔壁的“Skills库”三个字,像一根刺扎在每个人心里。会后我专门去聊了一下。隔壁测试负责人很坦诚:不是什么黑科技。就是把团队最常做的20个手工操作,

文章图片
#人工智能
百度面试官一针见血:“多模态RAG,图片里的文字你OCR出来了,那图里的逻辑关系呢?”我沉默了

上个月百度招一个AI测试开发岗,我面到第三轮,面试官忽然从手机里翻出一张截图递给我看。是一张典型的业务流程图。左边三个圆角矩形写了“用户上传”“系统校验”“返回结果”,中间三条箭头,其中一条从“系统校验”指向一个菱形判断框“信息完整?”,分两支:是→“存入数据库”,否→“驳回”。面试官问:你用多模态RAG做文档问答,用户传这张图问‘上传后信息不完整会怎样’,你觉得你的系统能答对吗?我下意识说:OC

文章图片
#dubbo
我花一周拆解了企业级Skills库的全套设计模式

你团队现在跑的几百个测试脚本里,哪些适合抽象成 Skill,哪些天生就不适合 Agent 调用?如果你还没开始问这个问题,一年后这些脚本大概率会变成没人维护的技术债。而能够回答这个问题的人,已经在构建下一个周期的测试基础设施了。

文章图片
#设计模式#人工智能
Anthropic 开源 Skills:Agent 工程化,开始从 Prompt 走向能力封装

最近,Anthropic 开源了一个很值得关注的项目:。从仓库 README 来看,这个项目不是简单放了一批 Prompt 模板,而是把 Claude 使用的一套 Agent Skills 能力机制开放出来,里面包含技能示例、规范、模板,以及文档处理相关的复杂 Skill 参考实现。简单说,Skills 的目标是:让 Agent 在面对特定任务时,可以动态加载一组已经封装好的说明、脚本和资源,从而

文章图片
Anthropic 开源 Skills:Agent 工程化,开始从 Prompt 走向能力封装

最近,Anthropic 开源了一个很值得关注的项目:。从仓库 README 来看,这个项目不是简单放了一批 Prompt 模板,而是把 Claude 使用的一套 Agent Skills 能力机制开放出来,里面包含技能示例、规范、模板,以及文档处理相关的复杂 Skill 参考实现。简单说,Skills 的目标是:让 Agent 在面对特定任务时,可以动态加载一组已经封装好的说明、脚本和资源,从而

文章图片
浏览器自动化的下一层:为什么 CloakBrowser 把指纹问题推到了源码层?

CloakBrowser 受到关注,不只是因为它宣称通过了多项检测,也不只是因为它能替换 Playwright。更重要的是,它暴露了一个趋势:浏览器自动化正在进入更深的技术层。过去我们讨论自动化,更多讨论脚本、定位、断言、并发、报告。现在我们必须讨论浏览器内核、指纹一致性、网络时序、行为模型、环境画像、供应链安全和风控测试。对测试开发来说,这不是简单多学一个工具,而是要意识到:未来的自动化能力,不

文章图片
#自动化#运维
AI 编程不缺代码能力,缺的是这套 Agent Skills 工程能力库

Agent Skills 的走红,不只是一个开源项目的热度变化。AI 编程正在从 Prompt 阶段,进入工程流程阶段。过去大家比的是:谁的 Prompt 写得好;谁能让 AI 生成更多代码;谁能更快做出 Demo;谁能用 AI 提升个人效率。但接下来,真正拉开差距的会是:谁能把工程经验沉淀成流程;谁能把质量标准变成门禁;谁能让 AI 输出可验证证据;谁能把开发、测试、评审、发布串成闭环;谁能让

文章图片
#人工智能
Claude Code 用了两周后,我发现它最强的不是写代码

Claude Code 的出现,说明 AI 编程正在发生一个变化。过去大家关心的是:AI 能不能写代码;AI 能不能补全函数;AI 能不能解释报错;AI 能不能生成脚本。现在更应该关心的是:AI 能不能理解项目;能不能遵守团队规范;能不能参与测试闭环;能不能看懂 diff;能不能管理上下文;能不能在权限边界内执行任务;能不能把开发、测试、提交、复盘串起来。这才是 Claude Code 值得学习的

文章图片
#职场和发展
写了那么多 AI 测试 Skills,为什么还是不好用?

这是测试 Skills 最核心的坑。请生成完整测试用例。问题是,什么叫完整?对 AI 来说,可能包含 5 条用例就算完整。正常路径异常路径边界值权限状态流转幂等性重复提交并发数据一致性错误码降级逻辑安全风险性能风险如果你不定义覆盖标准,AI 就会默认生成最常见、最省事的用例。## 测试覆盖要求每个接口至少从以下维度设计用例:1. 正常场景:合法参数、正常状态、预期成功。2. 必填校验:必填字段为空

文章图片
#人工智能
    共 62 条
  • 1
  • 2
  • 3
  • 7
  • 请选择