logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Claude Code 一周烧掉一半配额?我从逆向工程中看到了 Agent 测试的致命盲区

更糟糕的是,像 Claude Code 这样,客户端可以单方面改变缓存策略,用户完全不知情。你看不到真实的思考深度(被 redact 了),看不到缓存是否命中(被静默降级了),看不到工具结果是否被截断(截断了也不告诉你)。当 Anthropic 在“追求极致体验”与“沉重推理成本”之间剧烈挣扎时,开发者需要的不是一个替自己做决策的黑盒,而是一个透明、可预测的杠杆。当 AI 工具开始在用户看不见的地

#spring#java#后端 +1
OpenClaw大版本更新之后,Agent开始向“系统级智能体”演化

你现在在测的系统,是一次性调用模型,还是一个会持续运行、不断演化的Agent系统?AI测试的核心,正在从“验证结果”,转向“约束系统行为”这类问题,本质上不是模型能力的问题,而是系统形态变了。当系统变成“持续运行的Agent”,测试对象也变了。AI正在从“被调用的能力”,变成“持续运行的系统”Agent正在从“能力调用”,变成“系统工程问题”没有Dreaming的Agent,本质是一次性工具。有些

#人工智能
OpenClaw 技能到底去哪装?这 11 个平台帮你把坑踩完了

很多人把 Skill 当插件,这是不准确的。否则你迟早踩“密钥泄露 / 恶意调用”的坑。AI 用得好,是 Prompt 写得好。而 Skill,就是它的执行力来源。理由:中文 + 审核 + 成功率高。不是理论风险,是已经发生的。理由:覆盖面广,能拼工作流。

#人工智能
AI术语看不懂?这24个核心概念,帮你把AI底层逻辑一次讲清

这些词,已经从“研究论文”走进了“日常工作”。很多人卡在第一步: 不是不会用AI,而是根本不知道这些概念在说什么。可以理解为: AI不是按“句子”理解,而是按“碎片”处理。这篇文章,把AI里最核心的24个概念,全部拆开讲清楚。你不懂AI,不是因为不会用工具,而是听不懂“术语”。本质是一个“被海量数据训练过的预测系统”。AI不是一个工具,而是一套完整的工程体系。只做了预训练,还没有“被教做人”的模型

#人工智能
AI术语看不懂?这24个核心概念,帮你把AI底层逻辑一次讲清

这些词,已经从“研究论文”走进了“日常工作”。很多人卡在第一步: 不是不会用AI,而是根本不知道这些概念在说什么。可以理解为: AI不是按“句子”理解,而是按“碎片”处理。这篇文章,把AI里最核心的24个概念,全部拆开讲清楚。你不懂AI,不是因为不会用工具,而是听不懂“术语”。本质是一个“被海量数据训练过的预测系统”。AI不是一个工具,而是一套完整的工程体系。只做了预训练,还没有“被教做人”的模型

#人工智能
从零开始构建你的第一个Claude Skill:手把手打造AI专属技能

今天这篇文章,我就手把手带你从零开始,搓一个属于你自己的Claude Skill。我用了大半年的Claude,说实话,最开始我觉得它就是个高级点的聊天机器人,虽然代码写得溜,但每次让它处理我那些特定格式的工作流时,它总是“失忆”——每次都得重新把规则贴一遍,特别烦人。说实话,自从我开始捣鼓Skill,我感觉Claude从一个“需要我不断调教的实习生”,变成了一个“招之即来的特种兵”比如我做的第一个

#人工智能
browser-use爆火:AI Agent接管浏览器,测试自动化正在被重构

它能让AI Agent直接操控浏览器。它并不是完全“脱离规则”的智能系统,底层仍然依赖浏览器自动化能力(如 Playwright),只是通过大模型把操作逻辑动态化了。特别是最后一点AI 能执行,但是否“执行正确”,仍然需要测试工程师定义标准。本质仍然是基于 DOM 获取信息,只是在上层通过模型做语义理解。但需要注意,这种调整是“概率驱动”的,而不是完全确定性的。AI 不再只是写代码,而是开始“直接

#人工智能#自动化#重构
多模态大模型 + 自动化测试:从截图到结构化用例的系统设计思路

当多模态能力进入测试链路后, “写用例”本身不再是核心竞争力, “设计 AI 流程”才是。如果只上传截图而无上下文,模型只能推断“表单结构”,无法推断业务规则。它能生成 60% 的基础用例。如果模型已经能理解页面结构,它能否参与测试用例的生成?视觉模型进入测试领域,不是概念展示,而是系统工程问题。因此从技术能力上,它确实可以参与 UI 测试设计。问题不在于“能不能生成”。如果输出是自然语言描述,无

从零开始构建你的第一个Claude Skill:手把手打造AI专属技能

今天这篇文章,我就手把手带你从零开始,搓一个属于你自己的Claude Skill。我用了大半年的Claude,说实话,最开始我觉得它就是个高级点的聊天机器人,虽然代码写得溜,但每次让它处理我那些特定格式的工作流时,它总是“失忆”——每次都得重新把规则贴一遍,特别烦人。说实话,自从我开始捣鼓Skill,我感觉Claude从一个“需要我不断调教的实习生”,变成了一个“招之即来的特种兵”比如我做的第一个

#人工智能
Django 模板变量与标签实战指南:90% 的 Django 新手都忽略了这几个细节

我们关注测试工程能力的系统化建设,包括 Python 自动化测试、Java 自动化测试、Web 与 App 自动化、持续集成与质量体系建设,同时探索 AI 驱动的测试设计、用例生成、自动化执行与质量分析方法,沉淀可复用、可落地的测试开发工程经验。学社围绕现代软件测试工程体系展开,内容涵盖软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试,以及。在技术社区与工程实践之外,学社还参与测试

#django#sqlite#python +1
    共 29 条
  • 1
  • 2
  • 3
  • 请选择