
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
更糟糕的是,像 Claude Code 这样,客户端可以单方面改变缓存策略,用户完全不知情。你看不到真实的思考深度(被 redact 了),看不到缓存是否命中(被静默降级了),看不到工具结果是否被截断(截断了也不告诉你)。当 Anthropic 在“追求极致体验”与“沉重推理成本”之间剧烈挣扎时,开发者需要的不是一个替自己做决策的黑盒,而是一个透明、可预测的杠杆。当 AI 工具开始在用户看不见的地
你现在在测的系统,是一次性调用模型,还是一个会持续运行、不断演化的Agent系统?AI测试的核心,正在从“验证结果”,转向“约束系统行为”这类问题,本质上不是模型能力的问题,而是系统形态变了。当系统变成“持续运行的Agent”,测试对象也变了。AI正在从“被调用的能力”,变成“持续运行的系统”Agent正在从“能力调用”,变成“系统工程问题”没有Dreaming的Agent,本质是一次性工具。有些
很多人把 Skill 当插件,这是不准确的。否则你迟早踩“密钥泄露 / 恶意调用”的坑。AI 用得好,是 Prompt 写得好。而 Skill,就是它的执行力来源。理由:中文 + 审核 + 成功率高。不是理论风险,是已经发生的。理由:覆盖面广,能拼工作流。
这些词,已经从“研究论文”走进了“日常工作”。很多人卡在第一步: 不是不会用AI,而是根本不知道这些概念在说什么。可以理解为: AI不是按“句子”理解,而是按“碎片”处理。这篇文章,把AI里最核心的24个概念,全部拆开讲清楚。你不懂AI,不是因为不会用工具,而是听不懂“术语”。本质是一个“被海量数据训练过的预测系统”。AI不是一个工具,而是一套完整的工程体系。只做了预训练,还没有“被教做人”的模型
这些词,已经从“研究论文”走进了“日常工作”。很多人卡在第一步: 不是不会用AI,而是根本不知道这些概念在说什么。可以理解为: AI不是按“句子”理解,而是按“碎片”处理。这篇文章,把AI里最核心的24个概念,全部拆开讲清楚。你不懂AI,不是因为不会用工具,而是听不懂“术语”。本质是一个“被海量数据训练过的预测系统”。AI不是一个工具,而是一套完整的工程体系。只做了预训练,还没有“被教做人”的模型
今天这篇文章,我就手把手带你从零开始,搓一个属于你自己的Claude Skill。我用了大半年的Claude,说实话,最开始我觉得它就是个高级点的聊天机器人,虽然代码写得溜,但每次让它处理我那些特定格式的工作流时,它总是“失忆”——每次都得重新把规则贴一遍,特别烦人。说实话,自从我开始捣鼓Skill,我感觉Claude从一个“需要我不断调教的实习生”,变成了一个“招之即来的特种兵”比如我做的第一个
它能让AI Agent直接操控浏览器。它并不是完全“脱离规则”的智能系统,底层仍然依赖浏览器自动化能力(如 Playwright),只是通过大模型把操作逻辑动态化了。特别是最后一点AI 能执行,但是否“执行正确”,仍然需要测试工程师定义标准。本质仍然是基于 DOM 获取信息,只是在上层通过模型做语义理解。但需要注意,这种调整是“概率驱动”的,而不是完全确定性的。AI 不再只是写代码,而是开始“直接
当多模态能力进入测试链路后, “写用例”本身不再是核心竞争力, “设计 AI 流程”才是。如果只上传截图而无上下文,模型只能推断“表单结构”,无法推断业务规则。它能生成 60% 的基础用例。如果模型已经能理解页面结构,它能否参与测试用例的生成?视觉模型进入测试领域,不是概念展示,而是系统工程问题。因此从技术能力上,它确实可以参与 UI 测试设计。问题不在于“能不能生成”。如果输出是自然语言描述,无
今天这篇文章,我就手把手带你从零开始,搓一个属于你自己的Claude Skill。我用了大半年的Claude,说实话,最开始我觉得它就是个高级点的聊天机器人,虽然代码写得溜,但每次让它处理我那些特定格式的工作流时,它总是“失忆”——每次都得重新把规则贴一遍,特别烦人。说实话,自从我开始捣鼓Skill,我感觉Claude从一个“需要我不断调教的实习生”,变成了一个“招之即来的特种兵”比如我做的第一个
我们关注测试工程能力的系统化建设,包括 Python 自动化测试、Java 自动化测试、Web 与 App 自动化、持续集成与质量体系建设,同时探索 AI 驱动的测试设计、用例生成、自动化执行与质量分析方法,沉淀可复用、可落地的测试开发工程经验。学社围绕现代软件测试工程体系展开,内容涵盖软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试,以及。在技术社区与工程实践之外,学社还参与测试







