
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
一、你给AI的Prompt,每次都在碰运气二、本质变化:从“一次性对话”到“可执行技能包”三、核心机制拆解:一个Markdown文件怎么做到“不瞎猜”四、典型案例:三种工具,同一个Skill模板五、工程落地启示:对测试从业者意味着什么六、趋势判断:Skill正在变成Plugin,你要不要上车。
一、你给AI的Prompt,每次都在碰运气二、本质变化:从“一次性对话”到“可执行技能包”三、核心机制拆解:一个Markdown文件怎么做到“不瞎猜”四、典型案例:三种工具,同一个Skill模板五、工程落地启示:对测试从业者意味着什么六、趋势判断:Skill正在变成Plugin,你要不要上车。
以后测试开发不仅要测 Web、接口、App、性能。还要测:AgentRAGMCPAI 生成代码工具调用链路多 Agent 协同结果这意味着测试开发的能力模型会发生变化:过去未来写自动化脚本设计 AI 测试智能体测接口返回测 Agent 工具调用链测页面功能测多模态交互流程做性能压测做 LLM / RAG / Agent 性能评估看覆盖率看任务完成率、检索命中率、幻觉率、安全风险谁能先理解这套变化,
Dify 是一个开源 LLM 应用程序开发平台。Dify 的直观界面结合了 AI 工作流程、RAG 管道、代理功能、模型管理、可观察性功能等,让您快速从原型转向生产。外部工具暴露 http api通过 swagger 规范描述 api把 api 导入到 difyDify 是一个非常强大的开源平台可以帮助个人和企业快速构建 AI 应用,实现 AI 快速落地可以灵活扩展,支持企业定制扩展能力,实现垂直
TradingAgents 的爆火,说明市场对“金融 + Agent”的关注正在升温。AI 正在从一个回答问题的工具,变成一个能参与复杂业务流程的协作系统。在这个系统里,模型不再只是输出答案。它可以扮演分析师、研究员、风控、交易员、审批人。每个角色都有边界,每次决策都有过程,每个结果都可以复盘。这才是 Agent 时代真正有价值的地方。
Browserbase Skills 开源,表面上是给 Claude Code 增加浏览器自动化能力。但从技术趋势看,它代表的是 Agent 能力边界的一次扩展。理解文本 → 生成内容 → 生成代码打开系统 → 操作页面 → 执行任务 → 记录过程 → 反馈结果这就是从“文本智能”到“操作智能”的变化。对开发者来说,它意味着 AI Coding 不再只是生成代码,而是可能逐步进入验证、调试、回归和
Browserbase Skills 开源,表面上是给 Claude Code 增加浏览器自动化能力。但从技术趋势看,它代表的是 Agent 能力边界的一次扩展。理解文本 → 生成内容 → 生成代码打开系统 → 操作页面 → 执行任务 → 记录过程 → 反馈结果这就是从“文本智能”到“操作智能”的变化。对开发者来说,它意味着 AI Coding 不再只是生成代码,而是可能逐步进入验证、调试、回归和
上个月技术复盘会,老板突然问了一个让所有测试组长后背发凉的问题:“听说隔壁团队搞了一套什么Skills库,手工测试量直接砍掉30%?我们什么时候也能这样?会议室安静了三秒。没人敢接话。因为大家心里清楚,自己团队还在手工点来点去,偶尔写几个半自动脚本。隔壁的“Skills库”三个字,像一根刺扎在每个人心里。会后我专门去聊了一下。隔壁测试负责人很坦诚:不是什么黑科技。就是把团队最常做的20个手工操作,
模型能调用的工具需要你用OpenAPI或类似规范描述清楚。每个工具的输入参数、输出格式、副作用都要明确。脏活都在工具实现里——模型只负责决策“该不该点这个按钮”,实际点击由安全封装好的函数执行,带超时、重试、日志。
如果用户说“找附近便宜的餐厅”,模型只出了便宜,但用户最后点击了三公里内的店,说明他补了距离约束。所以面试官问“为什么没提取‘附近’”,本质是在问:你的模型有没有能力理解“附近”和“便宜”是同一个槽位类别(餐厅属性)下的两个并列约束?自己手写20条含“和/或/但/不要”的复合约束用例,尝试用spaCy的依存解析或小模型做关系分类。因为我知道,我平时测意图识别,用的都是单槽位用例——“便宜餐厅”“附







