
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
而原生Skill API(比如OpenAI的Function Calling、Anthropic的原生Tool Use)走的是“模型原生支持”路线——模型在训练阶段已经学会了如何做工具调用,不是靠运行时的prompt注入来引导行为。用工程视角来总结:LangChain在工具调用这件事上做的是“通用抽象”——把不同厂商的工具调用差异抹平,代价是牺牲了每个厂商原生API已经做好的高效路径。这里有一个需
这个Skill里封装的不是大模型,是确定性的比较算法——deepdiff、json schema validator、正则表达式。不是简单的True/False,而是“data.userName期望是张三,实际是张四”。是真正封装的、可执行的、带工具的Skill。调用“数据构造Skill”生成jpg、png、gif、txt、大于2MB的图片文件。AI不知道你要的是“忽略时间戳”“浮点数误差小于0.
这个Skill里封装的不是大模型,是确定性的比较算法——deepdiff、json schema validator、正则表达式。不是简单的True/False,而是“data.userName期望是张三,实际是张四”。是真正封装的、可执行的、带工具的Skill。调用“数据构造Skill”生成jpg、png、gif、txt、大于2MB的图片文件。AI不知道你要的是“忽略时间戳”“浮点数误差小于0.
过去一年,开发团队的变化很明显。以前用 AI 写代码,很多人只是让它补一个函数、改一个接口、生成一段测试脚本。现在不一样了。AI Agent 已经开始参与需求分析、方案设计、代码修改、测试验证,甚至还能自己读仓库、跑命令、改文件、生成文档。看起来效率提高了。但很多团队真正用深以后,反而遇到一个更棘手的问题:AI 确实能干活,但它不一定稳定。AI 确实能写代码,但它不一定懂你的工程边界。AI 确实会
如果用户说“找附近便宜的餐厅”,模型只出了便宜,但用户最后点击了三公里内的店,说明他补了距离约束。所以面试官问“为什么没提取‘附近’”,本质是在问:你的模型有没有能力理解“附近”和“便宜”是同一个槽位类别(餐厅属性)下的两个并列约束?自己手写20条含“和/或/但/不要”的复合约束用例,尝试用spaCy的依存解析或小模型做关系分类。因为我知道,我平时测意图识别,用的都是单槽位用例——“便宜餐厅”“附
从0到1学自动化测试,不是为了把手工测试全部替掉。它真正的价值在于:让核心回归更稳定;让质量反馈更及时;让研发交付更可控;让测试从后置验证走向过程保障;让测试工程师具备更强的工程能力。结合这张“测试工程师质量体系能力全景图”来看,自动化测试只是起点,不是终点。它向下连接基础测试能力,向上连接测试工程化、线上质量运营、质量治理和 AI 辅助测试。所以学习路径可以简单概括为一句话:先会测,再会写脚本;
用户问一句话,模型回答一段话。测试重点通常围绕几个问题展开:回答是否准确?是否存在幻觉?是否符合业务规则?是否有安全风险?是否能稳定输出指定格式?但多模态 AI 出现之后,测试对象明显变复杂了。用户不再只是输入一段文字,而是可能上传:一张 UI 截图一张报错截图一张合同图片一张发票照片一张商品图片一张流程图一张包含文字、图标、表格、布局的信息图然后再补一句:帮我分析一下。帮我生成测试用例。帮我提取
2026年第一季度的态势是:五种完全不同的Agent产品在同一个窗口期涌现——OpenClaw走个人助理路径,Cowork走办公协作,Codex App走长程工程,Perplexity Computer走统一工作站,腾讯云ADP走企业平台。更关键的是,薄架构带来了一个工程上极其重要的改变——能力不再是黑盒的成品,而是可组合的模块,Skill生态就长在这一层上。Skill把原来写在人脑子里的经验——
一个数据能说明问题。今年3月,字节2026年春招中,“测试开发工程师-开发者AI”岗位直接硬性要求:对AIGC技术有一定理解和实践经验的优先,如AI Agent、机器学习、自然语言处理等。不是“会写Selenium脚本优先”,不是“熟悉持续集成/持续部署优先”——是“对AI Agent有深入理解和实践经验”、“熟悉MCP协议模型上下文协议者优先”、“有Skill封装和工程化落地能力”。不是写死了“
一个数据能说明问题。今年3月,字节2026年春招中,“测试开发工程师-开发者AI”岗位直接硬性要求:对AIGC技术有一定理解和实践经验的优先,如AI Agent、机器学习、自然语言处理等。不是“会写Selenium脚本优先”,不是“熟悉持续集成/持续部署优先”——是“对AI Agent有深入理解和实践经验”、“熟悉MCP协议模型上下文协议者优先”、“有Skill封装和工程化落地能力”。不是写死了“







