logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型应用进阶指南(二):打造具备自主工具使用能力的智能推理链

大模型正从对话迈向行动,核心是工具调用(Function Calling)。开发者向模型注册工具函数后,模型能根据问题智能选择并调用,附上正确参数,并将执行结果转化为最终答案。相比ReAct提示工程,工具调用更聚焦于明确的函数接口,适合API调用等场景,开发相对简便。它标志着大模型从“认知”走向“行动”,成为解决实际问题的关键。

文章图片
#人工智能
新手也能用好AI:10个提示词技巧,让测试效率翻倍

在AI时代,有效提问是测试工程师的核心能力。直接输入模糊指令只会得到泛泛而谈的结果,而通过为AI设定明确身份、分步骤拆解任务、规定输出格式以及提供“种子”范例,测试人员可以引导AI生成深度覆盖业务场景、异常情况及安全风险的精准测试方案。掌握这些提示词技巧,能将AI从“工具”转变为高效产出高质量测试资产的协作伙伴。

文章图片
#人工智能
当测试遇到 Gemini Agents:这可能是你今年最重要的效率革命

谷歌Gemini Agents正重塑测试工作流,它能从需求文档自动生成用例与脚本,精准解决时间紧迫、路径复杂、回归耗资源三大痛点。文章建议测试工程师从小场景切入,掌握“测试语言”与AI对话,并将AI输出转化为团队资产。面对幻觉与安全等挑战,需建立验证机制。AI不会取代测试工程师,但能放大其业务理解与风险直觉等核心价值,助其聚焦更高维的质量体系建设。

文章图片
#人工智能
别等上线才后悔!AI应用测试的5个维度与4类实战避坑指南

AI大模型应用的测试与传统软件测试逻辑迥异,核心在于评估输出的准确性、鲁棒性与安全性。本文通过“打卡引导”功能案例,提出五维测试框架:需验证变量理解、意图匹配、抗Prompt注入攻击、内容安全过滤及高并发下的性能与多样性。测试工程师需从流程检验转向质量探针角色,系统评估AI输出,确保智能体被安全、负责任地交付。

文章图片
#人工智能
从 MRD 到代码骨架:大模型如何优化需求与系统设计效率

本文探讨了如何通过AI在需求与系统设计阶段提前介入,以减少返工与沟通成本。方案基于多智能体协作的流水线,将模糊的业务诉求转化为结构化的工程输入,涵盖从MRD到PRD的智能生成,再到系统分析与代码骨架准备。通过RAG技术增强业务语境理解,旨在将个人经验转化为团队可复用的工程能力,从而提升整体研发效率与确定性。

文章图片
#人工智能
AI 编程的演变:从代码补全到Agent的变革

AI编程正从代码补全演进为Agent驱动,其核心挑战从效率转为系统化约束。Agent需在明确Spec限定下执行任务,Spec的作用是缩小决策空间,防止方向性错误。同时,需通过工程化管理上下文来控制成本,并将复用路径设计为低风险选项。真正的工程优势在于将隐性经验转化为可执行的系统规则,确保AI的决策与输出可控、可验证。

文章图片
#人工智能
AI 编程的演变:从代码补全到Agent的变革

AI编程正从代码补全演进为Agent驱动,其核心挑战从效率转为系统化约束。Agent需在明确Spec限定下执行任务,Spec的作用是缩小决策空间,防止方向性错误。同时,需通过工程化管理上下文来控制成本,并将复用路径设计为低风险选项。真正的工程优势在于将隐性经验转化为可执行的系统规则,确保AI的决策与输出可控、可验证。

文章图片
#人工智能
AI 智能化测试平台:Web 用例自动执行与禅道测试任务创建的企业级实践

测吧科技展示了其AI测试平台如何自动化真实业务流程。通过自然语言描述的测试用例,平台能自动理解意图、驱动浏览器在禅道系统中创建任务,并验证结果。整个过程无需编写脚本,且能生成包含操作记录与截图的详细测试报告。这表明AI自动化测试已能稳定执行涉及登录、表单填写等复杂流程,将测试能力从个人技能转化为可复用的工程资产,为企业提供了可审计的智能测试方案。

文章图片
#人工智能
AI 不再追求“更聪明”:Anthropic 聚焦于可靠工作的能力

Anthropic的实践表明,AI正从追求“更聪明”转向追求“更可靠”。在编程领域,Claude Code已能自主接任务并执行,其设计减少工具层约束以释放模型潜力。这种能力正外溢至科研、运维等场景。当前企业AI应用的核心痛点在于输出多为需大量返工的“半成品”,导致整体效率未升反降。未来AI将演变为可被委派任务的协作单元,其落地的真正挑战在于工程基础设施能否支撑AI在复杂、受限环境中稳定、可控地运行

文章图片
#人工智能
Waymo 测试 Gemini 车载 AI:1200 行系统指令披露,考验“可控性”

Waymo正为自动驾驶出租车测试一个高度受控的车载AI Agent,而非普通聊天机器人。该助手基于Gemini构建,能力被严格限制于回答常识、调节座舱环境等,明确禁止参与驾驶决策或评论敏感话题。这体现了生产级AI的设计哲学:能力可有限,但边界必须清晰,尤其在自动驾驶等高危领域,“可控性”远比“聪明度”更重要。

#人工智能
    共 30 条
  • 1
  • 2
  • 3
  • 请选择