登录社区云,与社区用户共同成长
邀请您加入社区
"Harness Engineering"方法重构自动化测试,解决传统硬编码测试在复杂业务系统(如AI Agent平台)中的维护成本高、表达能力受限等问题。通过两层改造:1)将业务API封装为标准化CLI命令;2)抽象为AI可调用的Skills技能模块,形成约束性"马具"。该方法使测试人员能用自然语言描述场景(如"创建天气助手Agent并验证问答"),由AI自主规划Skill调用序列并执行语义断言
AI Agent 目前已被普遍认为是人工智能发展的第四阶段。按照AI 技术能力的演进来看,人工智能已经历了从传统AI(识别智能)、到生成式AI(生成智能)、再到推理AI(推理智能)的发展过程,而随着像OpenClaw等Agent系统的出现,AI开始具备任务规划、工具调用和自动执行能力,它能够直接操作软件并完成复杂任务,标志着当前人工智能进入了Agent时代。
项目流日志事件日志目的输出调试信息记录关键事件日志内容流式日志(变量、流程、状态)事件驱动(操作、触发、状态变更)是否结构化否是(有统一格式)常见用途开发调试、流程追踪行为审计、插件生命周期记录是否需要单独封装否(封装意义不大)推荐封装为独立方法,便于统一管理是否常用于异常处理否否是否需线程安全否否实践建议流日志适用于快速调试和临时日志输出,适合开发者查看当前代码执行情况。事件日志适用于记录重要行
GPT-5.4本次更新最重要的变化之一即在于强化Agent的能力,在API和Codex中,GPT-5.4首次实现了原生级“电脑操作”功能,支持智能体跨软件执行复杂工作流。我们认为,GPT作为全球大模型第一梯队产品,其技术发展趋势表明大模型作为底层技术,对Agent能力的加强是其迭代的重点方向之一,有望持续强化基础技术,助力OpenClaw加快商业化落地。大模型能力是Agent基石。在OpenCla
AI Agent 指能够自主理解目标、制定计划、调用工具并执行任务的人工智能系统。相比传统聊天式AI,AI Agent 具备了三个核心能力:任务拆解能力(Planning)、工具调用能力(Tool Use)、自动执行能力(Autonomous Execution),这意味着AI 将从“回答问题的工具”跨越为“能够完成任务的数字员工”,这一跨步或将成为计算机行业继PC、互联网、云计算之后的新一轮的技
软件测试的终局或许是“无人测试”,但这并不意味着“不需要人”。相反,它对人的要求更高了。那些固守传统手工测试或死磕底层脚本的人,可能会被时代淘汰;但那些懂得利用AI Agent重构测试流程、懂得驾驭智能体去解决复杂业务问题的人,将成为数字经济时代最坚实的底色。路在何方?路就在你脚下,在每一次与AI的交互中,在每一次对新技术的探索中。2026年,正是你从传统测试迈向AI测试的最佳起跑线。
本项目是一个基于自研高并发 HTTP 服务器的轻量级 Web 游戏平台,提供贪吃蛇、扫雷、五子棋三款经典小游戏的在线游玩服务。项目采用 C++ 从零实现底层 TCP 网络库和 HTTP 协议解析,实现了完整的用户认证系统、排行榜系统和游戏逻辑。前端采用原生HTML/CSS/JavaScript 构建,配合 Vue 3 等现代前端技术实现动态交互。旨在打造一个高性能、低延迟、可扩展的在线小游戏服务平
道本科技与DeepSeek共创的智能合同系统,可在数秒内完成合同审查,自动识别条款缺失、条款质量、隐蔽陷阱等风险。同时完整记录合规管理全过程,为监管审查提供清晰的可追溯凭证——正如上述被罚企业在数据安全和客户尽职调查上的“双失守”,正是该系统能够有效防范的场景。该平台利用大数据和人工智能技术,建立了以合规事项、合规主体、合规义务、合规路径、违规责任为核心的合规知识图谱。,深耕企业法务合规数字化领域
Understand-Anything 是一个 AI 代码理解工具,通过静态分析 + 大语言模型,将代码库转换成交互式知识图谱,帮助团队成员快速理解代码结构、分析变更影响。场景价值接手陌生项目快速定位核心模块,梳理业务流程代码变更分析评估影响范围,精准回归测试补充测试场景AI 辅助发现遗漏的分支和边界条件。
- 良率=好Die/总Die,但选错模型可能差17个百分点- Poisson模型过于悲观,Murphy居中,**Negative Binomial才是业界标配**- 关键不是良率数字,是**跟踪聚类因子α的变化**——它能早几周预警工艺漂移- Chiplet时代,10颗90%良率的Die封在一起,整体良率只有35%
在这个人工智能技术飞速发展的今天,AI Agent(人工智能代理)已经不再是科幻小说里的概念,而是实实在在地走进了我们的生活。从智能客服到自动驾驶,从推荐系统到游戏AI,AI Agent正在改变着我们的世界。但是,就像我们需要确保玩具汽车需要定期保养和维护一样,AI Agent也需要经过严格的测试,才能确保它们能够安全、可靠、高效地为我们服务。
首先,什么是AI Agent?在人工智能领域,Agent通常指的是能够感知环境、做出决策并采取行动的自主实体。感知模块:负责从环境中获取信息推理/决策模块:处理信息并决定下一步行动行动模块:执行决策,影响环境学习模块:根据经验改进性能自主性:AI Agent能够在没有持续人工干预的情况下运行反应性:能够感知环境变化并及时做出反应主动性:不仅能对环境做出反应,还能主动追求目标社交能力:能够与其他Ag
本书立足软件工程3.0时代,系统讲解大模型在软件测试全生命周期的创新应用,兼具理论深度与实战价值,为测试人员指明职业升级路径,是行业智能化转型的必备参考,获阿里巴巴、南京大学、华为、南方科技大学、中科院软件所等多位权威专家联袂推荐!LLM驱动测试需求分析:探讨如何利用LLM理解产品需求、分解测试需求、界定测试范围、挖掘测试风险,同时介绍如何生成测试项、验收标准和测试计划,提高需求分析的效率和质量。
当 AI 开始替我们写代码,测试还像以前那样做就行了吗?
本文介绍了如何为全栈TypeScript项目建立测试体系,通过测试金字塔模型(单元测试70%、集成测试适量、少量E2E测试)分层实施。以ChatCrystal项目为例,使用Node.js内置的node:test模块实现零依赖测试方案,涵盖纯函数单元测试(如正则清洗、文本分块、路径解析)、集成测试(sql.js内存数据库与Fastify路由测试)以及CI自动化。文章强调单元测试应快速验证函数输入输出
集成测试:将多个模块、服务、组件组合在一起进行的测试,验证各个部分之间的交互是否符合预期,核心是多步骤、跨系统、全链路。多步骤Agent:具备自主规划多步执行路径、调用工具、根据执行结果调整策略的大语言模型应用,核心组件包括规划器、执行器、记忆模块、反思器、工具集五个部分。测试记忆库:存储接口文档、历史测试用例、错误解决方案等知识的向量数据库,为Agent的规划、反思提供依据,减少大模型幻觉。本文
本文提供了在Windows系统中为Trae IDE配置CodeGraph代码知识图谱工具的完整指南。主要内容包括:环境准备(Node.js安装)、CodeGraph的npm安装方法、项目索引建立步骤、Trae MCP配置详解、常见问题解决方案以及使用技巧。重点介绍了如何通过自然语言查询代码结构、调用关系和影响范围,并对比了使用前后的效果差异。最后总结了四步核心安装流程,帮助开发者让AI深度理解项目
通过金蝶云星空、小满CRM和泛微审批系统的对接,企业可以实现客户信息与销售订单的自动同步、审批流程的自动化以及数据一致性的保障。结合DeepSeek的智能化技术,企业不仅能够提升审批效率和数据管理能力,还能在激烈的市场竞争中脱颖而出。在未来,随着技术的不断进步和市场需求的不断变化,企业需要持续优化系统集成和智能化应用,以实现可持续发展。
摘要:本文揭示了Spring Boot并行测试中常见的资源竞争问题,包括端口冲突、数据库主键冲突和共享状态污染。针对端口冲突,建议严格使用RANDOM_PORT并避免硬编码端口;对于数据库竞争,推荐生成唯一测试数据或采用Testcontainers隔离方案;文件系统冲突可通过JUnit临时目录解决。这些方案能有效消除并行测试中的随机失败,确保测试稳定性和执行效率。
Testcontainers 网络配置是集成测试常见痛点,本文系统梳理了容器连接问题的解决方案。单容器场景中,Spring Boot 3.1+推荐使用@ServiceConnection替代手动属性注入,避免localhost和随机端口配置错误。多容器通信需创建自定义Docker网络,通过容器名或别名互联,同时注意宿主机JVM测试与容器内应用的网络差异。Kafka等特殊服务需额外处理广播地址,Te
在 ISO 26262 功能安全认证过程中,结构覆盖率 (Structural Coverage)是衡量软件单元测试充分性的核心指标。根据不同的 ASIL 等级,标准要求或建议达到不同的覆盖率目标。MathWorks 提供了和等工具,用于在基于模型的设计 (MBD) 流程中收集模型和代码的覆盖率数据。然而,ISO 26262 的标准术语与 MATLAB/Simulink 工具中显示的指标名称存在一
Kvaser Mini PCI Express 1x CAN v3是一款专为严苛工业环境设计的嵌入式CAN总线通讯板卡。该产品采用工业级MiniPCIe规格,板载SIC智能收发芯片和硬件独立时钟,具有1μs高精度时序采集能力,支持CAN FD和传统CAN2.0A/B双协议。其超薄紧凑设计(30×51×5mm)特别适合车载工控机、便携诊断设备等密闭空间应用,工作温度范围达-40℃至85℃,具备优异的
MIPI 技术背景在 5G、AI、车载电子、高端影像与工业检测飞速发展的今天,高分辨率、高帧率、低延迟、高稳定的图像数据传输与采集,成为产品研发、测试与量产的核心瓶颈。MIPI CSI-2 接口凭借低功耗、高带宽、抗干扰强等优势,已成为手机、车载、安防、工业相机的主流互联方案,而C-PHY 与 D-PHY作为物理层核心,支撑着从高清到 8K、从 30fps 到 120fps + 的海量数据传输。思
摘要: 构建有效的AI评测集需确保数据与线上场景一致,避免自嗨式测试。数据来源有三:1)真实用户日志(贴近业务但成本高);2)业务场景还原(依赖PRD/工单,需业务协同);3)合成生成(低成本但易偏离真实分布)。开源数据集(如SWE-bench、ToolBench)可辅助横向对比或单测,但需警惕场景错位、数据泄露和过拟合风险,不宜直接作为业务标准。核心原则:优先真实数据,开源集作补充,定期审计覆盖
集成测试
——集成测试
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net