logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2025全球大语言模型巅峰对决:ChatGPT-4.5、Gemini Ultra、Llama3、通义千问、文心一言等10大模型全维度解析

‌案例1:跨境电商创业者‌ ‌需求‌:低成本生成多语言文案 + 规避广告法风险 ‌方案‌:Gemini Ultra(主力翻译) + Claude 3(合规审查) + Llama3(非核心文案降本)‌案例2:MCN机构内容总监‌ ‌需求‌:日更1000条爆款脚本 + 多平台适配 ‌方案‌:字节豆包(热点追踪) + 腾讯混元(优化“网感”) + Llama3(边缘账号降本)‌核心逻辑‌:从业者需根据‌

文章图片
#语言模型
字节新动作!豆包编程模型 Doubao-Seed-Code 正式亮相,AI 写项目时代来了

字节跳动旗下火山引擎发布豆包编程模型Doubao-Seed-Code,推出TRAECN企业版公测。该模型具备256K长上下文处理能力,兼容Anthropic API,实现零成本迁移,并显著降低使用成本。其在SWEBench榜单以78.8%准确率登顶,采用真实工程数据训练。同时推出9.9元起的普惠价格方案,推动AI编程在企业开发中的实际应用。

文章图片
#ui#压力测试#单元测试 +4
用知识图谱重构电商测试用例:精准覆盖业务场景的实践

在电商系统的测试中,你是否经常遇到这些问题?✅‌ 场景遗漏‌:测试用例覆盖不全,上线后才发现关键路径未测试✅‌ 重复劳动‌:不同模块的测试用例存在大量冗余✅‌ 维护困难‌:业务规则变更后,需要手动更新数十个关联用例✅‌ 效率低下‌:人工编写用例耗时耗力,难以应对快速迭代‌破局方案‌:‌知识图谱(Knowledge Graph)+ 自动化测试‌本文将分享如何用知识图谱技术重构电商测试用例体系,实现:

文章图片
#重构
实战 | JMeter 典型电商场景(下单/支付)的性能压测

在上一篇文章完成首页浏览压测任务后,我们开始下单-支付场景的压测实践。

#jmeter
AI系统的“正确性”到底怎么定义?

AI 系统不是一种系统,而是一组系统形态。不同形态下,正确性的重点完全不同。AI 系统的正确性,不是输出一个唯一标准答案,而是在特定任务契约下,满足事实、证据、约束、格式、行动和风险边界。任务契约。每个 AI 能力上线前,都应该定义清楚它的任务契约。输入:需求文档、接口文档、业务规则输出:结构化测试用例列表必须满足:1. 覆盖主流程、异常流、边界值2. 不编造需求文档中不存在的功能3. 输出字段符

文章图片
#人工智能#单元测试#大数据 +3
AI系统如何做性能测试?

AI系统性能测试与传统压测的核心差异在于关注点的转变:从接口响应时间转向端到端用户体验和成本控制。测试重点包括四大核心指标:首Token响应时间(TTFT)、Token输出间隔(TPOT/ITL)、Token吞吐量(TPS)和端到端延迟(E2E Latency)。测试需覆盖接口服务、模型推理、RAG检索和Agent工具调用四层架构,针对不同AI系统类型(问答/RAG/Agent/多模态)设计差异化

文章图片
#人工智能#单元测试#学习 +4
AI 写代码开始按“油耗”收费,程序员的价值被重新算账

AI 会不会写代码?这个问题已经不够准确了。谁能把 AI 写代码这件事,用得更稳、更准、更省?因为 AI 会写代码,不代表它知道该写什么。AI 能生成方案,不代表方案一定符合业务。AI 能修改项目,不代表修改后系统一定可靠。真正有价值的人,反而是能把 AI 纳入工程流程的人。比如:能判断 AI 生成的代码是否合理;能设计验证路径;能控制上下文范围;能拆解复杂任务;能发现 AI 改错的地方;能把 A

文章图片
#人工智能#压力测试#运维 +4
AI + Playwright 自动化测试,为什么很多人卡在第一条可运行脚本?

【摘要】本文探讨了AI在生成Playwright自动化测试脚本中的应用与挑战。虽然AI降低了编码门槛,但实际落地仍面临三大痛点:测试场景描述模糊导致生成代码不可用、企业后台系统组件复杂难以定位、缺乏工程规范导致维护困难。文章提供了16套针对登录、查询、表单等典型场景的提示词模板,强调需将业务路径转化为工程化输入。同时提出五大落地规范:选择器优先使用语义化定位、合理复用登录态、统一测试数据标识、精准

文章图片
#人工智能#压力测试#单元测试 +4
面试官一句话,把很多程序员问沉默了......

面试官问“AI 写代码比你快 100 倍,你的价值在哪”,并不是想听你证明 AI 不行。他真正想看的是:你有没有理解 AI 对行业的影响;你有没有自己的职业判断;你有没有从执行者升级成问题解决者的意识。所以这道题最好的回答,不是反驳,而是升级视角。你可以平静地说:AI 可以把代码写快 100 倍,但它不会替我决定写什么、为什么写、怎么保证质量,以及上线后出了问题谁来负责。我的价值不在于比 AI 更

文章图片
#人工智能#软件工程#单元测试 +4
GPT-Image 2 + Seedance 2,普通人做短视频的门槛又被打穿了

关注 霍格沃兹测试学院公众号,回复「」, 领取人工智能测试开发技术合集最近 AI 影像圈有两个工具很值得关注。一个是 OpenAI 的,官方介绍里强调了更强的文字渲染、多语言支持和视觉推理能力;另一个是字节的,官方介绍里明确提到它采用统一的多模态音视频生成架构,支持文本、图像、音频、视频输入。这两个工具放在一起看,意义就不一样了。以前普通人做短视频,最难的是这几件事:不会拍摄。不会布光。不会剪辑。

文章图片
#音视频#人工智能#单元测试 +3
    共 671 条
  • 1
  • 2
  • 3
  • 68
  • 请选择