登录社区云,与社区用户共同成长
邀请您加入社区
作为敏捷开发中测试团队的一员,在微服务测试过程中,你是不是也遇到同样困惑:服务不具备独立验证能力、自动化用例开发效率很低等?华为云DevCloud API全场景测试技术来支招~围绕API的全场景,打造6大测试服务为微服务的上线质量护航,快来看看吧~【传送门】
点击这里→了解更多精彩内容
免费领 200 小时云算力,进群参与显卡、AI PC 幸运抽奖
更多推荐
深入解析 ROCm 7.x 新特性,看它如何加速大模型推理
本文深入解析 ROCm 7.x 新特性,揭示其如何通过 hipBLASLt 稀疏优化、HIP 编译器指令调度及 vLLM 异步执行流,显著提升大模型推理效率。实测显示长上下文场景延迟降低 20%,为高并发应用提供稳定高性能支持。
我的第一台 AI PC,用 Strix Halo 搭建本地知识库全过程
本文详解基于 AMD Strix Halo 搭建本地知识库的全过程。利用其统一内存架构优势,结合 Ollama 与 RAG 技术,高效完成数据清洗、向量化及高并发推理测试。文章分享实战经验与优化策略,助您打造安全可控的私有 AI 智能中枢。
显存不够用怎么办,量化与重计算策略在 vLLM 中的实战
本文详解 vLLM 在 ROCm 环境下解决显存不足的实战策略。通过 FP8 量化降低权重占用,利用激活值重计算以时间换空间,并优化 Block Size 减少碎片。这些方法显著提升 AMD GPU 上的大模型并发能力与推理效率。
扫一扫分享内容
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
所有评论(0)