
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
AMD EPYC 9575F凭借64个Zen 5核心、5.0GHz最高加速频率以及12通道DDR5-6000/6400内存支持,成为GPU/AI服务器的领先选择。在相同八卡NVIDIA H100 GPU配置下,该处理器在超微AI服务器中作为主机CPU持续提供优于英特尔至强铂金8592+的性能表现。

英伟达最新发布的Rubin CPX专用加速器,通过专注于预填充阶段计算优化实现了推理领域的突破性创新,只有通过为推理中截然不同的两个阶段——预填充和解码(decode)——配备专用硬件,解耦式服务(disaggregated serving)才能充分发挥其潜力。

MLPerf v5.1 AI推理基准测试对决:NVIDIA Blackwell Ultra GB300 AMD Instinct MI355X成为焦点

2023年的MI300X/300A,2024年的MI325X,2025年的MI350X/MI355X,2026年就是MI400系列。继续向前,2027年,AMD还将推出再下一代的MI500系列,升级台积电14A 1.4nm工艺,搭配代号Verano的再下一代EPYC处理器,应该会升级到Zen7架构了!

在本次内容中,我们将审视HBM的现状、供应链的动态以及未来正在发生的突破性变革。同时将审视HBM在AI加速器架构中的关键作用、HBM对DRAM市场的影响,以及它为何正在颠覆内存市场分析的方式。

在数据中心GPU领域,以H100为代表的纯计算卡专注于极致AI算力却完全舍弃图形加速能力;而传统专业视觉显卡又难以承载现代推理任务和新兴AI图形应用的需求。L40S的推出,恰恰为合成数据生成、多模态AI开发以及需要并行处理计算与图形任务的Omniverse应用提供了理想解决方案。

在数据中心GPU领域,以H100为代表的纯计算卡专注于极致AI算力却完全舍弃图形加速能力;而传统专业视觉显卡又难以承载现代推理任务和新兴AI图形应用的需求。L40S的推出,恰恰为合成数据生成、多模态AI开发以及需要并行处理计算与图形任务的Omniverse应用提供了理想解决方案。

50系显卡(RTX 5090 / RTX 5080)凭借革命性的架构,在AI推理与科研应用中展现出显著优势。我们针对不同性能需求和预算场景,提供基于这两款旗舰GPU的整机解决方案。

Gartner近期更新了《2025年人工智能技术成熟度曲线》,焦点正从生成式人工智能(GenAI)的炒作转向负责任地构建基础性创新。

阿里通义千问近日宣布更新旗舰版Qwen3模型,专注"快思考"的Instruct模型,追求的是在指令遵循、文本理解和知识问答等任务上实现更快、更准,实现更极致的性能表现。
