logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

NVIDIA H100与GH200选型指南:AI与HPC负载的硬件适配方案

H100与GH200并非替代关系,而是针对不同负载场景的互补方案:●H100是一款平衡型通用加速器,在训练、微调、推理等多种场景中表现稳定,计算密度高且部署灵活,是当前大多数AI与HPC负载的优选方案。●GH200是一款针对性极强的系统级解决方案,聚焦内存密集、CPU-GPU协同紧密的细分场景,能够突破传统分离式架构的瓶颈,为特殊负载提供更优性能。

文章图片
#人工智能#服务器#深度学习 +4
以太网能否取代InfiniBand?AI时代网络架构之争全面升级!

随着大模型训练与推理规模的快速膨胀,网络互联架构已成为算力基础设施的核心瓶颈之一。以太网(Ethernet)与InfiniBand(IB)作为两种主流高性能互连方案,正朝着不同路径进化,同时也在逐步靠近。

文章图片
#人工智能#网络#架构 +4
超微2U高密度服务器AS-2126HS-TN评测(双AMD EPYC 9005 Turin)

超微基于AMD Turin架构的双路A+服务器AS-2126HS-TN——这款2U机型主打“超高核心数负载支持”与“灵活PCIe扩展”,瞄准企业级虚拟化、软件定义存储、AI推理、HPC等场景。

文章图片
#服务器#运维#人工智能 +4
国产大模型新王者?Qwen3全面升级,引爆开源竞速!

阿里通义千问近日宣布更新旗舰版Qwen3模型,专注"快思考"的Instruct模型,追求的是在指令遵循、文本理解和知识问答等任务上实现更快、更准,实现更极致的性能表现。

文章图片
#开源#人工智能#架构 +3
GB300加速推进,RTX 50显卡芯片量产延后,NVIDIA面临新的挑战与机遇

AI硬件市场正处于快速变化的时期,GB200未达预期、GB300的加速推进、CoWoS技术瓶颈、RTX 50系显卡量产延后以及ASIC AI的崛起,都在共同塑造着未来的竞争格局。尽管NVIDIA在GPU市场仍占据主导地位,但随着DeepSeek等新兴技术的崛起以及ASIC硬件的竞争,NVIDIA将面临更多的挑战。为了继续巩固其市场地位,NVIDIA必须加速产品创新,尤其是在专用AI硬件的研发和优化

文章图片
#人工智能#深度学习#服务器 +1
OpenAI 时隔多年再开源!GPT-OSS 120B/20B 发布,支持本地部署,消费级 GPU 即可运行

与 LLaMA3、Qwen2 等开源模型相比,GPT-OSS 在模型精度、工具能力、可用性方面具备一定优势。更重要的是,它标志着 OpenAI 正式补齐了从 API 到开源模型的“全栈生态拼图”,并展现了其在硬件优化和模型压缩方面的工程能力。

文章图片
#开源#架构#人工智能 +3
AMD MI430X芯片震撼发布:首发HBM4内存,性能直指AI算力王座!

自推出Instinct MI300系列以来,AMD团队一直在重塑其AI硬件产品组合,并在多个关键领域取得进展,包括架构改进、集成业界领先的组件以及实现高端能效表现。

文章图片
#人工智能#架构#服务器 +2
2024年中国CPU赛道TOP 20:国产力量崛起,引领科技新篇章

2024年,国产CPU在技术创新与市场拓展上一路高歌猛进,各企业百花齐放,均展现出强大的发展韧性与创新实力。我国致力于CPU的自主可控,虽道阻且长,但行则将至。随着2025年的即将到来,国产CPU行业即将迎来新的发展目标,相信这些CPU品牌可以在国产化大潮下,鲲鹏展翅,巩固发展,在市场化道路上越走越远。

文章图片
#科技#服务器#人工智能 +2
英伟达 GTC DC25 全景解读:从 AI-原生 6G 到 Vera Rubin 超级芯片,AI 生态的下一阶段

从 Vera Rubin 到 DRIVE Thor,从 AI-原生 6G 到数字孪生工厂,GTC DC25 展示了 AI 正在从“模型革命”迈向“系统革命”。AI 不再只是算法的竞争,而是算力、连接与应用协同的生态重塑。

文章图片
#人工智能#服务器#深度学习 +4
砍价40%!英伟达中国特供B40显卡突袭:绕开美国禁令的黑科技是?

据路透社报道,在Hopper架构的H20加速器被中国禁售后,英伟达计划于今年推出基于Blackwell架构的新产品,价格更低。大规模生产预计于6月启动,中国市场可能在第三或第四季度全面铺货。尽管技术细节尚未完全披露,但已有部分关键信息浮出水面。

文章图片
#科技#人工智能#服务器 +2
    共 55 条
  • 1
  • 2
  • 3
  • 6
  • 请选择