logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

集合通信库

集合通信库(Collective Communication Library,简称 CCL)是实现的核心软件库,广泛用于分布式 AI 训练、超算集群等场景,负责多 GPU / 服务器间的高效协同数据传输。

集合通信库

集合通信库(Collective Communication Library,简称 CCL)是实现的核心软件库,广泛用于分布式 AI 训练、超算集群等场景,负责多 GPU / 服务器间的高效协同数据传输。

小白如何配置华为云的安全WAF

好嘞!既然前面的​ 都搭好了,现在咱们给这套架构穿上。

#安全#华为云#系统安全
华为数据中心交换机芯片的介绍

维度华为 (Solar + AI)传统方案 (商用芯片)核心优势软硬协同、智能无损标准化、生态开放AI 训练效率100%(通过 AI 芯片实现 0 丢包)~60-80%(受限于传统以太网拥塞)灵活性极高(全可编程,快速适配新协议)受限(依赖芯片厂商发布新版本)供应链自主可控(全栈自研)依赖外部(博通/Marvell)华为的数据中心交换机芯片战略,不是单纯追求“带宽第一”,而是通过Solar 交换芯

Atlas 900 A3 SuperPoD

前面板后面板Atlas 900 A3 SuperPoD 计算节点Atlas 900 A3 SuperPoD 计算节点是基于华为自研鲲鹏920高性能版处理器、昇腾910 AI处理器、交换芯片和CDR芯片的AI计算节点,满足行业智算中心、大企业和华为云等高性能、高能效液冷训练集群的需求,提供业界AI最佳集群方案,以算力、网络和集成度业界领先为目标,结合工程优势持续构筑AI集群硬件竞争力。

#人工智能
TD4交换机芯片

**带内遥测(In-band Telemetry)**:支持灵活的带内和流式遥测,包括IFA 2.0(In-band Flow Analyzer version 2),提供对网络流量和性能的实时监控和分析。- **带内遥测(In-band Telemetry)**:支持灵活的带内和流式遥测,包括IFA 2.0(In-band Flow Analyzer version 2),提供对网络流量和性能的

#网络
Tomahawk 3和Trident4交换机芯片的对比

**Trident 4**:采用7nm制程技术,提供更高的集成度和能效。- **Trident 4**:采用7nm制程技术,提供更高的集成度和能效。- **Trident 4**:同样支持最高12.8 Tbps的交换容量。- **Trident 4**:同样支持最高12.8 Tbps的交换容量。- **Tomahawk 3**:最高支持12.8 Tbps的交换容量。- **Tomahawk 3**

#网络
博通Jericho 系列 芯片介绍

如需具体型号的功耗或协议支持细节,可进一步探讨!,适用于骨干网、城域网和5G核心网场景。是博通(Broadcom)面向。设计的高性能芯片系列,主打。

#网络
什么是InfiniBand(IB)网络

InfiniBand(IB)是一种高性能网络通信标准,采用RDMA技术,具有高吞吐量、低延迟和高可靠性,广泛应用于数据中心、HPC和AI领域。其发展始于2000年,由IBTA联盟推动,以色列公司Mellanox成为技术领导者(2019年被英伟达收购)。IB协议采用分层架构(物理层至传输层),支持无损传输和动态流控技术。带宽从SDR演进至XDR(800G),光模块也同步升级至800G。主要产品包括交

#网络
Meta 的DDC网络架构案例分享

Meta研发的DSF网络架构专为AI训练优化,通过物理隔离与三级解耦拓扑实现高性能。核心创新包括:双域架构分离协议处理与数据转发;信元喷射技术解决负载均衡;基于信用的硬件级无损流控;分布式故障自愈机制。DSF将万卡集群网络延迟降至微秒级,但存在专用硬件依赖、扩展性受限等局限。该架构为超大规模AI训练提供了新范式,其技术理念将影响下一代网络设计方向。

#网络#架构
    共 17 条
  • 1
  • 2
  • 请选择