logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

在国内使用claude code,实操可行(随手记)

本文介绍了如何通过Code Router平台直接使用Claude Code进行编程。首先需要注册账号(可使用Github账号),新用户可获得200美元试用额度。注册后按照教程配置环境,Mac用户需执行提供的shell脚本安装Node.js和npm环境。该脚本会自动检测操作系统并完成前置环境准备,支持Linux和macOS系统。通过这种方式,用户无需翻墙即可体验Claude Code或Codex等大

文章图片
超节点技术深度篇六:超节点工程化技术:从无损网络、RAS 到任务级可观测性

摘要: 超节点工程化是AI基础设施稳定运行的关键,涉及可靠性分层设计(器件、链路、系统、任务)、无损网络技术(PFC/ECN/FEC等)和拓扑感知调度。故障模型需按任务影响路径分析,而非简单硬件状态。华为、中兴、H3C报告指出,超节点运维需融合硬件监控与训练指标,实现秒级故障隔离与自愈。重点包括:通过RAS机制应对万级处理器故障常态,通过训前巡检降低环境风险,以及调度器需理解模型并行结构(TP/E

文章图片
#人工智能
超节点技术深度篇四:MoE 与在网计算:从专家路由、All-to-All 到交换芯片卸载

摘要 本文基于华为、中兴、H3C的技术报告,深入分析MoE(混合专家)模型在超节点系统中的通信瓶颈。MoE通过动态路由token到不同专家子网络,虽然节省计算量,但引入了复杂的All-to-All通信问题。关键发现包括: 单层MoE至少包含Dispatch和Combine两段跨设备通信路径; EP(专家并行)扩大后,专家计算压力下降,但token交换量增加,热点专家会导致网络拥塞和尾时延; 超节点

文章图片
#人工智能
超节点技术深度篇三:大模型并行通信拆解:DP、TP、PP、EP、CP 到底在网络里发生了什么

DP 关注大流量归约和分层通信。TP 关注层内高频低时延。PP 关注阶段通信和流水线气泡。EP 关注 All-to-All、热点和尾时延。CP/SP 关注长序列下通信、缓存和内存协同。超节点的价值,就是让训练平台可以把这些通信放到合适的网络层里,而不是让所有流量都挤在同一张网络上。

文章图片
#人工智能#网络
技术深度篇二:超节点里的统一内存编址:从 RDMA、DMA 到 Load/Store 语义

超节点技术推动统一内存编址与资源池化发展 摘要:本文基于华为、中兴、H3C的技术报告,分析了超节点架构中统一内存编址的关键技术演进。超节点通过超大带宽(提升15倍)和超低时延(降至200纳秒)互联,实现了从高速通信到统一地址空间的跨越。报告指出,统一内存编址需要解决地址层(全局寻址)、访问层(DMA/RDMA/Load-Store多语义)和管理层(资源调度)三大问题。CXL技术在此过程中扮演重要角

文章图片
#人工智能
超节点技术深度篇一:超节点的 Scale-Up 互联到底解决了什么?从 HBD、拓扑到带宽墙

摘要 本文探讨了AI超节点中Scale-Up互联的技术价值,指出传统Scale-Out集群在处理大模型高频通信时的局限性。超节点通过构建高带宽域(HBD),将强耦合通信(如张量并行、专家并行)限制在机柜级紧耦合系统内,缓解跨服务器网络的带宽断层问题。分析表明,评估Scale-Up方案需综合考量单卡带宽、时延、拓扑跳数、收敛比等指标,而非仅关注总带宽。华为、中兴、H3C的技术报告均强调,超节点的核心

文章图片
#人工智能
超节点技术深度篇一:超节点的 Scale-Up 互联到底解决了什么?从 HBD、拓扑到带宽墙

摘要 本文探讨了AI超节点中Scale-Up互联的技术价值,指出传统Scale-Out集群在处理大模型高频通信时的局限性。超节点通过构建高带宽域(HBD),将强耦合通信(如张量并行、专家并行)限制在机柜级紧耦合系统内,缓解跨服务器网络的带宽断层问题。分析表明,评估Scale-Up方案需综合考量单卡带宽、时延、拓扑跳数、收敛比等指标,而非仅关注总带宽。华为、中兴、H3C的技术报告均强调,超节点的核心

文章图片
#人工智能
超节点文章 6:超节点走向智算中心:液冷、供电、运维和 AI 工厂

本文基于华为、中兴、H3C三份技术报告,探讨超节点在智算中心落地面临的系统性挑战。超节点不仅是GPU/NPU的堆砌,而是涉及算力层、互联层、工程层、软件层、运维层和成本层的整体解决方案。高密度算力推动液冷成为标配,供电系统需升级至高压直流,整柜交付要求机房改造。运维体系需从被动修复转向主动预防,RAS能力直接影响训练成本。最终,AI生产将从项目制转向标准化Token输出,竞争核心将聚焦单位Toke

文章图片
#人工智能
超节点文章 5:华为、中兴、H3C 三份报告对比:超节点路线到底有什么不同?

三份报告都讲超节点,但定义侧重点不同。报告定义侧重可以怎样理解华为AI 时代核心计算单元超节点是突破单机边界、支撑大模型训练推理的新型算力单元中兴高带宽域 HBD超节点是通过高速互联和专用交换芯片构建的紧耦合 GPU 协同域H3C机柜级紧耦合算力单元超节点是资源池化、统一内存语义和一体化基础设施构成的系统华为的定义偏产业和体系结构。它强调超节点把数十、数百甚至更多 AI 处理器组织成一个逻辑统一的

文章图片
#人工智能
超节点文章 4:MoE、长上下文与智能体:哪些 AI 负载最需要超节点?

**摘要:本文基于华为、中兴、H3C的技术报告,探讨超节点技术在AI任务中的适用场景。研究表明,超节点并非适用于所有AI任务,而是更适合通信密集、内存密集、并行关系复杂且对延迟敏感的负载场景。文章重点分析了MoE模型、长上下文推理、PD分离架构和智能体应用等典型场景如何放大超节点的价值,指出超节点通过高带宽互联和资源池化能力,能有效解决GPU/NPU间的协同效率问题。同时强调超节点规模需平衡性能收

文章图片
#人工智能
    共 72 条
  • 1
  • 2
  • 3
  • 8
  • 请选择