logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【每日一题】AI时代大家都要了解的GPU互联相关的总线技术

本文系统介绍了AI训练集群中GPU互联的各类总线技术。主要内容包括:1)主流互联技术(PCIe、NVLink、Infinity Fabric、以太网/InfiniBand、CXL、UALink)的性能规格、技术特点和发展趋势;2)按实际部署占有率对技术进行排序;3)研发和量产阶段的测试验证方案;4)UEC与UALink在以太网改进方面的异同及未来关系。文章指出,随着AI集群规模扩大,GPU互联技术

文章图片
#网络#嵌入式硬件#驱动开发 +3
通过近期测试简单聊一下究竟是直接选择Nvidia Spark还是4090/5090 GPU自建环境

NVIDIA DGX Spark与RTX 4090/5090性能对比分析 DGX Spark作为小型AI工作站,搭载128GB统一内存和Blackwell架构,适合本地运行大模型(70B+),但推理速度较慢。测试显示: 20B模型推理速度:RTX 5090是Spark的4倍(205tokens/s vs 49.7tokens/s) 30B模型速度:5090约是4090的2倍(4570tokens/

文章图片
#spark#大数据#人工智能 +4
【高清视频】独立式I2C/I3C/SMBUS协议分析仪物理连接和管理界面演示

本文演示了I2C/I3C/SMBUS逻辑分析仪与协议分析仪的联合使用方法,重点介绍了硬件连接、软件操作流程及应用场景。通过16路数字输入可采集低速总线信号,支持从信号级采样到协议层解析的全链路调试。演示涵盖了物理接线规范、采样参数设置、协议解码功能及数据分析方法,并针对NVMe SSD等设备提供了"飞线"连接方案。该系统适用于嵌入式开发、传感器调试等场景,能有效进行通信验证和兼

文章图片
#服务器#驱动开发#linux +3
【高清视频】英伟达PCIe 6.0 x16 网卡(800G)讲解

英伟达Mellanox CX-8 800G网卡高清解析:这款半长半高SuperNIC采用PCIe6.0x16接口,配备800G OSFP光口(支持光模块/DAC/ACC等多种连接方案)和124pin MCIO Gen5x16扩展口,可配置为800G InfiniBand或双400G以太网模式。网卡提供30pin带外管理接口,支持通过USB串口进行故障诊断,适用于AI训练、超算等高性能场景。视频详细

文章图片
#驱动开发#服务器#网络 +3
下周的2025 OCP全球峰会到底看什么?

2025年OCP全球峰会聚焦AI时代数据中心创新,重点探讨液冷散热、高速互连和可扩展架构等关键技术。会议将展示浸没式液冷、1.6Tb/s网络互连、兆瓦级机架等前沿方案,并发布CXL内存扩展、UALink互连等开放标准。作为全球最大开源硬件社区,OCP汇聚Meta、Google等400多家企业,推动数据中心从封闭走向开放协作。本次峰会特别关注AI基础设施的标准化,通过社区创新应对算力挑战,引领可持续

文章图片
#开闭原则
【高清视频】如何分析PCIe 5.0/6.0 x16 MCIO cable链路上的协议问题

本文介绍了SerialTek PCIe Gen5 Analyzer在MCIO接口测试中的实操应用。重点讲解了硬件组成(主机、AIC插卡、MCIO转板)的连接方法,特别强调必须正确连接时钟同步线。详细说明了带内信号、边带信号的接线逻辑及防反插设计,指出测试环境搭建中的多级转接方案。最关键的是指出了软件设置中Device Power必须设为Force High,以及必须正确配置Lane Mapping

文章图片
#网络#服务器#运维 +4
【高清视频】EDSFF 缩写更名背后的故事

EDSFF接口标准从"SSD"更名为"Standard",扩展支持CXL模块、OCP NIC等设备,形成统一接口生态。主要规格包括:E1.S(高性能计算)、E1.L(大容量存储)、E3.S(主流企业服务器)、E3.L(灵活配置)。新标准优化散热与能效,支持PCIe Gen6/CXL,但工作站采用滞后仍是产业短板。该变革体现了数据中心存储向统一化、高性能和低功

文章图片
#前端#人工智能#数据库 +4
【每日一题】讲讲PCIe链路训练和枚举的前后关系

PCIe设备在系统启动时的初始化流程是:所有链路必须先完成LinkTraining进入L0状态后,BIOS/UEFI才会统一进行设备枚举。这一顺序确保了完整的PCIe拓扑结构构建,包括设备识别、总线分配和资源配置。虽然热插拔和部分Switch有例外处理,但标准启动流程严格遵循"先训练后枚举"的原则。协议分析仪抓取的TS1/TS2训练序列和后续配置TLPs也验证了这一时序关系。这

文章图片
#网络#服务器#运维 +4
通过近期测试简单聊一下究竟是直接选择Nvidia Spark还是4090/5090 GPU自建环境

NVIDIA DGX Spark与RTX 4090/5090性能对比分析 DGX Spark作为小型AI工作站,搭载128GB统一内存和Blackwell架构,适合本地运行大模型(70B+),但推理速度较慢。测试显示: 20B模型推理速度:RTX 5090是Spark的4倍(205tokens/s vs 49.7tokens/s) 30B模型速度:5090约是4090的2倍(4570tokens/

文章图片
#spark#大数据#人工智能 +4
【高清视频】将PCIe 5.0 x16 GPU卡拉到服务器外10~50米?!

摘要:本视频演示了基于光纤的PCIe/CXL远端设备延伸方案,成功将PCIe5.0x16 GPU卡拉至服务器10-50米外。系统通过硬件/固件协同优化,实现"一键开机自动挂载"功能,支持CXL内存池化、GPU远程部署等应用场景。方案采用双模光模块传输,保持PCIe Gen5x16全带宽性能,远端独立供电确保安全。已验证10/20/50米链路稳定性,为AI计算、分布式训练等场景提

文章图片
#人工智能#硬件工程#驱动开发 +2
    共 20 条
  • 1
  • 2
  • 请选择