
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
CMX G3.5 存储平台为文生视频业务提供了全新的加速路径——它不是简单"更快的硬盘",而是专为 AI 推理 KV 缓存设计的、深度整合到计算和网络体系中的智能上下文内存平台。它不再试图替代传统存储,而是作为一个“上下文内存池”,填补了GPU HBM(G1)和传统共享存储(G4)之间的鸿沟。收益:并发能力提升2.5-4.0倍,GPU利用率从30-40%飙升至75-90%,KV存储需求节省50-7

本分析从核心架构原理出发,逐层穿透至具体业务场景,对比两种方案在延迟模型、数据路径、GPU协同等维度的本质差异,为英伟达万卡集群(的存储选型提供决策依据。GPU→CUDA API→内核NVMe/RDMA驱动→VFS层→客户端→网络传输→服务端→本地文件系统→块I/O调度器→NVMe驱动→ SSD。需包含:GPU发起请求→CUDA驱动→RDMA发送→网络传输→DPU处理→NVMe访问→返回,实际应为

本分析从核心架构原理出发,逐层穿透至具体业务场景,对比两种方案在延迟模型、数据路径、GPU协同等维度的本质差异,为英伟达万卡集群(的存储选型提供决策依据。GPU→CUDA API→内核NVMe/RDMA驱动→VFS层→客户端→网络传输→服务端→本地文件系统→块I/O调度器→NVMe驱动→ SSD。需包含:GPU发起请求→CUDA驱动→RDMA发送→网络传输→DPU处理→NVMe访问→返回,实际应为

RTX Spark超级芯片正式发布——1 PetaFLOP算力、128GB统一内存、可本地运行1200亿参数大模型,宏碁、华硕、戴尔、惠普、联想、微软、微星七大厂商将于今秋推出首批机型。但对于真正搞AI开发的工程师和研究者来说,他们手里的“心头好”并不是RTX Spark,而是 NVIDIA DGX Spark——搭载GB10超级芯片的桌面级AI超算,拥有同等1 PetaFLOP算力,但软件栈更完

NPU作为AI计算的专用引擎,正在改变人工智能技术的实现方式。它通过硬件加速和算法优化,显著提升了神经网络的计算效率。随着AI技术的不断发展,NPU技术也在快速演进。你对NPU的哪些功能或技术最感兴趣?欢迎在评论区留言讨论!下期我们一起学习MCU!

摘要:绿算技术推出"擎翼"智能存储卸载解决方案,突破AI计算中的存储瓶颈。该方案针对大模型推理场景中的KVCache存储问题,通过全硬件加速实现10微秒级延迟,相比传统方案提升40%以上性能。核心技术包括7项专项优化:硬件级QoS隔离、智能预取、GPU直连存储等,单卡支持489万IOPS和21.8GB/s带宽。典型功耗仅9.3W,可扩展单机存储至数十TB,使千亿参数模型部署成本

摘要:广东省绿算技术、美国Chelsio和苏州紫山龙霖签署战略合作协议,共同构建AI算力基础设施技术底座。三方将整合存储硬件、DPU芯片和全局数据平台技术优势,聚焦智能存储架构、边缘计算解决方案及行业标准化建设,重点布局智算中心、智能制造和金融智算三大场景。此次合作将打通"芯片+硬件+系统"全技术栈,解决行业算力瓶颈问题,推动智算产业升级发展。(149字)

摘要: 人工智能发展依赖算力跃升,华为昇腾以高密互联与开放生态成为中国AI算力核心。然而,存算耦合架构导致数据I/O瓶颈,拉低算力效率。华为联合绿算构建"Cache双塔"方案,通过NVMe-oF协议实现冷热数据分层与模型按需加载,缩短训练启动时间,提升GPU/昇腾利用率。昇腾AI芯片与分布式存储形成"算存双环",支持千卡训练高效回写,结合CANN软硬协同优化

摘要:广东省绿算技术有限公司基于华为昇腾AI大模型推出高性能全闪硬盘缓存设备,有效提升AI训练与推理场景的数据处理效率。该设备通过极速数据加载和KVCache分布式管理,显著减少算力闲置,降低延迟,实现算力资源优化。作为IT基础设施解决方案供应商,绿算技术与华为深化合作,共同推动人工智能领域发展,为客户提供高效稳定的计算服务,助力中国AI产业进步。(149字)

杭州绿算公司主办的"企业协同创新与赋能新时尚沙龙"在上城区成功举办。活动汇聚政企学研多方代表,围绕AI赋能产业展开深入探讨。专家们从全球化布局、算力基建、硬件加速等维度分享前沿技术,主办方重点介绍了突破显存限制的创新方案。活动搭建了产学研合作平台,推动AI技术与产业深度融合,助力企业数字化转型。








