logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

重塑智算存储范式:绿算技术NVMe-oF芯片解决方案全景剖析

摘要:绿算技术推出"擎翼"智能存储卸载解决方案,突破AI计算中的存储瓶颈。该方案针对大模型推理场景中的KVCache存储问题,通过全硬件加速实现10微秒级延迟,相比传统方案提升40%以上性能。核心技术包括7项专项优化:硬件级QoS隔离、智能预取、GPU直连存储等,单卡支持489万IOPS和21.8GB/s带宽。典型功耗仅9.3W,可扩展单机存储至数十TB,使千亿参数模型部署成本

文章图片
#人工智能#算法
重塑智算存储范式:绿算技术NVMe-oF芯片解决方案全景剖析

摘要:绿算技术推出"擎翼"智能存储卸载解决方案,突破AI计算中的存储瓶颈。该方案针对大模型推理场景中的KVCache存储问题,通过全硬件加速实现10微秒级延迟,相比传统方案提升40%以上性能。核心技术包括7项专项优化:硬件级QoS隔离、智能预取、GPU直连存储等,单卡支持489万IOPS和21.8GB/s带宽。典型功耗仅9.3W,可扩展单机存储至数十TB,使千亿参数模型部署成本

文章图片
#人工智能#算法
别让存储拖后腿!一文看懂高性能全闪存储对大模型训练的重要性

无论是千亿参数规模的预训练模型,还是多模态场景下的复杂推理任务,其背后都需要海量数据与高强度计算资源的支撑。然而,在关注算力(如GPU/TPU集群)与算法的同时,存储系统的性能往往成为决定训练效率与成本的关键瓶颈。分布式预处理流水线:数据标注、分词、特征提取等任务需要高并发读写,全闪存储的高IOPS(每秒输入输出操作数)与低延迟可显著加速分布式框架(如Spark、Dask)的任务调度。分布式训练的

文章图片
#硬件工程#算法#fpga开发 +1
RDMA的挑战与限制

当AI算力革命与国产芯片崛起形成历史性交汇,存储技术的进化已超越单一硬件性能的竞争,升维至“计算-网络-存储”协同创新的生态之战。绿算技术以GP5000/GP6000系列为支点,通过RDMA和国产算力深度耦合,正构建一条全自主化的存储底座——在人工智能领域,它让万亿级参数模型的训练效率逼近理论极限;绿算技术这一创新技术,必将像deepSeek的爆发一样,共同带动国产AI生态的全面升级。绿算技术立足

文章图片
#缓存#大数据#云计算
轻舟系列FPGA加速卡:大模型分布式训练中的高效协同者

在大模型分布式训练中,跨设备(如多GPU或多服务器)的梯度同步(AllReduce操作)和数据分发(如Scatter、Broadcast)会产生显著的通信开销。在混合并行策略中,轻舟系列FPGA加速卡可承担部分模型并行层的计算任务(如Transformer中的注意力机制),或处理数据并行中的局部梯度计算,从而分担GPU的计算压力,实现算力资源的动态调配。未来,随着FPGA与AI框架的深度集成,其在

文章图片
#fpga开发#分布式
解锁数字世界的多样力量

数字科技蓬勃发展,芯片作为现代电子设备的核心驱动力,正以其多样化的类型和独特的功能,塑造着我们生活中的每一个角落。从智能手机的高效运作,到超级计算机的超强算力,芯片无处不在,默默推动着科技的进步与革新。今天,就让我们一同走进芯片的世界,揭开那些鲜为人知却至关重要的芯片类型,感受它们背后的科技魅力。通信芯片负责数据的传输和接收,是连接数字世界的桥梁。:集成了处理器、存储器和输入输出接口等功能,MCU

文章图片
#人工智能#云计算#html +1
绿算技术双奖临门,高密算力创新成果闪耀服贸会

2025年中国国际服务贸易交易会数字经济发展论坛9月14日在京举办,聚焦"激发数字经济新动能"主题。绿算技术作为创新企业深度参与,分享存算分离架构技术突破,并斩获"先进企业奖"和"优秀产品奖"两项殊荣。论坛汇聚政产学研各方,共议数字经济前沿趋势与创新发展。

文章图片
#人工智能#算法#大数据 +1
绿算技术与清智图灵完成产品兼容性互认证

广东绿算技术与北京清智图灵完成产品兼容性互认证,绿算全闪存储设备与清智图灵算力卡通过测试,满足高性能计算需求。清智图灵专注于AI算力解决方案,绿算技术聚焦数据应用服务。此次合作将推动双方在智能计算领域的深度协同,共同助力数字经济发展。

文章图片
#科技#大数据#人工智能
推理延迟问题突破!绿算GroundPool来拯救!

GroundPool独创共享式缓存池,多个算力设备共用同一批模型缓存,切换模型像“秒切PPT”一样快!通过优化缓存机制,让模型加载速度起飞,延迟降低50%+!它真的能有效提升DeepSeek大模型的性能,尤其是在模型部署后不再更换的场景下,效果简直不要太明显!无论你是想压榨单设备性能,还是玩转算力超卖,它都能让硬盘缓存从短板变长板!🌟 技术党们快冲,实测真的香!模型共享黑科技 多个GPU/算力卡

文章图片
#科技#人工智能#硬件架构 +1
华为昇腾×绿算全闪存缓存释放澎湃潜能

摘要: 人工智能发展依赖算力跃升,华为昇腾以高密互联与开放生态成为中国AI算力核心。然而,存算耦合架构导致数据I/O瓶颈,拉低算力效率。华为联合绿算构建"Cache双塔"方案,通过NVMe-oF协议实现冷热数据分层与模型按需加载,缩短训练启动时间,提升GPU/昇腾利用率。昇腾AI芯片与分布式存储形成"算存双环",支持千卡训练高效回写,结合CANN软硬协同优化

文章图片
#华为#科技
    共 23 条
  • 1
  • 2
  • 3
  • 请选择