logo
publist
写文章

简介

首个存内计算开发者社区,基于知存科技领先的存内技术,涵盖最丰富的存内计算内容,以存内技术为核心,史无前例的技术开源内容,囊括云/边/端侧商业化应用解析以及新技术趋势洞察等, 邀请业内大咖定期举办线下存内workshop,实战演练体验前沿架构;从理论到实践,做为最佳窗口,存内计算让你触手可及。传送门:https://bbs.csdn.net/forums/computinginmemory?category=10003;

擅长的技术栈

可提供的服务

暂无可提供的服务

存内计算对大语言模型推理的加速

大语言模型的表现往往遵循扩展法则,但是对于某些能力,只有当语言模型规模达到某一程度才会显现,这些能力被称为“涌现能力”,代表性的涌现能力包括三点:其一是具备上下文学习能力,可以通过完成输入文本的词序列来生成测试实例的预期输出,而无需额外的训练或梯度更新;本篇文章集中讨论了存内计算技术在加速大语言模型推理方面的潜力,从大语言模型的背景知识出发,探讨目前其面临的挑战,进而剖析两篇经典的文献以彰显存内计

文章图片
#语言模型#人工智能#自然语言处理 +1
社区主题征文——「异构融合与存算一体:架构探索与创新实践」算力技术征文

存算一体开发者社区发起异构计算与存算一体技术征文活动,面向AI、大数据等领域开发者,旨在构建高质量技术知识库。活动设两个赛道:CPU-GPU异构计算实战(含入门与进阶方向)和存算一体架构创新(含入门与进阶方向)。要求参赛作品原创首发,3000-8000字,结构完整,逻辑清晰。优秀文章将获得现金奖励(300-500元/篇)及多渠道推广机会。投稿截止2025年12月1日,期待分享架构设计、实战经验与创

#架构#人工智能#深度学习
存算突破与智能前沿 | 七月开发者月报

中国科研团队在存算一体AI芯片领域取得多项突破。北大团队首创存算一体排序架构,解决传统架构在非线性排序中的效率问题;复旦与绍芯实验室联合推出两款AI芯片,分别针对LLM离群值适配和片上训练需求;北航团队则通过近似计算等方法,研制出两款高能效芯片,最高能效达3048TOPS/W。这些创新成果将为人工智能应用提供更强大的算力支持。

文章图片
#人工智能#科技
存算一体架构在空间计算中的应用

摘要:空间计算作为融合物理与数字世界的前沿技术,面临算力与功耗的挑战。本文探讨存算一体(CIM)架构如何通过硬件创新解决这一问题:1)分析空间计算的核心需求(感知定位、3D重建、多模态交互);2)揭示传统冯·诺依曼架构的瓶颈;3)以英伟达Cosmos和世界模型为例,阐述存算一体在降低数据中心能耗(减少60%数据搬运耗能)和边缘计算(如自动驾驶芯片实现256TOPS/35W)中的应用优势。研究表明,

文章图片
#架构#人工智能#机器学习 +2
具身智能,存内计算芯片应用新赛道

存内计算芯片通过器件、架构、电路、工艺的协同创新,突破了冯诺依曼架构的限制以实现高能效比。例如,在实时语音转写应用方面,具身智能通常在本地实时地进行语音转写和处理,不仅减少了延迟还实现了更加丰富和多样化的交互体验,与此相比传统的人工智能依赖于预训练的数据,在面对实时变化的环境时难以快速反应。具身智能作为人工智能的下一个浪潮,相比传统的工业机器人、协作机器人等,其有着智能化程度高、工作场景限制小、能

文章图片
#机器学习#神经网络#AIGC +3
AI计算提效关键。自适应弹性加速,基于存算架构做浮点运算

本文探讨了自适应弹性加速技术在提升芯片能效比方面的应用。该技术通过动态调整计算资源、功耗模式和硬件功能,实现性能与功耗的优化平衡。在资源层面,异构计算(如ARM的DynamIQ技术)实现核心的动态调度;功耗层面,精细化电源管理(如苹果M系列芯片)实现毫瓦级控制;功能层面,可重构硬件(如FPGA)支持多模态加速。此外,文章还分析了浮点存内计算的自适应精度和可重构功能优势,指出其能效提升潜力,但也面临

文章图片
#人工智能#深度学习
存算突破与智能前沿 | 七月开发者月报

中国科研团队在存算一体AI芯片领域取得多项突破。北大团队首创存算一体排序架构,解决传统架构在非线性排序中的效率问题;复旦与绍芯实验室联合推出两款AI芯片,分别针对LLM离群值适配和片上训练需求;北航团队则通过近似计算等方法,研制出两款高能效芯片,最高能效达3048TOPS/W。这些创新成果将为人工智能应用提供更强大的算力支持。

文章图片
#人工智能#科技
具身智能,存内计算芯片应用新赛道

存内计算芯片通过器件、架构、电路、工艺的协同创新,突破了冯诺依曼架构的限制以实现高能效比。例如,在实时语音转写应用方面,具身智能通常在本地实时地进行语音转写和处理,不仅减少了延迟还实现了更加丰富和多样化的交互体验,与此相比传统的人工智能依赖于预训练的数据,在面对实时变化的环境时难以快速反应。具身智能作为人工智能的下一个浪潮,相比传统的工业机器人、协作机器人等,其有着智能化程度高、工作场景限制小、能

文章图片
#机器学习#神经网络#AIGC +3
存内架构IR-DROP问题详解-电容电导补偿

对于更复杂的电路,如广义逆电路,ConCom 方法同样适用,通过在左右阵列中进行行和列的电导补偿,实现电路输入节点的负载平衡,从而解决线性方程组问题。在 MMVM 电路中,通过确定补偿电导的值,使每个位线(BL)的电阻负载相等,可使电路可作为构建模块用于解决更复杂的问题,如基于局部竞争算法(LCA)的压缩感知(CS)恢复电路,通过将 MMVM 电路与模拟反相器、跨阻放大器(TIA)和软阈值模块相结

文章图片
#人工智能#嵌入式硬件#架构 +1
功耗降低近40%,存内计算芯片助力导览行业AI新突破

导游讲解器的降噪,一般指的是使用指向性的麦克风、带有降噪功能麦克风、双麦降噪等传统的降噪方式,受声源与麦克风距离、讲解环境的影响大,还经常突出齿音等瑕疵。在远距离条件下人声拾音音质依然饱满清晰,无需外接麦克风。外形设计的迭代,智能降噪、远距离拾音的效果提升,让客户新一代产品不仅在旅游、企业接待等场景能够更好地服务用户,还能够适用于会议同声传译、大型展览展会接待、户外活动及培训等场景中。未来,随着技

文章图片
#人工智能#深度学习#机器学习 +2
    共 120 条
  • 1
  • 2
  • 3
  • 12
  • 请选择