logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

本周大模型新动向:渐进渲染蒸馏技术突破,联邦智能新进展!

此外,为了提高操作效率和降低延迟,开发了高效的模型协作推理框架,包括去中心化的水平协作、云-边缘-端的垂直协作以及多接入协作。最后,概述了若干开放性挑战和研究机会。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的

本周大模型新动向:KV缓存混合精度量化、个体时空行为生成、个性化问答

此外,推理LM的一个关键用例是作为教师,用于蒸馏新的学生模型和启动未来的RL迭代,而不是直接部署。基于这些考虑,本文引入了一个新框架,通过训练一类新的强化学习教师(RLTs),专注于产生最有效的下游蒸馏效果,从而避免了RL的探索挑战。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,

#缓存
ICLR‘25 | 彩票LLM假说:重新思考压缩LLM需要保留的关键能力

同时假设存在较小的语言模型(g_{\phi}),在推理算法(\mathcal{A})的辅助下,(\mathcal{A})可涉及对(g_{\phi})的一次或多次调用,并结合外部知识库(\mathcal{D})、外部工具(\mathcal{C})和外部记忆(\mathcal{M})等,使得(P(f_{\theta}(q),\mu)\leq P(\mathcal{A}在移动设备、边缘计算等资源紧张的场

论文解读 | AAAI'25 Cobra:多模态扩展的大型语言模型,以实现高效推理

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!点击阅读原文观看作者讲解回放!个人信息作者:赵晗,浙江大学-西湖大学联合培养博士生内容简介近年来,在各个领域应用多模态大语言模型(MLLMs)取得了显著的成功。然而,作为许多下游任务的基础模型,MLLMs通常包含著名的Transformer网络,其计算复杂度呈二次方增长,效率较低。在本文中,我们介绍了一种基于状态空间模型构建的多模态大规..

#语言模型#人工智能#自然语言处理
ICLR‘25 Spotlight | 模型剪枝新方法 LLM-Streamline

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。,在尽量保持模型准确度的前提下减少模型的大小,提高模型的计算速度。已有的结构化剪枝方法主要在宽度层面进行剪枝,亦即对隐藏状态大小、注意力头数或注意力维度进行剪

#剪枝#人工智能#算法 +2
大模型新动向!探索动态推理、压缩蒸馏、个性化联邦学习的前沿

在减少大型语言模型(LLMs)的规模的同时保持其性能的挑战已经引起了广泛关注。在本文中,作者提出了一种新颖的方法,即个性化联邦学习与图注意力网络(pFedGAT),它捕获客户端之间的潜在图结构,并动态确定每个客户端对其他客户端的重要性,从而实现对聚合过程的细粒度控制。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链

#人工智能
AAAI 2026 | 中科大团队推出LLM终身学习新范式:不仅要改得准,还要改得稳!

但是与理想中不同,虽然现有的编辑方法在少量知识更新场景中展现出了优异的效果,研究人员已经发现当对模型进行连续、大量的编辑时,模型不仅记不住新的知识,甚至会丧失语言能力,产生崩溃问题。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,

#学习
直播预告 | Meta 实习博士新成果!REFRAG 框架让 RAG 推理加速 30.85 倍

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾800场活动,超1000万人次观看。欢迎关注 AI TIME 论道 Bilibili 观看更

论文推荐|视频生成别再死磕算力了!Sparse VideoGen2 靠语义感知重排序,稀疏注意力狂飙

即便有了语义聚类与重排序,关键token的数量也不能无限制增长。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。针对GPU的计算特性,设计了支持可变块大小的稀疏注意力kernel,配合高效的批量k-mean

#人工智能#机器学习
CVPR 2025 Highlight | Galaxy Walker天文学大模型:让VLM理解真实的宇宙几何

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。在每个空间里构建近邻关系图,有趣的是,同样的星系在不同几何空间中会形成不同的邻接模式。,一个几何感知的视觉语言模型,通过整合球面空间(行星轨道)、双曲空间(黑

#人工智能
    共 280 条
  • 1
  • 2
  • 3
  • 28
  • 请选择