logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RL+Transformer杀疯了!新架构刷爆SOTA,CTSAC高效涨点狂揽 ICRA 2025!

扩散模型在“无痛涨点”方面取得新突破,重构效率提升3倍,抗微调水印能力显著增强。强化学习(RL)与Transformer架构的融合成为人工智能领域的前沿研究方向,结合了RL的动态决策能力和Transformer的全局依赖捕捉优势,为复杂任务下的智能体行为优化提供了新范式。这一技术被视为通往通用人工智能(AGI)的重要路径,尤其在自动驾驶、医疗诊断、金融策略等领域展现出巨大应用潜力。本文精选了8篇“

文章图片
#transformer#深度学习#人工智能
注意力机制写论文创新点不够用了?试试搭配小波变换把论文发上了Nature!

小波变换与注意力机制的结合在信号与图像处理领域展现出显著优势。小波变换提供多尺度分析能力,而注意力机制则增强模型对关键信息的感知力。这种融合在图像分割、目标检测、语音识别及时间序列分析等任务中表现出色。例如,在齿轮箱故障诊断中,小波变换用于信号预处理,结合轻量级通道注意力机制,提升了模型的鲁棒性和适应性。在飞行轨迹预测中,小波变换与编码器-解码器神经网络架构结合,通过多尺度分解捕捉全局趋势与局部细

文章图片
顶刊大热门:强化学习+Transformer,这泼天的高分思路被我接住啦!!

基于Transformer的强化学习(TRL)结合了Transformer模型的强大序列处理能力和强化学习的决策优化框架,显著提升了智能体的学习与适应能力,广泛应用于自动驾驶、机器人控制等领域。本文分享了两篇TRL代表性成果:第一篇结合扩散模型与Transformer,优化了启动子合成及强度预测,展示了模型在合成生物学中的性能优势;第二篇提出了基于随机Transformer的世界模型(STORM)

文章图片
#transformer
2025 Attention 再次炸裂!清华姚期智团队开源注意力新作,算力成本直降90%,拿下顶会!

别急,姚期智大佬团队携新型注意力机制TPA强势登场,给出了响亮答案!TPA在节省高达90%内存占用的同时,性能丝毫不受影响,有望重塑现代注意力设计的格局。如今,多头注意力机制、注意力机制融合、层次注意力机制等创新方向,正等待着科研人去探索。正如姚院士团队,巧妙改进多头注意力机制,并融入自适应注意力权重,取得令人瞩目的成果。如果你也渴望在该领域有所建树,我精心收集了,助你快速掌握最新研究动态。不想多

文章图片
#人工智能
从CoT到MCoT!NUS、港中文等发布「多模态思维链」重磅综述:迈向通用人工智能的关键一步

近日,NUS、港中文等知名高校机构联合发布重磅综述,深度解析了280篇文献。当多模态数据与复杂任务处理需求相遇,多模态思维链(MCoT)推理技术应运而生,为人工智能发展注入新活力。在机器人领域,以往多机器人协作导航存在集中式规划负担重、分散式规划通信成本高的问题。如今,MCoCoNav框架借助多模态思维链和视觉语言模型,让机器人能依据全局语义地图协作探索,提升导航效率和成功率,为室内服务机器人导航

文章图片
#人工智能
CVPR 2025 | 遥感图像目标检测最新论文曝光,每一篇都值得深扒,有想法的速冲!!!

在遥感信息处理领域,始终是等顶级学术平台的研究焦点,在灾害监测、军事侦察等关键领域发挥着重要作用。近年来,随着深度学习技术的不断革新,该领域涌现出一系列突破性成果。SuperYOLO创新性地融合光学、SAR等多模态数据,构建高分辨率检测框架,不仅大幅提升了检测精度,还将模型参数量锐减至原来的1/18,有效克服了传统模型计算复杂、漏检率高的难题。SOAR算法则巧妙结合Mamba与YOLOv9,利用长

文章图片
#人工智能
模型无痛涨点!因果机器学习疯狂收割顶会

《因果机器学习前沿进展精选综述》摘要:本文聚焦2024年因果机器学习(CausalML)领域的最新突破,精选20篇高水平论文,系统梳理了该交叉学科的理论创新与应用实践。研究显示,当前发展呈现三大趋势:1)动态因果建模技术(如CAST框架)突破传统静态分析局限,实现连续时间维度的治疗效果评估;2)多层次特征融合方法(如WHAR任务中的分层交互机制)显著提升模型解释性;3)面向OOD场景的软因果学习(

文章图片
#机器学习#人工智能
从CoT到MCoT!NUS、港中文等发布「多模态思维链」重磅综述:迈向通用人工智能的关键一步

近日,NUS、港中文等知名高校机构联合发布重磅综述,深度解析了280篇文献。当多模态数据与复杂任务处理需求相遇,多模态思维链(MCoT)推理技术应运而生,为人工智能发展注入新活力。在机器人领域,以往多机器人协作导航存在集中式规划负担重、分散式规划通信成本高的问题。如今,MCoCoNav框架借助多模态思维链和视觉语言模型,让机器人能依据全局语义地图协作探索,提升导航效率和成功率,为室内服务机器人导航

文章图片
#人工智能
从CoT到MCoT!NUS、港中文等发布「多模态思维链」重磅综述:迈向通用人工智能的关键一步

近日,NUS、港中文等知名高校机构联合发布重磅综述,深度解析了280篇文献。当多模态数据与复杂任务处理需求相遇,多模态思维链(MCoT)推理技术应运而生,为人工智能发展注入新活力。在机器人领域,以往多机器人协作导航存在集中式规划负担重、分散式规划通信成本高的问题。如今,MCoCoNav框架借助多模态思维链和视觉语言模型,让机器人能依据全局语义地图协作探索,提升导航效率和成功率,为室内服务机器人导航

文章图片
#人工智能
具身智能顶会大爆发!李飞飞新作斩获最佳论文,这波操作太秀了!

基础模型(Foundation Model, FM):用于高级认知任务,如指令理解、任务规划和推理。模块化技能库(Modular Skill Library):提供稳定的行走和灵巧操作技能。连接器(Connector):轻量级的视觉-语言模型(VLM),用于将FM的高级语言计划转换为可执行的技能命令,并协调行走和操作技能。Gemini 2.0:作为基础模型,提供多模态理解和推理能力。:扩展Gemi

文章图片
    共 19 条
  • 1
  • 2
  • 请选择