logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

轻量化注意力+脉冲机制,Transformer在低功耗AI中再度进化

文章首先利用多阶段的特征提取结构,逐步聚焦并放大输入图像中的高频和关键区域,在每一阶段自适应调整注意力分布以捕捉细粒度信息。随后,作者引入动态聚焦模块,对图像内容复杂度进行评估,并针对性分配计算资源,极大提高了模型推理的性价比。最后,通过端到端训练,模型在保持较低计算成本的情况下,实现了对图像超分辨率任务的优异表现,有效提升了细节还原能力。

文章图片
#人工智能#transformer#深度学习 +3
CVPR上的多模态检索+视频理解,LLM助力提效翻倍

多模态研究正处在爆发期,从图文融合到视频、语音、传感器数据,模型能力边界不断扩展。顶会顶刊已将其视为具身智能与通用AI的核心方向。但写论文时常遇到痛点:方法多、任务杂,缺乏统一框架,选题容易显得“跟风”。未来趋势是跨模态表示的高效对齐与可解释融合,既能落地应用,也能凸显创新性。

文章图片
#人工智能#机器学习#深度学习 +2
CVPR的虚拟导演上线:可微渲染+动态场景生成,带你看AI如何自导自演动作戏

机器人行业正处于高速发展期,从智能感知、路径规划到人机协作,技术不断突破,应用场景日益拓展。无论是工业制造中的精准操作,还是医疗、服务领域的智能助手,机器人正在加速走向“泛在化”与“智能化”。这一方向不仅是人工智能、控制理论和多模态交叉的前沿,更是顶刊顶会的热点,极具科研与应用价值。

文章图片
#人工智能#机器学习#深度学习 +1
CVPR小模型创新点深度分析:小VLM化身精准向导,大模型多模态推理效率全面加速,性能突破不再依赖算力堆叠

本文针对大型VLM推理效率问题,提出了免训练的SGL框架。研究发现,小型VLM的全局注意力图可作为大型VLM的精确替代品,优于依赖局部信息的方法。其核心SGP方法利用该洞见指导剪枝,在高剪枝率下仍能保持强大性能。结合SEE提前退出机制,框架可在“简单”任务上采纳小模型预测,实现性能与效率的平衡。该方法的有效性与泛化性已在11个基准及多种模型上得到全面验证。

文章图片
#人工智能#深度学习#机器学习 +2
CVPR2025丨VL2Lite:如何将巨型VLM的“知识”精炼后灌入轻量网络?这项蒸馏技术实现了任务专用的极致压缩

小模型(Small Models)通常指参数量较小、计算与存储成本更低的深度学习模型。近年来,它们在移动端部署、边缘计算和隐私保护等场景中快速发展,逐渐成为大模型的轻量化补充。随着蒸馏、剪枝、量化等技术成熟,小模型在语音识别、图像分类等任务中已能接近甚至媲美大模型表现。但受限于容量和泛化能力,其在复杂推理、跨模态理解方面仍存在不足。

文章图片
#人工智能#机器学习#神经网络
AAAI2025:用Label敏感奖励和AI反馈,让模型看懂视频也会聊天

强化学习正处于飞速发展的黄金期,已然成为人工智能领域的关键技术。从AlphaGo的惊艳亮相,到自动驾驶的逐步落地,强化学习的身影无处不在。凭借算法的持续创新,以及与深度学习的深度融合,其在复杂任务中的表现愈发卓越

#人工智能#深度学习#学习 +1
AAAI2025:用Label敏感奖励和AI反馈,让模型看懂视频也会聊天

强化学习正处于飞速发展的黄金期,已然成为人工智能领域的关键技术。从AlphaGo的惊艳亮相,到自动驾驶的逐步落地,强化学习的身影无处不在。凭借算法的持续创新,以及与深度学习的深度融合,其在复杂任务中的表现愈发卓越

#人工智能#深度学习#学习 +1
CVPR 2025重磅:深度学习架构再进化,参数减半性能翻倍,SOTA被全面刷新

CVPR 深度学习领域的新思路层出不穷:大模型高效训练方法直接拉满算力利用率,视觉Transformer结构持续卷出新高度,多模态融合技术更是让视觉理解能力全面进化!不过可以看出,目前深度学习的研究重点依旧在算力优化、模型结构创新和多模态扩展三个方向。但对于想投顶会的同学来说,深度学习已经迈入“深水区”,除了传统优化,也需要更多跨领域的创新探索。

文章图片
#深度学习#人工智能#机器学习 +1
CVPR 2025 | 机器人操控 | RoboGround:用“掩码”中介表示,让机器人跨场景泛化更聪明

现有的模仿学习方法通常局限于特定场景,而大型视觉-语言-动作模型虽有进步,但在没有大量特定数据和微调的情况下,仍难以泛化。研究背景表明,通过引入中间表示可以为策略网络提供指导。然而,现有的中间表示存在局限性:语言指令过于粗糙,缺乏空间精度;而目标图像等细粒度表示则需要大量数据和计算资源。基于此,该论文通过引入一种兼具精细空间指导和强大泛化潜力的“接地掩码”作为中间表示,来弥补现有方法的不足,从而构

文章图片
#机器人#机器学习#计算机视觉 +3
盘点AAAI 2025 小模型的惊艳之作:全方位解读小模型如何实现技术飞跃

文章首先利用知识蒸馏技术,充分挖掘原始SAM大模型的表征能力,引导小模型学习关键特征表达。接着,通过灵活的量化策略,将模型权重和计算过程压缩至低比特,实现资源占用极小化。最后,结合优化的轻量解码器以及端到端训练,使TinySAM能在多种实际场景下以极低算力完成高精度分割任务,兼顾速度与准确率。

文章图片
#人工智能#深度学习#机器学习 +2
    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择