logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CVPR-2025 视觉-语言-动作(Vision-Language-Action, VLA)论文集+全文可视化解读

视觉-语言-动作模型(VLA)是融合视觉感知、语言理解和动作决策的多模态AI框架,实现从环境感知到行为输出的闭环决策。最新研究包括:CoT-VLA引入视觉思维链推理提升模型解释能力;MoManipVLA探索模型在移动操作中的迁移应用;SOLAMI构建社交VLA框架实现与3D角色的沉浸式交互;ShowUI开发面向GUI的视觉代理系统。这些研究通过创新架构和数据集推动VLA在机器人、人机交互等领域的应

文章图片
#人工智能#计算机视觉#深度学习 +2
ICLR2025 源码论文大全集+算法流程图+思维导图+逐篇可视化解读 (Part-2)

本文集涵盖了多篇人工智能领域的前沿研究论文,主要聚焦于以下几个方向:1)异质图中基于解耦图能量的节点分布外检测模型(DeGEM),提出针对异质图的新型OOD检测方法;2)基于随机网络蒸馏的主动模仿学习;3)针对行人检测的物理世界对抗攻击(UV-Attack);4)长上下文语言建模中困惑度指标的评估;5)多粒度视频编辑技术(VideoGrain);6)视觉语言模型(CogCoM)和大型视觉语言模型的

文章图片
#人工智能#深度学习#神经网络 +3
ICLR2025 源码论文大全集+算法流程图+思维导图+逐篇可视化解读 (Part-1)

本文摘要整理了ICLR2025会议中的多篇前沿论文,涵盖图神经网络、多模态大模型、扩散模型等多个领域。重点包括:SpaceGNN用于有限标签的节点异常检测、RetroInText框架增强逆合成规划、共享自动编码器识别神经活动子空间、基于大模型的生成推荐高效推理方法、提升CLIP可视化解释的对抗微调技术、扩散模型在稀有概念上的组合生成能力等。每篇论文均提供可视化解读链接,展示创新算法、思维导图和详细

文章图片
#人工智能#深度学习#论文阅读
人体三维重建学习笔记(SMPL / SMPL‑X / SMPLify‑X)

摘要: SMPL系列模型(SMPL/SMPL-X/SMPLify-X)是当前人体三维重建的核心方法。SMPL通过形状参数β(10维)和姿态参数θ(72维)生成可动画人体网格;SMPL-X扩展为统一的身体-手-脸模型(55关节+10,475顶点);SMPLify-X则从单图2D关键点优化求解模型参数。核心流程包括:(1)基于线性blend-shape与LBS的网格形变;(2)多阶段能量函数优化(投影

#人工智能#深度学习#神经网络 +1
ICLR2025 源码论文大全集+算法流程图+思维导图+逐篇可视化解读 (Part-2)

本文集涵盖了多篇人工智能领域的前沿研究论文,主要聚焦于以下几个方向:1)异质图中基于解耦图能量的节点分布外检测模型(DeGEM),提出针对异质图的新型OOD检测方法;2)基于随机网络蒸馏的主动模仿学习;3)针对行人检测的物理世界对抗攻击(UV-Attack);4)长上下文语言建模中困惑度指标的评估;5)多粒度视频编辑技术(VideoGrain);6)视觉语言模型(CogCoM)和大型视觉语言模型的

文章图片
#人工智能#深度学习#神经网络 +3
ICLR2025 源码论文大全集+算法流程图+思维导图+逐篇可视化解读 (Part-1)

本文摘要整理了ICLR2025会议中的多篇前沿论文,涵盖图神经网络、多模态大模型、扩散模型等多个领域。重点包括:SpaceGNN用于有限标签的节点异常检测、RetroInText框架增强逆合成规划、共享自动编码器识别神经活动子空间、基于大模型的生成推荐高效推理方法、提升CLIP可视化解释的对抗微调技术、扩散模型在稀有概念上的组合生成能力等。每篇论文均提供可视化解读链接,展示创新算法、思维导图和详细

文章图片
#人工智能#深度学习#论文阅读
ACMMM-2024 视频生成(Video Generation)相关论文6篇

文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:

文章图片
#音视频#人工智能#计算机视觉 +2
TPAMI-2025 综述文章速览

近期TPAMI期刊发表多篇人工智能领域综述文章,涵盖小样本学习、扩散模型、基础模型等多个前沿方向。其中《开放世界中的小样本学习》探讨模型在开放环境下的适应能力;3篇扩散模型相关综述分别聚焦低级视觉应用、高效实现方法和图像编辑技术;《基础模型定义视觉新纪元》分析大规模预训练模型的影响。其他研究涉及多模态学习、点云处理、图像去雨等方向,并包含多个领域基准测试,为AI技术发展提供系统性总结和未来展望。

#人工智能#深度学习#神经网络 +2
ACM SIGKDD (ACM conference on Knowledge Discovery and Data Mining)近十年研究热点追踪

ACM SIGKDD (ACM conference on Knowledge Discovery and Data Mining)近十年研究热点追踪

文章图片
#人工智能#机器学习#深度学习 +3
CVPR-2024 三维点云(3D Point Cloud)相关论文

文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接: 文章解读: 文章链接:

文章图片
#3d#深度学习#人工智能 +1
    共 16 条
  • 1
  • 2
  • 请选择