logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

多模态大模型掩码梳理笔记:因果掩码,视觉-语言任务掩码设计

多模态大模型如何针对不同的任务设计Attention Mask

文章图片
#计算机视觉
自动驾驶“大模型+端到端”整理笔记:DriveVLM(理想), Senna(地平线),EMMA(Waymo), LeapAD[NIPS2024]

VLM+端到端模型方法详解和整理:DriveVLM(理想), Senna(地平线),EMMA(Waymo), LeapAD[NIPS2024]

文章图片
多模态大模型掩码梳理笔记:因果掩码,视觉-语言任务掩码设计

多模态大模型如何针对不同的任务设计Attention Mask

文章图片
#计算机视觉
    共 48 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择