logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

(2026|Meta & 港大,无编码器统一多模态模型,像素空间,表示编码器,图像理解和生成)Tuna-2:像素嵌入在多模态理解和生成方面胜过视觉编码器

统一多模态模型 TUNA-2 直接在像素空间中执行多模态理解和视觉生成,无需依赖 VAE 编码器或潜在扩散。通过将统一的视觉语言主干与像素空间流匹配头相结合,TUNA-2 在单一框架内支持图像理解、文生图和图像编辑。

文章图片
#计算机视觉
(2026|ICLR|西电 & MedAI,师生蒸馏和学生自蒸馏,基于支持集图像重要性的可学习加权)D^24FAD:双蒸馏少样本异常检测

D^24FAD 是一种用于医学影像少样本异常检测的新型双蒸馏框架。通过利用预训练编码器作为教师网络,并采用一个在查询图像上蒸馏教师知识、同时在支持图像上进行自蒸馏的学生解码器,本文方法仅使用少量正常参考图像即可有效识别新任务中的异常。

文章图片
#计算机视觉#机器学习
(2025|CVPR|Meta,dino.txt,冻结 ViT,拼接类别和图像嵌入,基于对比的图文对齐,LiT)DINOv2 遇见文本:用于图像和像素的视觉语言对齐框架

本文提出 dino.txt,它成功地将一个从零训练的文本编码器与冻结的自监督视觉模型 DINOv2 对齐,从而解锁了开放词汇能力。该方法结合了无需人工标注的自监督数据筛选技术,实现了快速训练,并在零样本分类和开放词汇分割上取得了顶尖性能。

文章图片
#人工智能#深度学习#计算机视觉
(2026|ICLR|中科院自动化所,CLIP,特征记忆库/检索,使用动态提示扩展 CLIP 提示)MRAD:基于记忆驱动检索的零样本异常检测

本文探索替代主流参数化拟合的异常检测方法,即直接利用辅助数据的经验分布。基于这一思想,本文提出了 MRAD,一个统一的记忆驱动的检索框架。基础模型 MRAD-TF 在冻结的视觉骨干网络上构建两级记忆库,并通过相似度检索解决分类和分割问题。

文章图片
#计算机视觉#深度学习
(2025|ACM MM|齐鲁工大,持续学习,无监督异常检测,多模态记忆库,多模态融合,动态 Sigmoid)探索无监督连续异常检测的多模态提示方法

本文提出基于多模态提示的无监督连续异常检测框架。通过引入连续多模态提示记忆库,模型能够逐步提炼并保留跨视觉与文本领域的正常模式,有效缓解灾难性遗忘。缺陷语义引导的自适应融合机制通过自适应归一化与动态融合策略,提升了异常检测精度与定位能力。

文章图片
#计算机视觉#视觉检测
(2026|ICLR Oral|首尔大学,扩散模型,扩散线索转实例边缘,实例涌现点,自注意力边界散度,单步自蒸馏)TRACE:扩散模型是实例边缘检测器

TRACE 证明了文本到图像扩散模型天然编码了可恢复的实例结构。通过定位实例涌现点、利用自注意力提取边界、并将其压缩为快速的单步解码器,TRACE 能够实时生成锐利且连续的实例边缘,无需任何提示、点、框或掩码标注。

文章图片
#计算机视觉
从 Grounding DINO 到 DINO-X:开放集目标检测的架构演进与细节拆解

开放集目标检测正从一个 “学术任务” 逐步走向 “工业级基础能力”。从 Grounding DINO 到 DINO-X 的演进,展现了 开创性架构 + 数据驱动 + 多任务融合的清晰路径,这一系列工作为开放集目标检测领域提供了完整的技术演进范本。

文章图片
#目标检测#架构#计算机视觉
(2024|AAAI|南科大&腾讯,UCAD,持续学习,记忆库,无监督异常检测和分割,对比学习,ViT)基于对比学习提示的无监督持续异常检测

本文提出的 UCAD,一种面向任务不可知持续学习的无监督异常检测与分割方法,依赖持续提示模块和基于结构的对比学习,显著提升了持续异常检测性能。

文章图片
#目标检测#计算机视觉
(2025|ICLR|Meta,SAM2,图像/视频分割,时空掩码,记忆库,交互式提示,数据集构建)图像和视频中的 “任意分割” 功能

本文将 Segment Anything 自然地演进到视频领域,这基于三个关键方面:将可提示分割任务扩展到视频;为SAM架构配备应用于视频时的记忆能力;用于训练和基准测试的多样化SA-V数据集。

文章图片
#音视频#transformer
【未完待续】综述:用于视频分割(Video Segmentation)的深度学习

本文回顾视频分割的两条基本研究路线:视频目标分割(object segmentation)和视频语义分割(semantic segmentation)。本文介绍它们各自的task setting、背景概念、感知需求、发展历史以及主要挑战。本文详细概述相关的方法和数据集的代表性文献。本文在一些知名的数据集上对这些方法检测(benchmark)。最后,指出这些领域的opne issue以及未来的研究方

文章图片
#深度学习#人工智能
    共 172 条
  • 1
  • 2
  • 3
  • 18
  • 请选择