logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

顶刊TMI 2025!Co-Seg++:多功能医学图像分割的互引提示引导的协作学习框架

在多种组织病理和CBCT数据集上的广泛实验表明,Co-Seg++在语义、实例和全景分割任务上均超越了当前最优方法,充分验证了协作学习方法在多功能医学图像分割中的有效性。具体而言,我们设计了空间序列提示编码器(SSP-Encoder)来捕捉远程空间和序列关系作为先验空间约束,并进一步提出多任务协作解码器(MTC-Decoder),利用跨任务引导来增强两个任务的上下文一致性,联合计算语义和实例分割掩码

#学习#人工智能
李飞飞团队新作Dream2Flow:把视频生成变成可执行的机器人动作

论文并没有给出可证明的“消除机制”,更多是通过 failure analysis 明确指出问题来源(morphing / hallucination / camera motion)并通过 prompt 工程(still camera、by one hand 等)降低发生概率(Appendix A + Fig.12 + Table III 讨论)。优势成立的条件在论文里也很清楚:上游视频必须给出足

#机器人
CCF和中国科协对NeurIPS更正投稿政策做出回应

中国学术共同体组织必将坚定捍卫国家科技发展权利和中国最广大学者公平公正权益,加快建设国际化科研基础条件平台,加快推动建立科学公正合理的学术评价体系,加快搭建便捷高效权威的学术成果等效认定机制,尽最大努力避免突发事件对我国关涉。中国计算机学会始终倡导在开放、公平的环境下开展国际学术交流,鼓励中国学术界积极参与包括 NeurIPS 在内的国际学术交流与合作,同时将积极推进学会自主和开放的国际学术交流平

学院实现TPAMI顶刊发表历史性突破

论文围绕提升自动驾驶、安防监控与应急救援等重要任务的执行能力,提出了一种融合热物理成像机制与材料属性信息的新型红外分割框架,通过系统建模多类物理成像过程,有效提升模型对复杂热红外环境的语义感知能力。本项成果不仅为热红外图像分割领域提供了新的研究视角与坚实的基准,也对提升复杂环境下智能系统的可靠感知与决策具有重要的理论价值与广阔的应用前景。此次论文的发表,充分彰显了我院在人工智能前沿领域的科研创新能

#人工智能#计算机视觉
国内提供计算机视觉(CV)算法岗位的公司名单

Summary:国内提供计算机视觉(CV)算法岗位的公司名单Author:AmusiDate:2019-01-15微信公众号:CVergithub:https://github.com/amusi/CV-Jobs国内提供计算机视觉(CV)算法岗位的公司名单(含外企和国内公司),欢迎大家到CV-Jobs中提交issues进行补充文章目录北京上海TODO北京上海TODO...

#计算机视觉#深度学习#人工智能
一文读懂卷积神经网络中的1x1卷积核

前言在介绍卷积神经网络中的1x1卷积之前,首先回顾卷积网络的基本概念[1]。卷积核(convolutional kernel):可以看作对某个局部的加权求和;它是对应局部感知,它的原理是在观察某个物体时我们既不能观察每个像素也不能一次观察整体,而是先从局部开始认识,这就对应了卷积。卷积核的大小一般有1x1,3x3和5x5的尺寸(一般是奇数x奇数)。卷积核的个数就对应输出的通道数(chan...

#深度学习
[计算机视觉论文速递] 2018-03-16

通知:本文有14篇论文速递信息,涉及目标检测、图像分割、显著性目标检测、人脸识别和GAN等方向目标检测[1]《Illumination-aware Faster R-CNN for Robust Multispectral Pedestrian Detection》Abstract:对于行人检测来说,色彩 - 热量对的多光谱图像比单一颜色通道更有效,特别是在具有挑战性的照明条件下。但是,如何有效融

ICCV 2025 | 半监督终身行人重识别范式!新旧知识协同引导的原型自强化学习突破“标注稀缺”瓶颈

为克服上述问题,论文提出了新旧知识协同引导的原型自强化(Self-Reinforcing Prototype Evolution with Dual-Knowledge Cooperation,SPRED)框架,通过可学习身份原型建模和双知识协同标签净化机制,实现了对无标签数据的高效利用与跨阶段知识积累。与之相比,我们的方法能够有效提升不同身份特征的鉴别性,从而引导模型学习正确知识,进而提升模型对

DeepMind果蝇登上Nature!强化学习再立功!AI模拟飞行,逼真到腿毛颤抖!

(k) 半透明可视化几何体的底视图,浅蓝箭头指示关节:立方体为6自由度自由关节(模拟器中自由质心运动所需,非果蝇内在自由度),箭头为铰链关节(指向正向旋转方向),三铰链关节组等效形成球关节。由于仅凭这些2D关键点的位置,无法明确推断出所有身体自由度(DoFs)的3D姿态,因此研究者采用了一种正则化的逆运动学方法,推断出所有自由度的完整3D飞行器姿态轨迹的近似值。研究团队用高分辨率的体视显微镜,详细

#人工智能
超越CFG!清华大学提出GFT:视觉模型训练新范式

点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【多模态和论文投稿】交流群添加微信:CVer2233,助手会拉你进群!扫描下方二维码,加入CVer学术星球!可获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪必备!转载自:机器之心引导采样 Classifier-Free Guidance(CFG)一直以来都是视觉生成模

#人工智能#计算机视觉#深度学习
    共 1410 条
  • 1
  • 2
  • 3
  • 141
  • 请选择