![](../../asset/images/user/BgImg_default.jpg)
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本周更新的第二篇论文阅读,2023年每周一篇博文,还剩5篇未补,继续加油~论文地址:DynaMask: Dynamic Mask Selection for Instance Segmentation:https://arxiv.org/abs/2303.07868代码地址:https://github.com/lslrh/DynaMask收录于:CVPR 2023欢迎关注,主页更多干活,持续输出
![文章图片](https://img-blog.csdnimg.cn/a93e23351f2d421bba9d4fd34438b8de.png#pic_center)
Anaconda/pip 更换为阿里源,助力 conda create -n 虚拟环境搭建
![文章图片](https://img-blog.csdnimg.cn/b8cc85e62e6343388cd6440b74972c78.png)
首先表明细胞分割对于生物分析和癌症监视有着重要作用,接着指出现有的一些挑战:大量的半透明细胞簇重叠使得彼此边界混乱;原子核拟态和碎片存在混淆(太专业的术语不好翻译)。于是本文提出一种解耦合-重组策略:De-overlapping Network (DoNet):提出一种双路径区域分割模块来显式地将细胞簇解耦合为交叉区域;提出一种重组模块来引导整合语义一致性的互补区域;
![文章图片](https://img-blog.csdnimg.cn/45ee9f2d25894210a1fcb7704988929c.png)
指代图像分割 Referring image segmentation (RIS) 旨在产生高质量的 mask,现有的方法总是需要采用迭代学习的方法,依赖于 RNNs 或堆叠的注意力层来提炼视觉-语言特征。但基于 RNN 的方法依赖于特定的编码器,基于注意力的方法收益很低。于是本文引入渐进式地学习多模态特征的方法,核心 idea 是利用一个持续更新的 query 作为目标的表示,并在每个迭代步中加
![文章图片](https://img-blog.csdnimg.cn/6944564929ee4926b7d6d1eb56d00bba.png)
本文提出基于 Transformer 的方法用于视觉定位。不像现有的先取出 proposals 后排序的方法,极度依赖于预训练的目标检测器,或者无 proposal 的框架方法,通过融合文本化的 embedding 更新一组离线的单阶段检测器。本文提出的方法Visual Grounding with TRansformers VGTR 建立在 Transformer 框架之上,独立于预训练检测器和
![文章图片](https://img-blog.csdnimg.cn/ad17a47f72e24f3fb5662f9ed31ff6a0.png)