logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2023 Mask R-CNN 改进:DynaMask: Dynamic Mask Selection for Instance Segmentation 论文笔记

本周更新的第二篇论文阅读,2023年每周一篇博文,还剩5篇未补,继续加油~论文地址:DynaMask: Dynamic Mask Selection for Instance Segmentation:https://arxiv.org/abs/2303.07868代码地址:https://github.com/lslrh/DynaMask收录于:CVPR 2023欢迎关注,主页更多干活,持续输出

文章图片
#论文阅读#人工智能#机器学习
Anaconda/pip 更换阿里源,助力 conda create -n 虚拟环境搭建

Anaconda/pip 更换为阿里源,助力 conda create -n 虚拟环境搭建

文章图片
#pip
细胞实例分割:DoNet: Deep De-overlapping Network for Cytology Instance Segmentation 论文阅读笔记

首先表明细胞分割对于生物分析和癌症监视有着重要作用,接着指出现有的一些挑战:大量的半透明细胞簇重叠使得彼此边界混乱;原子核拟态和碎片存在混淆(太专业的术语不好翻译)。于是本文提出一种解耦合-重组策略:De-overlapping Network (DoNet):提出一种双路径区域分割模块来显式地将细胞簇解耦合为交叉区域;提出一种重组模块来引导整合语义一致性的互补区域;

文章图片
#论文阅读#人工智能#图像处理
RIS 系列 Semantics-Aware Dynamic Localization and Refinement for Referring Image Segmentation 论文阅读笔记

指代图像分割 Referring image segmentation (RIS) 旨在产生高质量的 mask,现有的方法总是需要采用迭代学习的方法,依赖于 RNNs 或堆叠的注意力层来提炼视觉-语言特征。但基于 RNN 的方法依赖于特定的编码器,基于注意力的方法收益很低。于是本文引入渐进式地学习多模态特征的方法,核心 idea 是利用一个持续更新的 query 作为目标的表示,并在每个迭代步中加

文章图片
#论文阅读#transformer#计算机视觉
REC 系列 Visual Grounding with Transformers 论文阅读笔记

本文提出基于 Transformer 的方法用于视觉定位。不像现有的先取出 proposals 后排序的方法,极度依赖于预训练的目标检测器,或者无 proposal 的框架方法,通过融合文本化的 embedding 更新一组离线的单阶段检测器。本文提出的方法Visual Grounding with TRansformers VGTR 建立在 Transformer 框架之上,独立于预训练检测器和

文章图片
#论文阅读#transformer#深度学习
暂无文章信息