logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CPN|一个Anchor-free, Two-stage的目标检测器

今天和大家分享一篇ECCV2020中的目标检测论文。论文名称:Corner Proposal Network for Anchor-free,Two-stage Object Detection论文下载地址:https://arxiv.org/abs/2007.13816源码下载地址:https://github.com/Duankaiwen/CPNDet动机作者通过实验表明,Anchor-fre

#深度学习#神经网络#计算机视觉
CV计算机视觉每日开源代码Paper with code速览-2023.11.15

3.【医学图像分割:3D】Assessing Test-time Variability for Interactive 3D Medical Image Segmentation with Diverse Point Prompts。8.【多模态】One-2-3-45++: Fast Single Image to 3D Objects with Consistent Multi-View Ge

文章图片
#计算机视觉
CV计算机视觉每日开源代码Paper with code速览-2023.12.6

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,

文章图片
#计算机视觉#人脸识别
CV计算机视觉每日开源代码Paper with code速览-2023.11.27

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,7.【多模态】Anima

文章图片
#计算机视觉#超分辨率重建
CV计算机视觉每日开源代码Paper with code速览-2023.10.20

6.【医学图像分割】DA-TransUNet: Integrating Spatial and Channel Dual Attention with Transformer U-Net for Medical Image Segmentation。5.【点云分割】2D-3D Interlaced Transformer for Point Cloud Segmentation with Scen

文章图片
#计算机视觉#人工智能#目标检测
CV计算机视觉每日开源代码Paper with code速览-2023.10.31

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,

文章图片
#计算机视觉#目标检测#自动驾驶
图像分类任务ViT与CNN谁更胜一筹?DeepMind用实验证明

决定结构合理的模型的性能的最重要因素是训练时使用的计算资源和数据。尽管ViTs在计算机视觉方面的成功令人印象深刻,但没有强有力的证据表明,预训练的ViTs优于预训练的ConvNets。然而,ViTs在特定的上下文中可能具有实际的优势,例如能够跨模态使用相似的模型组件。

文章图片
#人工智能#transformer#计算机视觉
使用目标之间的先验关系提升目标检测器性能

今天跟大家分享阿姆斯特丹大学等提出的用于提升目标检测和实例分割性能的新方法RP-FEM,该方法将目标之间位置的先验关系融入到feature中。

文章图片
#计算机视觉#深度学习#目标检测 +1
CV计算机视觉每日开源代码Paper with code速览-2023.11.7

精华置顶墙裂推荐!小白如何1个月系统学习CV核心知识:

文章图片
#计算机视觉#人脸识别
CV计算机视觉每日开源代码Paper with code速览-2023.11.14

10.【多模态】Q-Instruct: Improving Low-level Visual Abilities for Multi-modality Foundation Models。7.【多模态】GPT-4V in Wonderland: Large Multimodal Models for Zero-Shot Smartphone GUI Navigation。9.【多模态】InfMLL

文章图片
#计算机视觉#目标检测#自动驾驶
    共 33 条
  • 1
  • 2
  • 3
  • 4
  • 请选择