logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何看待计算机视觉未来的走向(二)从产品的角度聊一聊

前言:上一篇从社会的角度聊了聊我对计算机视觉未来走向的看法,提出的主要观点是未来计算机视觉需要扩展应用领域,研发新产品,去更好地为社会服务。具体而言,它可以与机器人、嵌入式设备和移动端结合,因此需要做到模型小型化、专一化和轻量化。如何看待计算机视觉未来的走向在这篇,接着这个观点从产品的角度聊一聊我对计算机视觉未来走向的看法。当前计算机视觉的主要应用场合有:人脸识别、无人驾驶、安防监控等少数领域,而

#计算机视觉#神经网络#深度学习
计算机视觉中的图像标注工具总结

本文来自公众号CV技术指南资源分享系列创建高质量的数据集是任何机器学习项目的关键部分。在实践中,这通常比实际训练和超参数优化花费的时间更长。因此,选择合适的标注工具至关重要。在这里,我们总结了一些用于计算机视觉任务的最佳图像标记工具:labelme、labelImg、CVAT和hasty.ai。作者:Dmitrii编译:CV技术指南点个关注,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。

#opencv#python#计算机视觉 +1
计算机视觉中的transformer模型创新思路总结

前言本文回顾了ViT的结构,总结了计算机视觉中的transformer的主要改进思路:改进分块,改进位置编码,改进Encoder,增加Decoder。每个思路下都介绍了相关的论文,介绍了这些论文的提出出发点和改进思路。本文的目的不在于介绍transformer现在有哪些模型,而在于学习借鉴别人发现问题并改进的思路,从而在自己方向上提出合适且合理的改进。本文来自公众号CV技术指南的论文分享系列,技术

#计算机视觉#深度学习#transformer +1
libtorch教程(一)开发环境搭建:VS+libtorch和Qt+libtorch

事实上,在前面的pytorch部署博客和libtorch的QT部署中笔者已经分享了自己搭建libtorch开发环境的记录。其余并无太多要赘述的。

#深度学习#计算机视觉#人工智能
CVPR 2022 | 未知目标检测模块STUD:学习视频中的未知目标

欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。论文:Unknown-Aware Object Detection: Learning What You Don't Know from Videos in the Wild论文:https://arxiv.org/abs/2203.03800代码:https://github.com/deeplea

#目标检测#pytorch#计算机视觉 +2
CVPR2021 | 开放世界的目标检测

本文将介绍一篇很有意思的论文,该方向比较新,故本文保留了较多论文中的设计思路,背景知识等相关内容。前言:人类具有识别环境中未知对象实例的本能。当相应的知识最终可用时,对这些未知实例的内在好奇心有助于了解它们。这促使我们提出一个新的计算机视觉问题,称为:“开放世界对象检测”,其中模型的任务是:1)将尚未引入的对象识别为“未知”,无需明确监;2)在逐渐接收到相应的标签时,逐步学习这些已识别的未知类别,

#人工智能
CVPR2021| 行人搜索中的第一个anchor-free模型:AlignPS

论文地址:https://arxiv.org/abs/2103.11617代码地址:https://github.com/daodaofr/AlignPS前言:本文针对anchor-free模型用于行人搜索中会出现三个不对齐问题:Scale misalignment,Region misalignment,Task misalignment提出了相应的解决方案,进一步提出了一个更简单更有效的anc

#计算机视觉#深度学习#目标跟踪
YOLO系列梳理(三)YOLOv5

前言YOLOv5 是在 YOLOv4 出来之后没多久就横空出世了。今天笔者介绍一下 YOLOv5 的相关知识。目前 YOLOv5 发布了新的版本,6.0版本。在这里,YOLOv5 也在5.0基础上集成了更多特性,同时也对模型做了微调,并且优化了模型大小,减少了模型的参数量。那么这样,就更加适合移动端了。欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息

#计算机视觉#深度学习#目标检测 +2
特征金字塔技术总结

前言:特征金字塔是目前用于目标检测、语义分割、行为识别等方面比较重要的一个部分,对于提高模型性能具有非常好的表现。不同大小的目标都经过了相同的降采样比例后会出现较大的语义代沟,最常见的表现就是小目标检测精度比较低。特征金字塔具有在不同尺度下有不同分辨率的特点,不同大小的目标都可以在相应的尺度下拥有合适的特征表示,通过融合多尺度信息,在不同尺度下对不同大小的目标进行预测,从而很好地提升了模型的性能。

#计算机视觉#深度学习
CVPR2021 | SETR: 使用 Transformer 从序列到序列的角度重新思考语义分割

前言本文介绍了一篇CVPR2021的语义分割论文,论文将语义分割视为序列到序列的预测任务,基于transformer作为编码器,介绍了三种解码器方式,选择其中效果最好的解码器方式与transformer编码器组成了一个新的SOTA模型--SETR。论文:Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective

#transformer#计算机视觉#深度学习
    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择