
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
前言:上一篇从社会的角度聊了聊我对计算机视觉未来走向的看法,提出的主要观点是未来计算机视觉需要扩展应用领域,研发新产品,去更好地为社会服务。具体而言,它可以与机器人、嵌入式设备和移动端结合,因此需要做到模型小型化、专一化和轻量化。如何看待计算机视觉未来的走向在这篇,接着这个观点从产品的角度聊一聊我对计算机视觉未来走向的看法。当前计算机视觉的主要应用场合有:人脸识别、无人驾驶、安防监控等少数领域,而
本文来自公众号CV技术指南资源分享系列创建高质量的数据集是任何机器学习项目的关键部分。在实践中,这通常比实际训练和超参数优化花费的时间更长。因此,选择合适的标注工具至关重要。在这里,我们总结了一些用于计算机视觉任务的最佳图像标记工具:labelme、labelImg、CVAT和hasty.ai。作者:Dmitrii编译:CV技术指南点个关注,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。
前言本文回顾了ViT的结构,总结了计算机视觉中的transformer的主要改进思路:改进分块,改进位置编码,改进Encoder,增加Decoder。每个思路下都介绍了相关的论文,介绍了这些论文的提出出发点和改进思路。本文的目的不在于介绍transformer现在有哪些模型,而在于学习借鉴别人发现问题并改进的思路,从而在自己方向上提出合适且合理的改进。本文来自公众号CV技术指南的论文分享系列,技术
事实上,在前面的pytorch部署博客和libtorch的QT部署中笔者已经分享了自己搭建libtorch开发环境的记录。其余并无太多要赘述的。
欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。论文:Unknown-Aware Object Detection: Learning What You Don't Know from Videos in the Wild论文:https://arxiv.org/abs/2203.03800代码:https://github.com/deeplea
本文将介绍一篇很有意思的论文,该方向比较新,故本文保留了较多论文中的设计思路,背景知识等相关内容。前言:人类具有识别环境中未知对象实例的本能。当相应的知识最终可用时,对这些未知实例的内在好奇心有助于了解它们。这促使我们提出一个新的计算机视觉问题,称为:“开放世界对象检测”,其中模型的任务是:1)将尚未引入的对象识别为“未知”,无需明确监;2)在逐渐接收到相应的标签时,逐步学习这些已识别的未知类别,
论文地址:https://arxiv.org/abs/2103.11617代码地址:https://github.com/daodaofr/AlignPS前言:本文针对anchor-free模型用于行人搜索中会出现三个不对齐问题:Scale misalignment,Region misalignment,Task misalignment提出了相应的解决方案,进一步提出了一个更简单更有效的anc
前言YOLOv5 是在 YOLOv4 出来之后没多久就横空出世了。今天笔者介绍一下 YOLOv5 的相关知识。目前 YOLOv5 发布了新的版本,6.0版本。在这里,YOLOv5 也在5.0基础上集成了更多特性,同时也对模型做了微调,并且优化了模型大小,减少了模型的参数量。那么这样,就更加适合移动端了。欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息
前言:特征金字塔是目前用于目标检测、语义分割、行为识别等方面比较重要的一个部分,对于提高模型性能具有非常好的表现。不同大小的目标都经过了相同的降采样比例后会出现较大的语义代沟,最常见的表现就是小目标检测精度比较低。特征金字塔具有在不同尺度下有不同分辨率的特点,不同大小的目标都可以在相应的尺度下拥有合适的特征表示,通过融合多尺度信息,在不同尺度下对不同大小的目标进行预测,从而很好地提升了模型的性能。
前言本文介绍了一篇CVPR2021的语义分割论文,论文将语义分割视为序列到序列的预测任务,基于transformer作为编码器,介绍了三种解码器方式,选择其中效果最好的解码器方式与transformer编码器组成了一个新的SOTA模型--SETR。论文:Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective







