logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于 EasyOCR 微调 CRAFT 文本检测模型

点击下方卡片,关注“小白玩转Python”公众号EasyOCR 中的 CRAFT 模型(用于文本检测的字符区域感知)用于检测图像内文本的边界框。然后,这些边界框被发送到 EasyOCR 的文本识别器模块,以读取每个图像中的文本。CRAFT 模块和文本识别器共同构成了 EasyOCR 的管道。在上一篇文章中,我向我们展示了如何微调文本识别器模块,而本文将重点介绍如何微调 EasyOCR 的 CRAF

#深度学习#python#机器学习 +2
图像配准:基于 OpenCV 的高效实现

在这篇文章中,我将对图像配准进行一个简单概述,展示一个最小的 OpenCV 实现,并展示一个可以使配准过程更加高效的简单技巧。什么是图像配准图像配准被定义为将不同成像设备或传感器在不同时间和角度拍摄的两幅或多幅图像,或来自同一场景的两幅或多幅图像叠加起来,以几何方式对齐图像以进行分析的过程(Zitová 和 Flusser,2003 年)。百度百科给出的解释图像配准:图像配准(Image regi

#opencv#计算机视觉#python +2
构建人脸识别应用程序的两种思路:基于Python、OpenCV、Transformers和Qdrant

人脸识别应用程序工作流程方法一:使用Python、OpenCV和Qdrant进行人脸识别人脸识别技术已经成为一股无处不在的力量,正在重塑安全、社交媒体和智能手机认证等行业。在本博客中,我们深入探讨了人脸识别领域,携带着强大的Python、OpenCV、Image Embedding和Qdrant这三大工具。加入我们,一起揭开创建强大人脸识别系统的复杂性。第一部分:人脸识别简介在第一部分,我们通过深

#python#opencv#开发语言 +2
基于 Python 和 HuggingFace Transformers 的目标检测

点击下方卡片,关注“小白玩转Python”公众号YOLO!如果你对机器学习感兴趣,这个术语一定不陌生。确实,You Only Look Once已经成为过去几年中目标检测的默认方法之一。受到卷积神经网络取得的进展推动,许多版本的目标检测方法已经被创建。然而,近年来,一个竞争对手出现在了视野中——那就是在计算机视觉中使用基于Transformer的模型。更具体地说,是使用Transformer进行目

#python#目标检测#开发语言 +2
基于 Python 和 HuggingFace Transformers 进行目标检测

YOLO!如果你对机器学习感兴趣,这个术语应该听过。确实,You Only Look Once(你只需看一次)在过去几年中一直是目标检测的默认方式之一。在卷积神经网络取得进展的推动下,已经创建了许多版本的目标检测方法。然而,近来出现了一位竞争对手——即在计算机视觉中使用基于Transformer的模型,更具体地说是在目标检测中使用Transformers。在今天的文章中,你将学到有关这种类型的Tr

#python#目标检测#开发语言 +2
基于YOLOv5的视频计数 — 汽车计数实现

在视频中计数对象可能看起来有挑战性,但借助Python和OpenCV的强大功能,变得令人意外地易于实现。在本文中,我们将探讨如何使用YOLO(You Only Look Once)目标检测模型在视频流或文件中计数对象。我们将该过程分解为简单的步骤,使初学者能够轻松跟随。本文将分为以下几个部分:需求启发式:汽车计数检测过滤启发式:实现结论需求在我们深入了解该过程之前,让我们确保已安装所需的库。主要需

#音视频#汽车
YOLOv8 究竟超越 YOLOv5 了吗?

在目标检测领域,YOLO(You Only Look Once)一直是一种突破性算法。自YOLO算法问世以来,它已经演变为许多版本,其中最受欢迎的版本是YOLOv5和YOLOv8。这两个版本都有独特的特点和优势,使它们在各自的领域表现出色。在本文中,我们将比较YOLOv5和YOLOv8,看看哪一个在准确性和FPS方面更好。相似之处(YOLOv5与YOLOv8)骨干网络:YOLOv5和YOLOv8都

#目标跟踪#人工智能#计算机视觉 +1
ViT:使用 HuggingFace 和 PyTorch 对 Vision Transformer 进行微调实战

点击下方卡片,关注“小白玩转Python”公众号探索 CIFAR-10 图像分类介绍你一定听说过“Attention is all your need”?Transformers 最初从文本开始,现在已无处不在,甚至在图像中使用了一种称为视觉变换器 (ViT) 的东西,这种变换器最早是在论文《一张图片胜过 16x16 个单词:用于大规模图像识别的 Transformers》中引入的。这不仅仅是另一

#pytorch#transformer#人工智能 +2
跨多个流使用Ultralytics YOLOv8进行对象跟踪

跨多个流进行对象跟踪在计算机视觉中发挥着重要作用,特别是在实际应用中。它不仅仅是问题解决,还提供了有价值的见解,并作为对象计数模块的前提。它使系统能够观察和分析物体的运动,这是监控、自动驾驶车辆和零售分析等场景中的基本要求。最终,对象跟踪丰富了在复杂环境中的理解和决策制定。Ultralytics YOLOv8跨多个流进行对象跟踪在本文中,您将学习如何使用Ultralytics YOLOv8在多个流

基于 YOLOv9 的自定义数据集目标检测

点击下方卡片,关注“小白玩转Python”公众号在本指南中,我们将展示使用自定义数据集训练 YOLOv9 模型的过程。具体而言,我们将提供一个示例,重点介绍训练一个视觉模型来识别篮球场上的篮球运动员。但是,这个指南是多功能的,允许您将其应用于您选择的任何数据集。什么是 YOLOv9?随着计算机视觉技术不断发展,YOLOv9 出现作为最新的进展,由 Chien-Yao Wang、I-Hau Yeh

#目标检测#目标跟踪#人工智能 +2
    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择