什么是YOLO?

YOLO是一种用于目标检测(识别图像中有哪些物体以及它们的位置)的深度学习算法。

其核心思想革命性地改变了传统流程:

  • 传统方式(两阶段):先找出可能存在物体的区域(候选框),再对这些区域进行分类。优点是准确,但速度慢。

  • YOLO方式(单阶段):将目标检测视为一个回归问题,只看一次,直接在图像中预测出物体的边界框和类别。这种端到端的设计实现了检测速度的飞跃

迭代简史:从开山之作到全能大师

YOLO的十年演进史,可以看作是在“精度”与“速度”的平衡上不断磨砺,并最终走向多任务统一的历史。

版本 发布时间 核心创新与突破
YOLOv1 2015 开山之作:首次提出单阶段检测框架,将图像划分为网格进行预测。
YOLOv2/v3 2017-2018 奠基改进:引入锚点(Anchor)机制和多尺度检测,显著提升了对不同大小物体的识别能力。
YOLOv4/v5 2020 生态繁荣:YOLOv4集成了多种技巧提升精度;YOLOv5由Ultralytics推出,以其易用性和成熟的PyTorch生态奠定了工程师的首选地位。
YOLOv6/v7/v8 2022-2023 工业优化:针对工业场景优化效率(v6),引入重参数化架构(v7),并首次支持实例分割(v8),成为功能更全面的模型。
YOLOv9/v10 2024 效率跃升:提出新架构进一步提升参数效率。
YOLO11/v12 2024-2025 能力融合:版本命名回归简约,开始探索多模态和大一统模型。
YOLO26 2025 边缘部署革命:真正原生支持无NMS后处理和多任务统一,在CPU上速度提升43%,为移动端和智能摄像头等设备优化。

YOLOv5的PyTorch化极大降低了使用门槛,经过多年发展,围绕YOLO形成了极为庞大的社区、教程和预训练模型,覆盖安防、自动驾驶、医疗、农业等几乎所有需要视觉感知的领域。

什么是PyTorch?

可以把它理解为一个“搭积木的工具箱”,专门用来快速搭建并训练一个人工智能“大脑”。它的核心思想是追求极致的灵活性和易用性。

核心优势一览

  • “所见即所得”的动态计算图:其他框架像“填表格”,必须提前规划好所有步骤;可以边写边改,即时执行。这种设计大大简化了代码的调试与修改,并且完美契合了YOLOv1的动态特性,使得整个检测过程更加直观,让研究过程更自由。

  • “像写Python一样自然”:PyTorch的代码风格非常贴近原生Python,被称为"Pythonic"。它就像NumPy(一个Python科学计算库)的自然延伸,如果有Python基础,几乎感觉不到学习成本。

  • “官方加速器” GPU加速:PyTorch与NVIDIA的CUDA(显卡计算平台)深度集成。只需在代码中简单添加 .cuda() 这样的操作,就能利用显卡的并行计算能力,将模型训练速度提升数百甚至上千倍。不过,这要求电脑配备NVIDIA显卡。

  • 蓬勃发展的社区与生态:在学术顶会(如CVPR)中,超过85%的论文基于PyTorch实现;在AI模型托管平台Hugging Face上,85%的模型为PyTorch独家。庞大的社区意味着当在学习或项目中遇到问题,几乎都能找到现成的解决方案或可复用的代码。


简单的科普过后,我们开始正式配置
以目前最主流的 YOLOv8(Ultralytics版本)为例;

第一阶段:准备基础软件

  1. 安装显卡驱动
    一般如果计算机有配置显卡,显卡驱动都是安装好了的,直接检验即可;
  • 安装:去 NVIDIA官方驱动下载页,输入你的显卡型号(比如RTX 3060),下载并安装。
  • 检验:安装完后,按 Win + R 输入 cmd,回车打开命令行,输入 nvidia-smi,如果能弹出一张表格并显示驱动版本和CUDA版本,说明成功。
    在这里插入图片描述
    注意:DV字段要在500.xx以上,不然版本太旧了,需要更新;
  1. 安装 Anaconda(Python环境管理器)
  • 访问 Anaconda 官网下载页

  • 选择 Windows 64-Bit Graphical Installer (约 600–800 MB)

  • 下载完成后,右键 → 以管理员身份运行

  • 安装时注意:

    • 勾选 Add Anaconda3 to my PATH environment variable

    • Install for 选择 Just Me 即可

  1. 安装 VS Code(写代码和看图片的编辑器)
    一般情况都有,不赘述

第二阶段:配置深度学习环境(核心)

接下来的所有命令都在终端运行:

  1. 创建独立的虚拟环境
conda create -n pytorch_env python=3.9 -y
  1. 激活环境
    每次跑代码前,都要先激活环境:
conda activate pytorch_env

激活后在终端命令行最前面会出现(pytorch_env)
在这里插入图片描述
表示现在正处在这个环境中。

  1. 安装 PyTorch(深度学习核心框架)
    显卡显示为CUDA12.x,在终端输入:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

其他显卡版本比较低,不适合太新版本的pytorch

这一步下载所耗费的时间比较长,确保电源连接!

  1. 验证 PyTorch 是否安装成功
  • 进入python交互
python
  • 依次输入
import torch
print(torch.__version__)
print(torch.cuda.is_available())

返回如图:
在这里插入图片描述
证明pytorch安装成功

  • 退出python
exit()
  1. 安装YOLOv8
 pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple
  • 这个过程会自动帮你安装 YOLOv8 需要的所有依赖库(比如 opencv、numpy 等),等待它提示 Successfully installed... 就算安装完成了。
  • 检验:
yolo version

如果输出了yolo版本号,就说明安装成功了

  • 我们跑一张图试试看:
 pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple
Logo

免费领 100 小时云算力,进群参与显卡、AI PC 幸运抽奖

更多推荐