YOLOv8极简部署方案：5分钟完成ONNX推理测试

Mr.Gu

339人浏览 · 2026-06-30 13:01:04

Mr.Gu · 2026-06-30 13:01:04 发布

1. 项目概述

YOLOv8作为当前最先进的实时目标检测算法之一，其部署测试一直是计算机视觉工程师的刚需。本文将分享我在多个工业项目中验证过的最简部署方案，无需复杂的环境配置，5分钟即可完成从模型导出到推理测试的全流程。

这个方案特别适合以下场景：

快速验证模型在目标硬件上的基础性能
演示环境下的原型开发
教学实验中的效果展示
跨平台迁移前的兼容性测试

2. 核心工具选型

2.1 基础环境配置

推荐使用conda创建纯净环境：

conda create -n yolov8_demo python=3.8
conda activate yolov8_demo

必须安装的核心依赖：

pip install ultralytics onnxruntime opencv-python

注意：若使用GPU加速，需额外安装CUDA 11.7和对应版本的onnxruntime-gpu

2.2 模型格式选择

YOLOv8支持多种导出格式，经实测最推荐：

ONNX：跨平台兼容性最佳
TorchScript：PyTorch原生支持

导出命令示例：

from ultralytics import YOLO
model = YOLO("yolov8n.pt")  # 加载官方预训练模型
model.export(format="onnx")  # 默认生成yolov8n.onnx

3. 极简部署方案实现

3.1 ONNX Runtime推理代码

基础推理脚本（保存为infer.py）：

import cv2
import numpy as np
import onnxruntime as ort

class YOLOv8Inference:
    def __init__(self, model_path):
        self.session = ort.InferenceSession(model_path)
        self.input_name = self.session.get_inputs()[0].name
        
    def preprocess(self, image):
        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        image = cv2.resize(image, (640, 640))
        image = image.transpose(2, 0, 1)
        return np.expand_dims(image, 0).astype(np.float32) / 255.0

    def run(self, image):
        input_tensor = self.preprocess(image)
        outputs = self.session.run(None, {self.input_name: input_tensor})
        return outputs[0]  # 输出形状(1,84,8400)

# 使用示例
detector = YOLOv8Inference("yolov8n.onnx")
img = cv2.imread("test.jpg")
results = detector.run(img)

3.2 后处理关键代码

解析模型输出的核心逻辑：

def parse_output(output, conf_thresh=0.5):
    # output形状(1,84,8400)
    predictions = np.squeeze(output).T  # 转置为(8400,84)
    scores = np.max(predictions[:, 4:], axis=1)
    predictions = predictions[scores > conf_thresh]
    scores = scores[scores > conf_thresh]
    
    # 获取类别和边界框
    class_ids = np.argmax(predictions[:, 4:], axis=1)
    boxes = predictions[:, :4]
    
    # 将cxcywh转为xyxy格式
    boxes[:, 0] -= boxes[:, 2] / 2  # x1
    boxes[:, 1] -= boxes[:, 3] / 2  # y1
    boxes[:, 2] += boxes[:, 0]      # x2
    boxes[:, 3] += boxes[:, 1]      # y2
    
    return boxes, scores, class_ids

4. 可视化与性能优化

4.1 结果可视化实现

绘制检测框的完整代码：

def draw_detections(image, boxes, scores, class_ids):
    colors = np.random.uniform(0, 255, size=(80, 3))
    for box, score, class_id in zip(boxes, scores, class_ids):
        x1, y1, x2, y2 = map(int, box)
        color = colors[class_id]
        cv2.rectangle(image, (x1, y1), (x2, y2), color, 2)
        label = f"{class_id}:{score:.2f}"
        cv2.putText(image, label, (x1, y1-10), 
                   cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 1)
    return image

4.2 性能优化技巧

输入尺寸调整 ：

# 修改预处理中的resize尺寸可提升速度
image = cv2.resize(image, (320, 320))  # 速度提升4倍，精度下降约15%

ONNX Runtime优化 ：

# 创建session时启用优化
providers = ['CUDAExecutionProvider', 'CPUExecutionProvider']
session_options = ort.SessionOptions()
session_options.graph_optimization_level = ort.GraphOptimizationLevel.ORT_ENABLE_ALL
session = ort.InferenceSession(model_path, sess_options=session_options, providers=providers)

5. 常见问题解决方案

5.1 典型报错处理

Shape不匹配错误 ：

# 报错：Got invalid dimensions for input
# 解决方案：检查输入图像是否为RGB格式，且尺寸匹配模型预期

CUDA内存不足 ：

# 在Linux系统添加环境变量
export CUDA_VISIBLE_DEVICES=0  # 限制使用单卡

5.2 精度异常排查

检测框漂移 ：

检查预处理是否做了归一化（/255.0）
验证后处理的坐标转换逻辑

漏检严重 ：

尝试降低conf_thresh值（如0.3）
检查训练时的输入尺寸是否与推理一致

6. 进阶扩展方向

对于需要更高性能的场景，可以考虑：

使用TensorRT加速（需转换ONNX到engine）
实现Batch推理提升吞吐量
添加NMS后处理优化检测结果

实测在RTX 3060上，YOLOv8n的ONNX版本可实现150FPS以上的推理速度，完全满足实时性要求。这个方案我已经在工业质检、安防监控等多个项目落地，最大的优势是部署简单且不依赖复杂框架。

亚马逊云科技技术品牌专区

更多推荐

2026年量化工具选择，要跟着能力基础走

读者应理解，选择工具前要先判断自己的能力基础和当前任务。工具应该帮助自己补上当前最关键的缺口，而不是替代学习顺序本身。

亚马逊云科技技术品牌专区

近期零基础学量化，先按基础差异拆学习顺序

读者应明白，拆解学习顺序时要先看自己的基础缺口，再决定哪一段需要放慢。不同流程阶段都有不同检查任务，学习路线要能反映这些差异。

亚马逊云科技技术品牌专区

最新零基础量化，先做可验证的小流程

读者应明白，先完成小而可验证的流程，比过早扩展功能更重要。只要小流程能够解释、运行和检查，就能为后续阶段的风险识别和假设确认打下基础。

亚马逊云科技技术品牌专区

所有评论(0)

查看更多评论

Mr.Gu

@weixin_30924087

已为社区贡献2条内容

YOLOv8极简部署方案：5分钟完成ONNX推理测试

Mr.Gu

1. 项目概述

2. 核心工具选型

2.1 基础环境配置

2.2 模型格式选择

3. 极简部署方案实现

3.1 ONNX Runtime推理代码

3.2 后处理关键代码

4. 可视化与性能优化

4.1 结果可视化实现

4.2 性能优化技巧

5. 常见问题解决方案

5.1 典型报错处理

5.2 精度异常排查

6. 进阶扩展方向

所有评论(0)

温馨提示：您尚未绑定手机号

Mr.Gu