logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

GPU 流水线底层探索:从 SIMT 前端到 SIMD 后端的全链路解析

深入解析GPU指令流水线的工作原理及其在AI计算中的关键作用。GPU流水线包含SIMT前端和SIMD后端,分为取指、译码、发射、执行、写回五个阶段。SIMT前端支持线程级编程,SIMD后端实现数据并行处理。还详细探讨了流水线各阶段的工作机制,以及数据冒险、结构冒险和控制冒险的发生原因等。

文章图片
#硬件架构#边缘计算#嵌入式硬件 +3
Ultralytics 实战:YOLOv8n 边缘部署全维度评估

本文基于YOLOv8模型和COCO128数据集,对比评估了PyTorch、ONNX和TensorRT三种模型格式在计算机视觉任务中的部署性能。实验从精度、速度和资源占用三个维度建立评估指标体系,包括mAP、FPS、显存占用等关键指标。

文章图片
#人工智能#深度学习#边缘计算 +1
【Jetson + TensorRT 部署实战】YOLOv8 C++ 单图端到端推理

本篇博客完整实现了 YOLOv8 在 Jetson 平台上的 C++ + TensorRT 端到端单图检测流程,从模型转换(pt→onnx→engine)、工程搭建、核心推理代码编写,到后处理与可视化,全程可复现、可落地。

文章图片
#c++#人工智能#深度学习 +1
【Jetson + TensorRT 部署实战】YOLOv8 C++ 单图端到端推理

本篇博客完整实现了 YOLOv8 在 Jetson 平台上的 C++ + TensorRT 端到端单图检测流程,从模型转换(pt→onnx→engine)、工程搭建、核心推理代码编写,到后处理与可视化,全程可复现、可落地。

文章图片
#c++#人工智能#深度学习 +1
GPU 流水线底层探索:从 SIMT 前端到 SIMD 后端的全链路解析

深入解析GPU指令流水线的工作原理及其在AI计算中的关键作用。GPU流水线包含SIMT前端和SIMD后端,分为取指、译码、发射、执行、写回五个阶段。SIMT前端支持线程级编程,SIMD后端实现数据并行处理。还详细探讨了流水线各阶段的工作机制,以及数据冒险、结构冒险和控制冒险的发生原因等。

文章图片
#硬件架构#边缘计算#嵌入式硬件 +3
Ultralytics 代码库深度解读【五】:数据预处理与增强Pipeline

对Ultralytics代码库中数据增强Pipeline的搭建方法进行了简单介绍,同时对数据预处理与增强的实现步骤与实现方法进行了深入讲解。

文章图片
#人工智能#深度学习#python +2
VNF1048F芯片深入介绍

该器件是用于高端配置的功率MOSFET的高级控制器,设计用于实现 12 V、24 V 和48 V 汽车应用。通过 3.3 V 和 5V CMOS 兼容的SPI 接口,实现 IC 与主控制器通信,从而提供保护和系统诊断。

文章图片
#驱动开发
基于QT的简易计算器(一)

一个基于QT框架的简易计算器,非常好玩。。。

文章图片
#qt#开发语言#c++
    共 15 条
  • 1
  • 2
  • 请选择