logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

YOLOv8 多种任务网络结构详细解析 | 目标检测、实例分割、人体关键点检测、图像分类

本文仅根据模型的预测过程,即从输入图像到输出结果(图像预处理、模型推理、后处理),来展现不同任务下的网络结构,OBB 任务暂不包含。

#目标检测#计算机视觉
02325《计算机系统结构》自考概念题:5~8 章

02325《计算机系统结构》自考复习概念题:5~8 章选择、填空、简答

Neighbourhood Consensus Networks(NIPS 2018)特征点检测与匹配论文笔记

NC-Net 是特征点检测与匹配的早期深度方法,许多论文有提及,直接看代码并结合论文记录一下方法。

#深度学习#计算机视觉#人工智能
视频理解调研笔记 | 2021年前视频动作分类发展脉络

视频理解实际是做视频动作分类,类似图像分类,输入为视频(图像序列),输出为类别。数据集类别数视频数平均时长链接UCF-101101133207.21sPaperDownloadHMDB-515168492~5sPaperDownloadSports-1M48711331585m36sPaperDownload40030624510sPaperDownloadSmth-Smth1742208474s

#深度学习
RANSAC-Flow: generic two-stage image alignment(ECCV 2020)图像对齐论文代码详细分析

1. 前言代码地址论文地址  图像对齐方法大致分为两类:(1)参数化方法(非像素级对齐)  通常做法是将一对图像输入网络,最后通过一个全连接层得到一个8维的特征向量,对应图像4个顶点的偏移量,从而得到一个单应性矩阵作为对齐变换,详情参考图像对齐深度学习算法调研。(2)非参数化方法(像素级对齐)  通常做法是将源图 IsI_sIs​ 和目标图 ItI_tIt​ 先提取特征得到 FsF_sFs​ 与F

#计算机视觉#深度学习#pytorch
SuperPoint 特征点 NMS 代码分析

1. 简介  SuperPoint 网络中所用到的 NMS 代码部分,输入为 scores,即输入图像每个像素的得分,输出依然是 scores,准特征点位置的得分保留,其余位置的得分置零。  大体上是根据超参数 nms_radius 使图像每个局部区域都得到一个准特征点,后续再用得分阈值筛选等,去除距离很近的冗余特征点。SuperPoint 中 forward 部分涉及 NMS 的代码# Comp

#深度学习#计算机视觉#python +1
Transformer 详解 | Pytorch 代码解读

看了许多 Transformer 的文章感觉还是有点抽象,本文将根据 Pytorch 代码从原始输入到最终输出完整走一遍。

#transformer#pytorch#深度学习 +1
AdaTAD(CVPR 2024)视频动作检测方法详解

从论文标题可以看出,AdaTAD 可以在 1B 参数且输入视频在 1000 帧的情况下实现端到端的训练,核心创新点是引入 Temporal-Informative Adapter (TIA) 模块来减少训练内存提高性能。本文先根据代码说明模型训练全过程,再根据论文部分内容说明训练策略和改进思路。

#transformer#计算机视觉
从零开始 TensorRT(4)命令行工具篇:trtexec 基本功能

学习资料:TensorRT 源码示例参考源码:cookbook → 07-Tool → trtexec在 TensorRT 的安装目录下有命令行工具 trtexec,主要功能:(1)由 ONNX 文件生成 TensorRT 引擎并序列化为 plan 文件(2)查看 ONNX 或 plan 文件的网络逐层信息(3)模型性能测试,即测试 TensorRT 引擎在随机输入或给定输入下的性能。

    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择