
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文仅根据模型的预测过程,即从输入图像到输出结果(图像预处理、模型推理、后处理),来展现不同任务下的网络结构,OBB 任务暂不包含。
02325《计算机系统结构》自考复习概念题:5~8 章选择、填空、简答
NC-Net 是特征点检测与匹配的早期深度方法,许多论文有提及,直接看代码并结合论文记录一下方法。
学习资料:TensorRT 源码示例。
视频理解实际是做视频动作分类,类似图像分类,输入为视频(图像序列),输出为类别。数据集类别数视频数平均时长链接UCF-101101133207.21sPaperDownloadHMDB-515168492~5sPaperDownloadSports-1M48711331585m36sPaperDownload40030624510sPaperDownloadSmth-Smth1742208474s
1. 前言代码地址论文地址 图像对齐方法大致分为两类:(1)参数化方法(非像素级对齐) 通常做法是将一对图像输入网络,最后通过一个全连接层得到一个8维的特征向量,对应图像4个顶点的偏移量,从而得到一个单应性矩阵作为对齐变换,详情参考图像对齐深度学习算法调研。(2)非参数化方法(像素级对齐) 通常做法是将源图 IsI_sIs 和目标图 ItI_tIt 先提取特征得到 FsF_sFs 与F
1. 简介 SuperPoint 网络中所用到的 NMS 代码部分,输入为 scores,即输入图像每个像素的得分,输出依然是 scores,准特征点位置的得分保留,其余位置的得分置零。 大体上是根据超参数 nms_radius 使图像每个局部区域都得到一个准特征点,后续再用得分阈值筛选等,去除距离很近的冗余特征点。SuperPoint 中 forward 部分涉及 NMS 的代码# Comp
看了许多 Transformer 的文章感觉还是有点抽象,本文将根据 Pytorch 代码从原始输入到最终输出完整走一遍。
从论文标题可以看出,AdaTAD 可以在 1B 参数且输入视频在 1000 帧的情况下实现端到端的训练,核心创新点是引入 Temporal-Informative Adapter (TIA) 模块来减少训练内存提高性能。本文先根据代码说明模型训练全过程,再根据论文部分内容说明训练策略和改进思路。
学习资料:TensorRT 源码示例参考源码:cookbook → 07-Tool → trtexec在 TensorRT 的安装目录下有命令行工具 trtexec,主要功能:(1)由 ONNX 文件生成 TensorRT 引擎并序列化为 plan 文件(2)查看 ONNX 或 plan 文件的网络逐层信息(3)模型性能测试,即测试 TensorRT 引擎在随机输入或给定输入下的性能。







