
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
矩阵运算
一台多卡服务器,为提高利用效率,通常有多个用户使用。假设有一台服务器A,分别有0,1,2,3四张卡,我们有两个用户:甲和乙。当甲启动卡0时,乙想用卡1,2,3。但是乙的进程一直卡住了,等甲进程完全结束后也未曾启动。白白浪费了其他3倍的GPU hours,人神共愤。但是Debug的时候又不知道问题出在哪里。

Overleaf很多模板中,需要用pdf格式来插入图片,即将png/jpg图片转化成pdf,才能插入此图。这么一来,就需要额外做一步转化。

ply文件,是"Polygon File Format"的简称,即多边形文件格式。一般可以理解为,一个ply文件表示一个三维图形。python常见的读取ply文件的方法有两个:plyfile和open3d

用pytorch进行多GPU训练,只需要学会把单卡训练的代码稍微改一下即可。不用弄得太麻烦。通过一个demo来做是最快入手的。1. 要知道机器有几张卡:nvidia-smi2. 模型用DataParallel包装一下:device_ids = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] # 10卡机model = torch.nn.DataParallel(model, devi

在inference阶段,整个模型会load到GPU上,进行端到端的计算,通常只会给你输出一个最终结果。如果想要获取模型的中间层输出,则需要在计算前标定目标层位置(通过forward返回),或者把模型在那层截断(当作一个小模型)输出。本文介绍2种获取模型中间层输出结果的方法:1. 标定目标层位置def forward(self, x):layer1_out = self.layer1(x)laye
如果想利用python+opencv把两段视频拼接在一起,可以有两种想法:1. 第二个视频直接接在第一个视频后边,延长帧。这种我称为“纵向拼接”;2. 第一个视频和第二个视频每一帧平铺,这样就可以同时看两个视频了;如果你是第1个目的点进本文的,那么不好意思,本文不满足你的要求。本文主要面向横向拼接视频,把自己写的脚本记录一下,免得下次再写~import cv2import nu...
Video Grounding不太好找到较好的中文翻译,grounding有“接地、基础”等意思。对于video grounding:输入:一个query(文本),以及一段视频。返回:文本所描述的活动的开始时间和结束时间
Video Grounding不太好找到较好的中文翻译,grounding有“接地、基础”等意思。对于video grounding:输入:一个query(文本),以及一段视频。返回:文本所描述的活动的开始时间和结束时间
GradCAM是经典的特征图可视化工具,在CV任务中,能用于分析CNN学到了什么东西。先看一张图:这就是GradCAM做出的效果,它直观地表示出咱们模型认为图片是Dog的是依据哪些地方。GradCAM借用梯度来进行注意力表示,发表于ICCV2017,如今依然活跃在学术和工程界。GradCAM原理对于视觉任务,包括图像分类、目标检测等,通常都是backbone+head的形式。如图1所示。所以,Gr







