logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深入理解流形约束超连接(Manifold-Constrained Hyper-Connections)

这里的数据都是以文中的OLMo-1B(n=4)为代表进行说明的参数量上:不管是静态HC还是动态HC,增加参数量均可忽略不计:针对一个1B的模型,静态HC增加的参数量约为0.00007%,而动态HC也仅为0.03%左右。计算复杂度上:无论静态还是动态超连接,引入的额外 FLOPs 均可忽略不计:针对一个1B的模型,静态HC增加的计算量约为0.127%,而动态HC也仅为0.2%左右。针对一个1B的模型

文章图片
#神经网络
2021年字节跳动-计算机视觉研究员面经

介绍本文是针对牛客面经贴:字节跳动-博士生-计算机视觉研究员面经的一个解答一面:技术面计算机视觉和机器学习问题用numpy实现一下bicubic插值。阐述常见的边缘提取算子,并介绍一下CANNY算子的具体步骤。机器学习中Overfitting的常用解决方法。BN的原理和具体实现,用Pytorch实现一下BN层。Dropout前传和后传的差异。BN和Dropout一起用的时候会出现什么问题?编程题与

一文搞懂光流 光流的生成,可视化以及映射(warp)

什么是光流官方定义Optical flow or optic flow is the pattern of apparent motion of objects, surfaces, and edges in a visual scene caused by the relative motion between an observer and a scene. Optical flow can

2021年字节跳动-计算机视觉研究员面经

介绍本文是针对牛客面经贴:字节跳动-博士生-计算机视觉研究员面经的一个解答一面:技术面计算机视觉和机器学习问题用numpy实现一下bicubic插值。阐述常见的边缘提取算子,并介绍一下CANNY算子的具体步骤。机器学习中Overfitting的常用解决方法。BN的原理和具体实现,用Pytorch实现一下BN层。Dropout前传和后传的差异。BN和Dropout一起用的时候会出现什么问题?编程题与

dockerfile之vllm大模型镜像构建

基础镜像:nvidia/cuda:11.8.0-devel-ubuntu22.04。

#python#docker
Python OpenCV 利用DNN模块进行目标检测,语义分割和风格转换

前言本文不介绍具体的原理,只展示Python下利用OpenCV的DNN模块进行自然图像下的目标检测,语义分割和风格转换OpenCV下的测试只能是进行推理过程,也就是网络的前向过程,而不能进行网络的训练目前OpenCV支持Caffe,TensorFlow,PyTorch,DarkNet,ONNX等多个框架,一些常用的深度卷积神经网络结构也支持,使用起来简单,非常方便(图片从《OpenCV深度学习应用

#python#opencv#dnn +1
使用Python和OpenCV中的calcOpticalFlowFarneback函数提取稠密光流并进行映射(warp)

介绍OpenCV中自带两个提取光流的函数:cv2.calcOpticalFlowPyrLK()cv2.calcOpticalFlowFarneback()其中calcOpticalFlowPyrLK函数是提取稀疏光流的函数,而本文主要关注calcOpticalFlowFarneback函数,并将它应用在一个真实的问题中具体的原理介绍可以参考知乎博客光流估计——从传统方法到深度学习真实问题是:给定两

#opencv#python#计算机视觉
运算符重载

1.两个对象相加先看代码:#include <iostream>using namespace std;class Cperson{public:int age;double score;Cperson(){age = 12;score = 12.34;}};int main(){Cperson ob1;Cperso...

OpenCV函数imread报错:未定义标识符 "IMREAD_GRAYSCALE"、"IMREAD_UNCHANGED"、"IMREAD_COLOR"

在OpenCV中使用imread函数时,除了第一个参数外(第一个参数是指定需要读取的图片的路径和图片名),我们还可以指定一个参数,常用的就是"IMREAD_UNCHANGED"、"IMREAD_GRAYSCALE"、"IMREAD_COLOR"三个属性了1)"IMREAD_UNCHANGED"指定用图片的原来格式打开,

MQ-Det: Multi-modal Queried Object Detection in the Wild

这篇文章提出了MQ-Det,一种高效的架构和预训练策略,用于利用文本描述的开放集泛化能力和视觉示例的丰富描述粒度作为类别查询,即多模态查询目标检测。MQ-Det将视觉查询融入现有的仅基于语言查询的检测器。文章提出了一个即插即用的门控类可扩展感知器(GCP)模块,用于在冻结检测器上增强类别文本与类别相关的视觉信息。为了解决由于冻结检测器带来的学习惯性问题,提出了一种视觉条件的掩码语言预测策略。MQ-

文章图片
#目标检测
    共 26 条
  • 1
  • 2
  • 3
  • 请选择