logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Sparse Video Generation Propels Real-World Beyond-the-View Vision-Language Navigation

摘要 本文提出了一种基于稀疏视频生成的新方法SparseVideoNav,用于解决真实世界中的超越视野视觉语言导航(BVN)问题。论文的核心贡献包括:1) 将BVN明确定义为一个与传统指令跟随导航不同的新问题设定,指出现有方法的短视程监督是主要瓶颈;2) 提出使用视频生成模型作为长视程预测接口,通过稀疏化设计、历史注入、扩散蒸馏和逆向动力学动作头等技术组合,构建了一个可实机部署的系统。实验在真实机

#人工智能#深度学习#计算机视觉 +1
Sparse Video Generation Propels Real-World Beyond-the-View Vision-Language Navigation

摘要 本文提出了一种基于稀疏视频生成的新方法SparseVideoNav,用于解决真实世界中的超越视野视觉语言导航(BVN)问题。论文的核心贡献包括:1) 将BVN明确定义为一个与传统指令跟随导航不同的新问题设定,指出现有方法的短视程监督是主要瓶颈;2) 提出使用视频生成模型作为长视程预测接口,通过稀疏化设计、历史注入、扩散蒸馏和逆向动力学动作头等技术组合,构建了一个可实机部署的系统。实验在真实机

#人工智能#深度学习#计算机视觉 +1
双目深度估计原理&立体视觉

双目深度估计是通过两个相机的对同一个点的视差来得到给该点的深度。标准系统的双目深度估计的公式推导需要满足:1)两个相机的光轴水平;2) 两个相机焦距分辨率一致,也即内参一致;3)两个相机的成像平面水平,两个相机坐标系之间只存在x轴方向的平移关系。但是得到的双目系统,不一定满足上述的三个条件,两个相机的坐标系之间大概率存在某个旋转平移关系,因此在使用标准系统的双目估计原理公式之前,需要首先完双目相机

文章图片
#目标检测#自动驾驶#几何学 +3
图像处理深度学习模型训练速度的硬件影响因素

深度学习训练速度的影响因素1 数据流通路径2影响速率的因素2.1硬盘读取速度2.2PCle传输速度2.3内存读写速度2.4cpu频率2.5 GPU其他名词以图象训练任务为例,从CPU,内存,硬盘和GPU方面对算法性能进行讲解1 数据流通路径CPU发送指令,把图片从硬盘中读取到内存中CPU从内存中取出一批数据,转化为numpy array,并进行数据预处理,比如翻转,平移,颜色变换等,最后送回内存内

#人工智能#深度学习
图像处理深度学习模型训练速度的硬件影响因素

深度学习训练速度的影响因素1 数据流通路径2影响速率的因素2.1硬盘读取速度2.2PCle传输速度2.3内存读写速度2.4cpu频率2.5 GPU其他名词以图象训练任务为例,从CPU,内存,硬盘和GPU方面对算法性能进行讲解1 数据流通路径CPU发送指令,把图片从硬盘中读取到内存中CPU从内存中取出一批数据,转化为numpy array,并进行数据预处理,比如翻转,平移,颜色变换等,最后送回内存内

#人工智能#深度学习
资料链接传送门

二进制人工智能Gradient descent is all you need介绍了梯度下降法的各种变形以及伪代码未完待续

#人工智能
到底了