
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
自动驾驶数据集梳理
1. Kitty数据集数据链接:http://www.cvlibs.net/datasets/kitti/主要应用方向:用于评测立体图像(stereo),光流(optical flow),视觉测距(visual odometry),3D物体检测(object detection)和3D跟踪(tracking)等计算机视觉技术在车载环境下的性能。数据说明:(1)数据集概述https:...
视觉场景理解论文阅读笔记:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering
一、文章相关资料1.论文地址:点击打开链接2.论文代码:点击打开链接3.发表时间:2018二、阅读笔记1.论文思想 文章提出一种自上而下与自下而上相结合的注意力模型方法,应用于视觉场景理解和视觉问答系统的相关问题。其中基于自下而上的关注模型(一般使用Faster R-CNN)用于提取图像中的兴趣区域,获取对象特征;而基于自上而下的注意力模型用于学习特征所对应的权重(一般使用LSTM)
到底了







