logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

OpenMMLab AI实战四——MMPreTrain

将图像切分乘干16x16的小块(即无重叠,固定大小),所有块排列成“词向量”,先经过线性层映射,一张[H,W,C]维度的图片变为[L,C](图片token化),再经过Transformer Encoder的计算产生相应的特征向量。输入数据维度3x4,将Q与K相乘得到Q对应的一系列K,然后再将K与V相乘,得到K对应的V(如何理解QKV?基本假设:模型只有理解图片内容、掌握图片的上下文信息,才能恢复出

#人工智能
OpenMMLab AI实战二——姿态估计

2D目标检测主要有四种方法:自顶而下方法、自低向上方法、单阶段的方法、基于Transformer的方法,现在较多是基于热力图的方式进行检测,但是该方法计算量较大。:基于图像同时预测关节位置和四肢走向,利用肢体走向辅助关键点的聚类,即,如果某两个关键点由末端肢体相连,则两个关键点属于同一人。如果预测关节和真实关节之间的距离在某个阈值(可变)内,则认为检测到的关键点是正确的(2D、3D均可用)?概念:

文章图片
#人工智能
OpenMMLab AI实战二——姿态估计

2D目标检测主要有四种方法:自顶而下方法、自低向上方法、单阶段的方法、基于Transformer的方法,现在较多是基于热力图的方式进行检测,但是该方法计算量较大。:基于图像同时预测关节位置和四肢走向,利用肢体走向辅助关键点的聚类,即,如果某两个关键点由末端肢体相连,则两个关键点属于同一人。如果预测关节和真实关节之间的距离在某个阈值(可变)内,则认为检测到的关键点是正确的(2D、3D均可用)?概念:

文章图片
#人工智能
OpenMMLab AI实战一——概述

由于项目需求,主要为目标检测领域的应用,所以接触过几次MMDetection,2023年有机会参加一下实战营活动,可以扩展一下自己的AI经历,例如分割、人体位姿估计等任务。OpenMMLab概述:基于 Pytorch 框架,其低层视觉库是MMCV和MMEngine,适用于学术研究和工业应用,项目开源,使用方便。:支持目标检测、实例分割、全景分割任务,主要为2D目标检测,具有训练、测试、推理等工具。

文章图片
#人工智能
到底了