logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

目标检测数据集合成

微调了一个扩散模型,但是只是文生图的扩散模型而没有用可控文生图模型去做,所以扩撒模型只是用来产生图片的。关于标注,引入了一个和Grounding Dino相同的模块叫做定位头来专门进行框和类别的预测。我们采用了一种温和的策略,从图像中随机提取作物,并使用图像作物中的类别构建文本提示符,如图2a所示。如果图像裁剪包含同一类别的多个对象,我们只在文本提示符中使用此类别名称一次。训练的Grounding

文章图片
#目标检测
到底了