登录社区云,与社区用户共同成长
邀请您加入社区
该用户还未填写简介
暂无可提供的服务
微调了一个扩散模型,但是只是文生图的扩散模型而没有用可控文生图模型去做,所以扩撒模型只是用来产生图片的。关于标注,引入了一个和Grounding Dino相同的模块叫做定位头来专门进行框和类别的预测。我们采用了一种温和的策略,从图像中随机提取作物,并使用图像作物中的类别构建文本提示符,如图2a所示。如果图像裁剪包含同一类别的多个对象,我们只在文本提示符中使用此类别名称一次。训练的Grounding