logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Learning to Prompt for Vision-Language Models

1.问题背景识别正确的提示(识别精度尽可能高的提示),通常需要花费非常多的时间来进行单词的调整,在单词中的一个轻微改变都可以使得在性能上有巨大的不同。但是可以发现即使是做了大量的调整,最后的精度可能不是最优的。受到NLP领域中prompt learning研究的启发,本文提出了Context Optimization(CoOp),具体来说固定整个预训练模型的参数,然后对text encoder中的

#nlp
到底了