logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

图像分割模型LViT-- (Language meets Vision Transformer)

使得无标签数据可以像有标签数据一样为模型提供监督信息。这种方式能够有效利用大量的无标签数据,提高模型的泛化能力和鲁棒性。左面的红方框是Transformer支路,右面的红方框是CNN支路。双u型结构:u型CNN支路+u型Transformer支路。

文章图片
#人工智能#计算机视觉#深度学习 +3
到底了