薇酱个人主页

@qq_17246605

薇酱

2023-04-21 18:05:59 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

什么是VIT？

VIT就是Vision Transformer。目录1.Transformer在视觉领域上使用的难点：2.输入序列长度的改进3.VIT对输入的改进1.Transformer在视觉领域上使用的难点在nlp中，输入transformer中的是一个序列，而在视觉领域，需要考虑如何将一个2d图片转化为一个1d的序列，最直观的想法就是将图片中的像素点输入到transformer中，但是这样会有一个问题，因为

#transformer #深度学习 #计算机视觉

NLP自然语言处理1---使用正则表达式

1.析取使用括号，匹配括号里的任意字符[abc]dee],即匹配 adee,bdee,cdee[Ww]ood,即匹配 Wood和wood使用范围：[a-z] 表示匹配小写字母[A-Z] 表示匹配大写字母2.非析取[^Ss][^A-Z]非大写字母，即匹配小写字母或其他字符。3.更多析取more|less,匹配more或者是lessa|b|c,即[a...

跟着chatgpt一起学|多模态入门

多模态表示学习是指从多种不同类型的数据源（如图像、文本、音频、视频等）中学习统一的、有意义的特征表示的过程。