logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习·经典模型·VisionTransformer

🔤我们注意到 Vision Transformer 的图像特异性电感偏差比 CNN 小得多。在 CNN 中,局部性、二维邻域结构和平移等方差被烘焙到整个模型的每一层中🔤。

文章图片
#深度学习#人工智能
Segment Anything Model Series

本文提出了一种基于提示的通用图像分割模型SAM。模型采用ViT-H作为图像编码器,支持点、框、文本和掩膜等多种提示方式。提示编码器将稀疏提示转换为嵌入向量,掩膜则通过卷积处理后与图像嵌入叠加。掩膜解码器采用类似DETR和MaskFormer的结构,通过交叉注意力机制生成掩膜预测。为处理提示的二义性,模型会输出3个候选掩膜及其置信度。训练时使用焦点损失和Dice损失的组合,并在SA-1B数据集上进行

文章图片
#人工智能#计算机视觉#深度学习
Claude Code (vscode插件版) 常见命令

这些命令一般,例如。Claude.md。

#vscode#ide#编辑器
数据挖掘·IDC-Reduction

的含义,并结合作者的因果推导、公式和例子说明为什么这是反事实公平研究中一个此前被忽视、但极其关键的问题。(如性别、种族)在**获得正向预测(positive prediction)**方面是否存在差异。注意:对于连续标签(如 Law School 的成绩),论文采用。这在现实中非常普遍(如:性别→教育资源→考试成绩→录取)。也就是:真实标签是 0,但模型预测成 1 的比例。即使生成器生成的数据是公

文章图片
#数据挖掘#人工智能
计算机视觉·ZegFormer

作者对于ZS3和GZS3的新定义方式,还是比较有意思简单来说就是把语义分割看成两个部分先对图像进行分块,例如RR表示多个区域,这些区域不重叠然后找到一种标签映射关系LL,用于将这些区域映射到标签集合。

文章图片
#计算机视觉#人工智能
计算机视觉·DETR

由于N的数量肯定是大于图像中真实锚框的数量和标签集M,因此作者引入了一个No Object作为新的标签集。,这N个锚框经过FFN分别得到分类结果和锚框坐标。这些query向量首先经过自注意力进行交互。总损失:N个分类损失,M个锚框和GIoU损失。DETR设计了N个可以学习的query。就像NMS一样,作者需要减少锚框的数量。首先通过CNN+1x1卷积得到特征图,,N的数量大于图像中实际存在的数量。

文章图片
#计算机视觉#人工智能
强化学习·价值学习-MC,TD和Q-learning算法

本文介绍了强化学习中的价值学习方法,包括蒙特卡洛(MC)、时序差分(TD)和Q-learning算法。MC方法在完整序列结束后更新V-value,而TD方法每一步都更新。Q-learning通过更新Q-value实现更高效学习,采用贪心策略选择最优动作,属于off-policy方法。文章还讨论了on-policy与off-policy的区别,并通过数值例子和代码实现展示了Q-learning的具体

文章图片
#算法#人工智能
深度学习·mmsegmentation基础教程

继承类别和RGB标签的映射关系指定图像扩展名、标注扩展名seg_map_suffix='.png', # 标注mask图像的格式reduce_zero_label=False, # 类别ID为0的类别是否需要除去**kwargs)# 类别和对应的 RGB配色# 指定图像扩展名、标注扩展名seg_map_suffix='.png', # 标注mask图像的格式reduce_zero_label=Fa

文章图片
#深度学习#人工智能
计算机视觉·TagCLIP

本文提出TagCLIP方法,通过引入额外token $t_C$和可信token学习器改进CLIP模型。该方法使用两个模块$M_A$和$M_R$,其中$M_R$专门用于降低对不可见类的预测概率(可见类标记为1,不可见类为0),采用Dice损失函数进行训练。在推理阶段,系统会调整对可见类和不可见类的预测概率分布。消融实验验证了各模块的有效性,展示了该方法在细粒度分类任务上的性能提升。

文章图片
#人工智能#算法
计算机视觉·LDVC

本文提出LDVC方法,针对零样本语义分割任务中的不可见类别过拟合问题。通过视觉-语言提示机制,在视觉和文本编码器中引入提示token,其中视觉提示采用VPT初始化,语言提示则基于手工设计的提示语嵌入。此外,沿用ZegCLIP的文本适配器设计,并将视觉共识解码器与路由注意力机制结合,重点关注图像中相关性强的区域。实验表明,该方法在归纳设置下对可见类和不可见类均有提升,但在转导设置下效果有限。消融实验

文章图片
#计算机视觉#人工智能
    共 36 条
  • 1
  • 2
  • 3
  • 4
  • 请选择