logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

阿里云端口问题-配置完安全组无效

阿里云端口问题安全组配置完成后仍不能访问,此时要配置防火墙放行端口才行

计算机博弈参赛经历

**计算机博弈参赛经历**计算机博弈比赛,这个比赛是从上学期过年的时候开始准备的,参加的是六子棋博弈。当时想着自已一个人上就可以了,疫情的原因,在家里把博弈的程序和界面编写完成后迟迟得到不开学的消息,也没有线上比赛的通知,这件事就慢慢放下了。等到这学期开学后,学校又通知了校赛的举办时间,这个时候我又把博弈的程序找出来,进行规则上的处理和算法的优化,校赛的时候很顺利的通过了进入了省赛阶段。但也看到了

#人工智能#python#算法 +1
DropMAE: Masked Autoencoders with Spatial-Attention Dropout for Tracking Tasks

MAE的一个简单扩展是在视频中随机掩码帧块并重建帧像素。然而,我们发现这种简单的基线严重依赖于空间线索,而**忽略了帧重建的时间关系**,从而导致VOT和VOS的时间匹配表示次优。为了缓解这一问题,我们提出了DropMAE,它在帧重构中自适应地执行空间注意退出,以促进视频中的时间对应学习。

文章图片
#人工智能#计算机视觉#目标跟踪 +1
MixFormerV2: Efficient Fully Transformer Tracking

视觉物体跟踪一直是计算机视觉中一项基本而长期的任务,目的是在其初始边界框的视频序列中定位物体。它有广泛的实际应用,通常需要较低的计算延迟。因此,在保持高精度的同时,设计一个更高效的跟踪架构是很重要的。最近,基于变压器的单流跟踪器[7,14,54]获得了良好的跟踪精度,由于变压器块内的特征提取和目标集成的统一建模,这允许两个组件受益于变压器的开发(例如,维特[17],自我监督预训练[23]或对比预训

文章图片
#transformer#深度学习#人工智能 +2
Efficient RGB-T Tracking via Cross-Modality Distillation

RGB-T跟踪是一种估计RGB-T视频序列的每一帧中任意目标的状态的任务。由于热红外(TIR)传感器的可承受性,RGB-T跟踪引起了越来越多的研究兴趣。如图1 (a)所示,大多数现有的RGB-T跟踪模型首先采用双流结构分别提取多级单峰RGB和TIR特征,然后利用精心设计的多模态特征融合模块来利用多模态数据中的互补信息。最后,他们从融合的特征中推导出目标状态,通常由一个边界框表示。最后,他们从融合的

文章图片
#深度学习#计算机视觉#人工智能
机器学习实操练习 1 (没有理论)

机器学习实操练习 1 (没有理论)from sklearn.model_selection import train_test_split#分开数据 测试 训练import pandas as pdfrom sklearn.datasets import load_iris#特征转换from sklearn.feature_extraction import DictVectorizer...

#机器学习#python#数据分析 +2
解决Chrome浏览器只能在任务栏显示,不能显示界面的问题

解决Chrome浏览器只能在任务栏显示,不能显示界面的问题这个问题在国内好像碰到的人不多,我搜了两三个小时,没有找到正确的解决方式,最后还是老外遇到了这样的问题情况较多,找到了解决方法。解决问题的原网址...

#chrome
SeqTrack: Sequence to Sequence Learning for Visual Object Tracking

视觉目标跟踪是计算机视觉中的一项基本任务。它的目的是估计任意目标在视频序列中的位置,只给定它在初始帧中的位置。现有的跟踪方法通常采用分治策略,将跟踪问题分解为多个子任务,如目标尺度估计和中心点定位等。每个子任务都由一个特定的头网络来处理。例如,SiamRPN及其后续工作采用分类头进行目标定位,采用回归头进行规模估计,如图1(a).所示。STARK和基于变压器的跟踪器设计了角头网络来预测目标物体的边

文章图片
#人工智能#深度学习#transformer +1
图卷积神经网络(GCN)

图卷积神经网络(GCN)的初级认识

Balanced Multimodal Learning via On-the-fly Gradient Modulation

人们通过协同利用多种感官来感知世界:眼睛看,耳朵听,手触摸。这种多模式的方式可以从不同的方面提供更全面的信息。受人类的多感官整合能力的启发,从不同传感器收集的多模态数据在机器学习中更容易被考虑。近年来,多模态学习在提高以往单模态任务的性能以及解决动作识别、视听语音识别、视觉问答等新的挑战性问题方面表现出了明显的优势。与单模态数据相比,多模态数据通常提供更多的视图,因此使用多模态数据的学习应该匹配或

文章图片
#深度学习#人工智能#计算机视觉
    共 11 条
  • 1
  • 2
  • 请选择