logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hypergraph Random Field Model for Multiple Object Tracking in Dense Scenarios

密集场景MOT会因为相互遮挡与冗余检测导致特征丢失、累计误差,出现 ID switch 和误匹配传统轨迹-检测二分图有一对一匹配限制在“频繁出现相似目标”的密集场景容易失败提出 Hypergraph Random Field (HRF),引入两类超节点,分别为trajectory hypernodes和domain hypernodes将 tracking 抽象为图,图中包含三类节点:①当前帧检测

文章图片
#深度学习#人工智能#计算机视觉 +1
JRDB数据集介绍

JRDB 是一个面向真实机器人应用、强调第一视角、遮挡严重、尺度变化极端的2D 标注规模极大的数据集。特别适合用于多目标跟踪(MOT)、遮挡建模、群体行为建模以及Egocentric MOT 方法研究。

文章图片
#计算机视觉#opencv#人工智能 +1
BDD100K数据集介绍

BAIR的计算机视觉研究者有兴趣探索自动驾驶感知算法的前沿,以使其更加安全,为了设计和测试潜在的算法,研究者想利用真实驾驶平台收集数据中的所有信息。因此,在Nexar的帮助下,BAIR将发布BDD100K的数据库,这是目前用于计算机视觉研究的最大、最多样化的开放驾驶视频数据集。数据集涵盖了不同的天气条件,包括晴天、阴天和雨天,以及白天和晚上的不同时间。数据集中的GT框标签共有10个类别,分别为:B

文章图片
#人工智能#计算机视觉#目标跟踪
When Hypergraph Meets Heterophily: New Benchmark Datasets and Baseline

时间:2025会议:AAAI作者:Ming Li, Yongchun Gu, Yi Wang*, Yujie Fang, Lu Bai*, Xiaosheng Zhuang, Pietro Lio提出面向超图的双重同配比度量,实现结构-标签偏置的数值化评估;构建面向异配场景的大规模、多领域基准数据集;设计基于framelet变换的低通-高通双通道模型 HyperUFG,作为异配超图学习的强基线①当

文章图片
#深度学习#人工智能#opencv +1
JDE:Towards Real-Time Multi-Object Tracking 迈向实时多目标跟踪

采用单个网络来同时输出检测结果和检测到的框的相应外观嵌入。

文章图片
#目标跟踪#人工智能#计算机视觉
在Pytorch中使用Tensorboard可视化训练过程

【在Pytorch中使用Tensorboard可视化训练过程】 https://www.bilibili.com/video/BV1Qf4y1C7kz/?

文章图片
#pytorch#人工智能#python
Vision Transformer(VIT模型)

MLP Head 是指位于模型顶部的全连接前馈神经网络模块,用于将提取的图像特征表示转换为最终的分类结果或其他预测任务输出。MLP Head 通常跟在 Transformer Encoder 的输出之后,作为整个模型的最后一层。可以简单理解为一个全连接层,若需要类别概率需要再接上一个softmax激活函数。

文章图片
#transformer#深度学习#人工智能
TransTrack: Multiple Object Tracking with Transformer

①将前一帧的对象特征应用为当前帧的查询,并引入一组学习的对象查询来检测新出现的对象②通过一次完成对象检测和对象关联建立了一种新颖的联合检测和跟踪范例。

文章图片
#transformer#深度学习#人工智能
ResNet网络详解

超深的网络结构(突破1000层)提出residual模块使用Batch Normalization加速训练(丢弃dropout层)

文章图片
#网络#深度学习#人工智能 +1
Hyper-YOLO: When Visual Object Detection Meets Hypergraph Computation

①Hyper-YOLO引入一种新的目标检测方法,结合超图计算捕捉视觉特征中的复杂高阶相关性②为解决传统的YOLO模型在 Neck 结构上的局限,提出了HGC-SCS框架。

文章图片
#神经网络#目标检测#深度学习
    共 11 条
  • 1
  • 2
  • 请选择