logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

将大核卷积分三步,清华胡事民、南开程明明团队全新视觉骨干VAN,超越SOTA ViT和CNN...

关注公众号,发现CV技术之美本文转载自机器之心编辑:小舟、杜伟来自清华大学和南开大学的研究者提出了一种新型大核注意力(large kernel attention,LKA)模块,并在 LK...

#计算机视觉#机器学习#人工智能 +1
华为北大等联手打造的Transformer竟在CV领域超过了CNN:多项底层视觉任务达到SOTA...

本文转载自量子位。杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI提起Transformer,就会想到BERT、GPT-3。但其实,这个在各种自然语言处理任务中「混迹」,强大的...

#计算机视觉#人工智能#机器学习 +1
MaVEn:面向多模态大模型多图理解的连续/离散视觉混合编码策略

关注公众号,发现CV技术之美本篇分享 NeurIPS 2024 论文MaVEn: An Effective Multi-granularity Hybrid Visual Encoding Framework for Multimodal Large Language Model,北大联合阿里提出 MaVEn:面向多模态大模型多图理解的连续/离散视觉混合编码策略。论文地址:https://arxi

#maven#java
ECCV 2020 论文大盘点-姿态估计与动作捕捉篇

本文盘点ECCV 2020 中所有与姿态估计(Pose Estimation)相关的论文,总计 12 篇,其中一篇Oral 论文,6 篇已经或者将开源代码。下载包含这些论文的 ECCV ...

Tensorflow实时语义分割开源工程

https://github.com/MSiam/TFSegmentationReal-time Semantic Segmentation Comparative StudyThe repository contains the official TensorFlow code used in our papers:RTSEG: REAL-TIME SEMANTIC SEGMENTATION C

Kaggle新赛:Lyft 自动驾驶运动预测,发布迄今最大预测任务数据集

近日,国外著名出行公司 Lyft 在Kaggle 竞赛平台发起自动驾驶汽车的运动预测挑战赛,旨在促进自动驾驶汽车的研究,并发布了迄今最大的运动预测数据集。任务介绍挑战参赛者对自动驾驶场景...

#html#css#javascript +1
    共 43 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择