logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【多模态融合】Cross Modal Transformer: Towards Fast and Robust 3D Object Detection

多传感器融合在自动驾驶系统中展示了其巨大优势。不同的传感器通常能提供互补的信息。例如,摄像头以透视视角捕捉信息,图像中包含丰富的语义特征,而点云则提供更多的定位和几何信息。充分利用不同传感器有助于减少不确定性,从而进行准确和鲁棒的预测。然而,由于不同模态的传感器数据在分布上的巨大差异,融合这些多模态数据一直是个挑战。当前的主流方法通常通过构建统一的鸟瞰图(BEV)表示来进行多模态特征融合,或通过查

文章图片
#transformer#3d#目标检测 +3
【多模态融合】DeepFusion: Lidar-Camera Deep Fusion for Multi-Modal 3D Object Detection

本文贡献:(1)第一个系统研究深度特征对齐对3D多模态检测器的影响(2)提出InverseAug 和LearnableAlign 来实现深度特征级对齐,从而实现准确且稳健的3D 对象检测器;(3)DeepFusions 在 Waymo 开放数据集上实现了最先进的性能

文章图片
#3d#目标检测#人工智能
【多模态融合】SparseLIF: High-Performance Sparse LiDAR-Camera Fusion for 3D Object Detection

本文介绍了 SparseLIF,这是一种高性能完全稀疏多模态 3D 物体检测器,其性能优于所有其他密集对应检测器和稀疏检测器。 SparseLIF 通过在查询生成、特征采样和多模态融合三个方面增强丰富 LiDAR 和相机表示的感知来弥补性能差距。

文章图片
#计算机视觉#人工智能#目标检测 +2
【多模态融合】FUTR3D: A Unified Sensor Fusion Framework for 3D Detection

上海期智研究院、复旦大学、CMU、清华大学、MIT、Li Auto无。

文章图片
#3d
【3D目标检测】常见相关指标说明

mean Average Precision(平均精度均值),它是目标检测和信息检索等任务中的重要性能指标。mAP 通过综合考虑精度和召回率来衡量模型的总体性能。

文章图片
#3d#目标检测#人工智能 +3
【书生大模型实战】L1-书生大模型全链路开源体系

大模型已经成为发展AGI的重要途径,传统的专用模型是针对特定任务,一个模型解决一个问题,比如ImageNet竞赛中涌现的分类模型,AlphaFold等等。而通用模型旨在利用一个模型完成All任务,对应多种模态。比如GPT4通过Prompt实现。

文章图片
#深度学习#人工智能#语言模型 +1
【深度学习】Pytorch框架的入门简易代码模板及解析

【深度学习】Pytorch框架的入门简易代码模板及解析

#深度学习#pytorch#人工智能
【大模型学习】利用最新版Langchain-Chatchat搭建个人知识库问答LLM

如果存在此选项,则使用它。修改配置文件,需要根据步骤2. 模型推理框架并加载模型中选用的模型推理框架与加载的模型进行模型接入配置,具体参考model_settings.yaml中的注释。默认知识库位于CHATCHAT_ROOT/data/knowledge_base,如果你想把知识库放在不同的位置,或者想连接现有的知识库,可以在这里修改对应目录即可。-i, --incremental:本地文件夹中

文章图片
#学习#pytorch#深度学习 +1
ArXiv 每日论文追踪器:自动检索、双语总结、邮件推送、一键建站

该项目基于GitHub Actions开发,可定时抓取arXiv指定主题论文,通过LLM生成中英文总结,并发送邮件日报+生成网页归档。核心功能:🔍 多学科/关键词组合检索(AND/OR逻辑)✉️ 自动邮件推送(支持QQ邮箱SMTP)🌐 生成GitHub Pages网页归档🧠 集成DeepSeek/SiliconFlow等LLM生成双语摘要⏳ 支持时间窗过滤与跨天去重

文章图片
#深度学习#人工智能#语言模型 +4
【视觉基础模型-SAM系列-4】SAM 3: Segment Anything with Concepts

本文提出了SAM3模型,在SAM2基础上实现了基于语义概念的检测-分割-跟踪一体化架构。该模型能够通过文本或图像提示自动识别、分割并跟踪视频中同一语义概念的所有实例。主要创新包括:1)提出Promptable Concept Segmentation任务;2)设计多模态检测器和记忆库机制;3)构建SA-Co大规模数据集。实验验证了模型在开放词汇分割上的有效性,ICLR审稿评分为8866。该工作推进

文章图片
#人工智能#图像处理#深度学习
    共 15 条
  • 1
  • 2
  • 请选择