logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

高精度语义地图构建的一点思考

点击进入—>3D视觉工坊学习交流群0. 笔者个人体会高精度(High-Definition, HD)语义地图是目前自动驾驶领域的一个重要研究方向,近年随着Transformer和BEV的大火,很多大佬团队都开展了HD语义地图构建相关的工作。2021年7月,清华大学MARS实验室提出了HDMapNet。紧随其后,同一团队又在今年6月公开了后续工作VectorMapNet。同时,MIT和上海交通

VIL-100: 一个新的车道线检测数据集和基线模型(ICCV2021)

作者丨StrongerTang@知乎来源丨https://zhuanlan.zhihu.com/p/411156533编辑丨3D视觉工坊之前写过一篇车道线检测的综述,得到了一些朋友的认可,...

#计算机视觉#机器学习#人工智能 +2
BMVC'24 !大语言模型赋能!FADE:准确率97.5!大语言引导零样本异常检测新突破!...

点击下方卡片,关注「3D视觉工坊」公众号选择星标,干货第一时间送达来源:3D视觉工坊添加小助理:cv3d001,备注:方向+学校/公司+昵称,拉你入群。文末附3D视觉行业细分群。扫描下方二维码,加入「3D视觉从入门到精通」知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:近20门秘制视频课程、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研,

#语言模型#人工智能#自然语言处理
CVPR'24 | 视觉-语言模型在医学异常检测中的创新应用

点击下方卡片,关注「3D视觉工坊」公众号选择星标,干货第一时间送达来源:3D视觉工坊添加小助理:dddvision,备注:方向+学校/公司+昵称,拉你入群。文末附行业细分群扫描下方二维码,加入3D视觉知识星球,星球内凝聚了众多3D视觉实战问题,以及各个模块的学习资料:近20门视频课程(星球成员免费学习)、最新顶会论文、计算机视觉书籍、优质3D视觉算法源码等。想要入门3D视觉、做项目、搞科研,欢迎扫

#语言模型#人工智能#自然语言处理
ICRA 2025开源 | 大语言模型LLM助力,Hier-SLAM推动高效三维语义理解新突破

尤其重要的是,Hier-SLAM 首次展现了在超过 500 类语义场景中仍能高效运行的能力,充分体现了其强大的扩展性。本文提出了 Hier-SLAM,这是一种基于语义的三维高斯溅射 SLAM 方法,具备全新的层级类别表示方式,能够实现精准的全局三维语义建图、良好的扩展性,以及三维世界中显式的语义标签预测。为构建任意类别的语义树结构,本工作同时考虑语义信息的功能属性与几何属性,借助大语言模型(LLM

#语言模型#人工智能#自然语言处理
超全自动驾驶开源数据集总结,一览自动驾驶发展历程

来源:3D视觉工坊添加微信:dddvisiona,备注:自动驾驶,拉你入群。文末附行业细分群。随着数据采集设备的优化升级,自动驾驶数据集也在不断升级迭代。国内外各大自动驾驶公司、研究所都先后推出自动驾驶数据集,为未来自动驾驶领域的技术发展提供重要研究材料。《自动驾驶开源数据体系:现状与未来》一文系统性地梳理自动驾驶开源数据集,对于助推产业生态良性循环有着重要意义。该文章是由上海人工智能实验室联合上

#自动驾驶#人工智能#机器学习
北交大TransGPT,开源了!

来源:机器之心,编辑:3D视觉工坊火热了半年多,国内大模型领域迎来中场战事,眼下入场的包括在垂直领域深耕多年的机构、企业,开始借助行业特色优势打入大模型战场。近日,北京交通大学联合中国计算机学会智慧交通分会与足智多模公司等正式发布、开源了自主研发的国内首款综合交通大模型:TransGPT・致远。项目地址:https://github.com/DUOMO/TransGPTTransGPT・致远的训练

UCL开源 | Spann3R:基于空间记忆,不估计相机参数也能实时重建!

击下方卡片,关注「3D视觉工坊」公众号选择星标,干货第一时间送达本次分享我们邀请到了UCL在读博士王恒一为大家着重介绍他的工作Spann3R。如果您有相关工作需要分享,欢迎文末联系我们。3D Reconstruction with Spatial Memory论文:https://arxiv.org/pdf/2408.16061代码:https://github.com/HengyiWang/sp

北大&港中文&腾讯联合开源ViewCrafter!实现相机精准可控新视角视频生成+场景级3D生成...

本次分享我们邀请到了北京大学在读博士余旺博为大家着重介绍他的工作:ViewCrafter。如果您有相关工作需要分享,欢迎文末联系我们。ViewCrafter: Taming Video Diffusion Models for High-fidelity Novel View Synthesis论文:https://arxiv.org/pdf/2409.02048主页:https://drexub

#3d
LOAM 代码部分的公式推导(前端里程计部分)

作者丨小飞@知乎来源丨https://zhuanlan.zhihu.com/p/404326817编辑丨3D视觉工坊本篇主要介绍LOAM代码中有关lidar odometry部分对应的公式...

#人工智能#计算机视觉#编程语言 +1
    共 1157 条
  • 1
  • 2
  • 3
  • 116
  • 请选择