logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

​吊打labelme,这款AI开发神器的图像标注yyds!

AI 的发展有三大内核:数据、算法、算力。现如今,算法和算力在市面上的差距显然已经没有那么大,能够给 AI 提供充足弹药支持的当属数据了。深度学习算法精度的提升严重依赖于数据,谁的数据既多...

#百度#人工智能#大数据 +2
一文详解双目视觉目标检测

作者丨一点人工一点智能@知乎来源丨https://zhuanlan.zhihu.com/p/502798622编辑丨计算机视觉工坊基于深度学习的视觉目标检测技术综述,曹家乐,李亚利,孙汉卿,谢今,黄凯奇,庞彦伟,中国图象图形学报单目图像是三维世界中一个视锥的二维投影,丢失了深度信息。双目视觉可以根据物体投影在左右图像上的位置差异计算出视差,并在已知相机参数的情况下根据极线约束计算出像素的深度。在得

#目标检测#计算机视觉#深度学习 +1
最新!3D目标检测论文汇总(多模态融合)

作者丨柒柒@知乎来源丨https://zhuanlan.zhihu.com/p/447555827编辑丨3D视觉工坊这篇文章主要是梳理一下近期3D Detection的进展,分类列举出一些...

#算法#大数据#编程语言 +2
近期激光雷达点云的3D目标检测方法

作者丨黄浴@知乎来源丨https://zhuanlan.zhihu.com/p/370650927编辑丨3D视觉工坊看到的一些近期激光雷达做目标检测的论文。1 Offboard 3D Ob...

#人工智能#编程语言#计算机视觉 +1
ECCV' 2024 Oral满分论文|PointLLM:大语言模型直接理解点云

点击下方卡片,关注「3D视觉工坊」公众号选择星标,干货第一时间送达本次分享我们邀请到了香港中文大学MMLab在读博士徐润森为大家详细介绍他的工作:PointLLM。如果您有相关工作需要分享,欢迎文末联系我们!PointLLM: Empowering Large Language Models to Understand Point Clouds论文:https://arxiv.org/abs/23

#语言模型#人工智能#自然语言处理
DINO:目标检测benchmark COCO屠榜的正确姿势

作者丨陈泰红(已授权)来源丨https://zhuanlan.zhihu.com/p/478461226编辑丨极市平台不小心在paperwithcode看到,DETR系列的论文又屠榜了,在...

#算法#机器学习#人工智能 +2
一文讲透鱼眼相机畸变矫正,及目标检测项目应用

点击上方“3D视觉工坊”,选择“星标”干货第一时间送达1个人介绍大家好,我是潘大强。目前博士毕业4年,主要从事智能安防行业。之前也分享过AI从业的一些心得,个人介绍链接。应大白的邀请,从A...

#计算机视觉#人工智能#webgl
深度学习前人精度很高了,该怎么创新?

作者丨仿佛若有光、DLing、CC查理来源丨知乎问答编辑丨极市平台极市导读深度学习领域新技术层出不穷,顶尖的研究人员也愈来越多,当研究领域的前人精度已经很高了,我们该怎么创新,从哪些角度...

#算法#大数据#编程语言 +2
一个Trick让SLAM精度暴涨20%,发论文对比实验的大杀器!

HandBot-S1是一款三维空间扫描仪,集成了3D激光雷达、双目相机、IMU、算力模块、通讯模块、电池等,并提供标定好的内外参数,免去用户硬件组装、配置、标定等麻烦,通过连接网络即可开始各种应用。HandBot-S1可用于数据采集、环境重建、机器人导航等应用。扫描仪主体和手持底座通过4颗螺丝连接,去掉手持底座后,扫描仪主体可直接搭载到轮式机器人、足式机器人、无人机等多种机器人平台,扫描仪的SLA

RSS 2025|ConRFT: 真实环境下基于强化学习的VLA模型微调方法

与此同时,大语言模型(Large Language Model, LLM)和视觉-语言模型(Vision-Language Model, VLM)的最新进展凸显了强化学习在对齐模型策略与人类偏好之间差距 [5] 或改进模型推理 [6] 方面的价值,证明了部署使用任务专用的奖励函数的强化学习(Reinforcement Learning, RL)来从在线交互中机性能策略更新具有巨大的潜力。BC 损失

    共 1479 条
  • 1
  • 2
  • 3
  • 148
  • 请选择