logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

论文Review 3DGS SuGaR | CVPR 2024 | 3DGS 转 Mesh 开源方案!!

本文提出SuGaR方法,首次实现从3D高斯泼溅(3DGS)中高效提取可编辑网格。针对3DGS优化后高斯分布无序的问题,作者创新性地引入表面对齐正则化项,使高斯贴合场景表面;随后提出基于泊松重建的快速网格提取算法,仅需单GPU几分钟即可完成,相比传统SDF方法提速显著。实验表明,该方法在保持3DGS高质量渲染优势的同时,支持网格编辑、重光照等图形学操作,为3D场景建模提供了新思路。

文章图片
#3d#图形渲染#计算机视觉
论文Review VLA OpenVLA | 开源具身智能端到端VLA机械臂方案 | 斯坦福、UC伯克利、谷歌、MIT出品!众星闪耀!

斯坦福大学、UC伯克利和丰田研究院联合发布了OpenVLA,这是一个开源的7B参数视觉-语言-动作模型。OpenVLA基于Llama2语言模型,融合DINOv2和SigLIP视觉特征,在97万真实机器人演示数据上训练。实验显示,OpenVLA在29个任务中比55B参数的RT-2-X模型性能高16.5%,且参数少7倍。该模型支持高效微调,在消费级GPU上通过LoRA和量化技术实现适配,性能优于扩散策

文章图片
#机器人
从零开始的深度学习(1)-什么是Transformer

如今,深度学习已经成为一个像编程语言一样基础且重要的工具,是每一个研发工作者绕不过的必备技能,对于科研来说仅仅了解和会使用似乎变得远远不够。不管是处于想把深度学习学好以给自己的论文赋能亦或是学一个找工作的傍身技能的想法,我也决定将这个技能树点起来。学习一项技能最好的时机是入学前,其次就是现在,抓紧时间补补基础吧。为什么选择Transformer是因为这是我认知范围内用的最多最好的模型了,是最可能为

文章图片
#深度学习#transformer#人工智能
DailyCoding C++ | SLAM里的“幽灵数据”:从一个未初始化的四元数谈C++类设计

本文复盘了一个LiDAR SLAM开发中由数据冗余引发的Bug:由于PoseT类构造函数中未同步更新所有数据成员,导致输出出现e-310量级的未初始化数值。文章深入分析了数据冗余带来的同步问题,提出"单一数据源"的设计原则建议只存储变换矩阵,需要时再计算四元数和平移向量。同时澄清了Eigen类型成员的拷贝构造问题,指出编译器默认行为已足够,手写反而易出错。最后强调了Eigen内

文章图片
#c++#开发语言
DailyCoding C++ CMake | CMake 踩坑记:解决 ROS 项目中的“循环引用”与库链接依赖问题

本文探讨了ROS激光SLAM开发中遇到的CMake依赖管理问题。主要分析了"Cycle in constraint graph"错误的成因,指出混用系统库和自定义库路径导致的依赖循环问题。文章详细解析了静态库与动态库的区别,以及CMake中target_link_libraries的PUBLIC/PRIVATE/INTERFACE关键字对依赖传递性的影响。最终提出解决方案:使用

文章图片
#c++#机器人
论文Review A micro Lie theory for state estimation in robotics

李群是一个古老的数学抽象概念,可以追溯到19世纪,当时数学家索菲斯·李(Sophus Lie)奠定了连续变换群理论的基础。许多年后,它的影响已经遍及科技的各个领域。在机器人学中,我们最近正在经历一个重要的趋势,至少在估计领域,特别是在用于导航的运动估计中。然而,对于绝大多数的机器人学家来说,李群是高度抽象的结构,因此很难理解和使用。在对机器人学进行评估时,往往不需要利用理论的全部能力,因此我们要筛

文章图片
#学习#几何学#自动驾驶 +3
论文Review 3DGS综述 | 南京大学 | 3DGS Survey, Technologies, Challenges, and Opportunities |(一)3DGS 优化和应用分类

本文系统综述了3D高斯泼溅(3DGS)技术的最新进展。3DGS通过显式高斯分布实现高效3D表示和实时渲染,已在VR/AR、自动驾驶等领域展现出优势。文章从优化、应用和扩展三个维度分类梳理现有工作,重点分析了存储效率、训练加速、真实感渲染等关键技术挑战,并比较了不同方法在人体重建、AIGC、自动驾驶等应用中的性能表现。特别构建了开源项目持续跟踪该领域发展,为研究人员提供了技术路线图。分析表明,3DG

文章图片
#3d
Latex & vscode安装、配置与使用-Windows

LaTeX是一款高效的排版工具,搭配VSCode可提升写作效率。安装时注意:Windows中文用户名需改为英文,避免报错。VSCode配置需禁用自动编译功能,防止频繁生成中间文件占用磁盘。推荐学习资源包括知乎和CSDN上的LaTeX入门指南,以及Overleaf的文档定位技巧。使用中需定期清理VSCode缓存路径(如WebStorage文件夹)以释放空间。注意图片浮动选项避免"H&quo

文章图片
#vscode#ide#编辑器 +1
论文Review SLAM 综述 | 上海交通大学 | What Is The Best 3D Scene Representation for Robotics?| (二)建图定位、交互和导航

摘要: 本文系统综述了机器人领域3D场景表示方法的发展,涵盖传统几何表示(点云、体素、SDF、场景图)与新兴神经表示(NeRF、3DGS、基础模型)。传统SLAM依赖稀疏表示,而稠密表示在导航、避障等任务中更具潜力。神经表示能融合高层语义与语言先验,推动场景理解与具身智能。研究将机器人核心模块分为感知、建图、定位、导航与操作,分析各表示方法的优劣,并探讨未来趋势——3D基础模型可能成为统一解决方案

文章图片
#机器人
论文Review SLAM 综述 | 上海交通大学 | What Is The Best 3D Scene Representation for Robotics?| (一)场景表示与感知

本文系统综述了机器人领域的三维场景表示方法,涵盖传统几何表示(点云、体素、SDF、场景图)和新兴神经表示(NeRF、3DGS、基础模型)。研究从感知、建图、定位、导航和操作五大核心模块分析不同表示方法的优劣,重点关注内存效率、真实感渲染和几何表达能力。结果表明:传统表示计算高效但表达能力有限;神经表示支持连续场景建模和语义融合但计算成本高;基础模型展现出开放词汇理解潜力。文章开源了相关资源库,并探

文章图片
#机器人
    共 20 条
  • 1
  • 2
  • 请选择