
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
摘要: 本文提出3D Gaussian Flats(3DGS-Flats),一种创新的2D/3D混合表征方法,用于解决现有辐射场技术在重建平面无纹理表面时的局限性。通过联合优化约束平面(2D)高斯函数与自由形式(3D)高斯函数,该方法动态检测并优化平面区域,显著提升视觉保真度与几何精度。实验表明,在ScanNet++和ScanNetv2数据集上,该方法实现了最先进的深度估计效果,并在网格提取中表现

中国空间智能大会(ChinaSI 2025)在深圳召开,聚焦空间智能领域十大前沿问题,涵盖理论构建、数据获取、多模态融合、智能体协同等关键方向。武汉大学龚健雅教授探讨了时空智能大模型的发展挑战,指出语言大模型与地理空间认知存在三大矛盾。北京大学陈宝权教授分享了现实世界数据获取与增强仿真的最新研究,浙江大学章国锋教授介绍了高效三维场景重建技术。会议展示了我国在空间智能基础理论、技术突破与产业应用的最

摘要 本文提出置信度引导的token合并方法Co-Me,用于加速视觉几何Transformer而不需重新训练模型。该方法通过轻量级置信度预测器对token进行排序,选择性合并低置信度token以减少计算量。Co-Me包含置信度蒸馏和token合并两阶段:首先从ViT模型中提取置信度预测模块,然后在推理时生成合并mask指导token操作。实验表明,Co-Me在VGGT和MapAnything等模型

本文提出了一种解决3D高斯泼溅(3DGS)中虚假透明度问题的新方法Noise Guided Splatting(NGS)。3DGS在重建不透明物体时,由于仅优化RGB图像的光度损失而缺乏不透明度约束,常导致表面出现错误的透明效果,在交互式观看时尤为明显。NGS通过在物体体积内注入随机颜色的不透明噪声高斯,引导优化过程优先处理不透明表面,同时保持渲染质量。实验表明,NGS能显著减少虚假透明度,且在标

摘要 南加州大学团队提出可变形贝塔喷溅(DBS)方法,突破3D高斯喷溅在几何与颜色建模上的局限。DBS采用可变形贝塔核替代高斯核,通过有限支撑范围和自适应频率控制,以45%参数量实现更高保真度的几何细节捕捉;同时引入球形贝塔模型改进颜色编码,用线性增长的反射波瓣参数高效模拟镜面高光。理论证明其核无关的MCMC优化策略仅需调整不透明度即可维持分布,实验显示DBS渲染速度比3DGS快1.5倍,达到SO

本文提出Flow Distillation Sampling (FDS)方法,通过引入预训练光流模型的匹配先验来优化3D高斯泼溅(3DGS)的几何重建质量。针对3DGS在稀疏观测场景中几何重建效果欠佳的问题,FDS利用预训练模型生成输入视角与未观测视角间的光流(先验流),指导3DGS解析计算的光流(辐射流),从而提升重建精度。该方法还提出自适应相机采样方案,控制视角间重叠度以优化先验流计算。实验表

《即时重建:未标定图像的大规模新视角合成》提出了一种快速重建相机姿态和3D高斯辐射场的方法,适用于有序图像序列和大规模场景。核心贡献包括:1)基于学习的轻量级初始姿态估计,采用GPU友好的小束调整;2)高斯基元直接采样技术,通过像素级概率控制位置与形状,避免冗余初始化;3)高效的姿态与3D高斯联合优化流程;4)可扩展的锚点聚类策略处理大规模场景。实验表明,该方法能在拍摄后立即生成结果,显著快于传统

本文从多视点RGB视频中重建长体积视频。最近的动态视图合成方法利用强大的四维表示,如特征网格或点云序列,来实现高质量的渲染结果。然而,它们通常被限制在较短的(1∼2s)视频剪辑中,并且在处理较长的视频时经常遭受较大的内存占用。为了解决这一问题,我们提出了一种新的四维表示,称为 时间高斯分层,能够紧凑地建模长的体积视频 。由于动态场景中通常存在不同程度的时间冗余,由不同速度变化的区域组成。基于此,我

FlashWorld:秒级生成高品质3D场景 FlashWorld提出了一种突破性的3D场景生成方法,可在数秒内从单图或文本生成高质量3D场景,渲染速度比现有技术快10-100倍。该研究通过双模式预训练和跨模式后训练的创新框架,解决了传统多视图导向方法(MV)与3D导向方法之间的矛盾:MV模式虽画质高但缺乏3D一致性,3D模式虽保一致性但画质欠佳。 核心贡献包括: 双模式预训练:基于视频扩散模型初

本文提出G4SPLAT方法,通过几何引导的高斯泼溅与生成先验,解决现有三维重建方法在几何监督和多视角一致性方面的局限。首先利用平面结构推导精确深度图,为观测与未观测区域提供可靠监督;其次将几何引导贯穿生成流程,改善可见性估计与新视角选择,增强多视角一致性。实验表明,该方法在Replica等数据集上几何与外观重建均优于基线,尤其在未观测区域表现突出,并支持单视图输入和非摆拍视频,具有较强的泛化能力。








