logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【三维生成】Matrix-3D:全向可探索的三维世界生成

Matrix-3D提出了一种全向可探索的三维世界生成框架,通过结合条件视频生成与全景三维重建技术,实现基于单张图像或文本提示的高质量三维场景构建。该研究首先训练了轨迹引导的全景视频扩散模型,利用场景网格渲染作为生成条件;随后提出前馈式大型全景重建模型和基于优化的流水线两种方法,将全景视频转化为三维世界。为支持训练,团队构建了包含11.6万条全景视频的Matrix-Pano数据集,所有数据均带有深度

文章图片
#3d#人工智能#AIGC
【三维生成】StarGen:基于视频扩散模型的可扩展的时空自回归场景生成

近年来,大型重建和生成模型的研究进展显著改善了场景重建和新的视图生成。然而,由于计算的限制,这些大型模型的每个推理都局限在一个小的区域内,这使得长期一致的场景生成具有挑战性。为了解决,StarGen使用了一个预训练的视频扩散模型,以自回归的方式进行远程场景生成。每个视频clip 的条件是(空间上)相邻图像和先前生成的clip 的(时间上的)重叠图像的 3D warping,通过精确的姿态控制提高远

文章图片
#AIGC#机器学习
【视频生成】GVS:生成式视图拼接

摘要 MIT CSAIL和RunwayML团队提出生成式视图拼接(GVS)技术,解决自回归视频扩散模型在摄像机引导生成中的局限性。传统方法因无法利用未来条件导致场景与轨迹冲突,GVS通过并行采样整个序列确保生成内容与预设轨迹一致。关键技术包括:1)将扩散拼接技术从机器人规划拓展至视频生成,兼容现有视频扩散模型;2)开发Omni Guidance机制,结合历史与未来预测提升时间一致性;3)实现闭环控

文章图片
#3d#AIGC
【三维编辑】DREAMCATALYST:平衡可编辑性和ID的快速高效3D编辑

DreamCatalyst: 快速高质量3D编辑框架 本文提出DreamCatalyst框架,从扩散逆过程的角度重新审视分数蒸馏采样(SDS),解决了现有3D编辑方法训练时间长、质量低的问题。通过将采样动态融入SDS框架,该方法实现了: 快速模式 - 比现有NeRF编辑方法快23倍 高质量模式 - 在速度提升8倍的同时获得更优结果 技术核心包括: 建立SDS与DDIM采样的理论联系 设计匹配扩散时

文章图片
#3d#人工智能#AIGC
【valse2025】CV与ML领域重要进展

几大进展的标题来源于1.评选2024年5月-2025年4月之间,世界范围内视觉与学习领域的重要学术进展。2.责任AC提名候选进展共16个,通过组委会评议;VALSE2024-2025全体AC投票(选择6-12个进展)。截止5月18日,共收集有效选票128份,超过2/3的AC参与了投票。3.加权计算得分:若某个AC投票N个进展,则该AC为其投票的每个进展贡献1/N投票分。4.每个候选项总得分等于所有

文章图片
#AIGC#人工智能#3d +1
【无标题】ASTRA:自回归去噪的通用交互式世界模型

Astra模型提出了一种通用交互式世界建模新范式,新性地将自回归长时程建模与扩散高保真合成相结合,通过噪声增强历史记忆机制和动作感知适配器,在自动驾驶、机器人操作等多样化场景中实现了高精度未来预测与动作交互。实验表明,Astra在保真度、远距离预测和动作对齐方面显著超越现有世界模型,为构建可交互、高一致性的通用视觉世界模型提供了新思路。

文章图片
#人工智能#视频生成
【会议】中国空间智能大会

中国空间智能大会(ChinaSI 2025)在深圳召开,聚焦空间智能领域十大前沿问题,涵盖理论构建、数据获取、多模态融合、智能体协同等关键方向。武汉大学龚健雅教授探讨了时空智能大模型的发展挑战,指出语言大模型与地理空间认知存在三大矛盾。北京大学陈宝权教授分享了现实世界数据获取与增强仿真的最新研究,浙江大学章国锋教授介绍了高效三维场景重建技术。会议展示了我国在空间智能基础理论、技术突破与产业应用的最

文章图片
#人工智能#3d#AIGC
【三维重建】Co-Me:置信度引导token合并:用于视觉几何Transformer

摘要 本文提出置信度引导的token合并方法Co-Me,用于加速视觉几何Transformer而不需重新训练模型。该方法通过轻量级置信度预测器对token进行排序,选择性合并低置信度token以减少计算量。Co-Me包含置信度蒸馏和token合并两阶段:首先从ViT模型中提取置信度预测模块,然后在推理时生成合并mask指导token操作。实验表明,Co-Me在VGGT和MapAnything等模型

文章图片
#transformer#深度学习#人工智能 +2
【三维重建】噪声引导Splatting的透明度修复

本文提出了一种解决3D高斯泼溅(3DGS)中虚假透明度问题的新方法Noise Guided Splatting(NGS)。3DGS在重建不透明物体时,由于仅优化RGB图像的光度损失而缺乏不透明度约束,常导致表面出现错误的透明效果,在交互式观看时尤为明显。NGS通过在物体体积内注入随机颜色的不透明噪声高斯,引导优化过程优先处理不透明表面,同时保持渲染质量。实验表明,NGS能显著减少虚假透明度,且在标

文章图片
#3d#人工智能#AIGC
【三维重建】Deformable Beta Splatting

摘要 南加州大学团队提出可变形贝塔喷溅(DBS)方法,突破3D高斯喷溅在几何与颜色建模上的局限。DBS采用可变形贝塔核替代高斯核,通过有限支撑范围和自适应频率控制,以45%参数量实现更高保真度的几何细节捕捉;同时引入球形贝塔模型改进颜色编码,用线性增长的反射波瓣参数高效模拟镜面高光。理论证明其核无关的MCMC优化策略仅需调整不透明度即可维持分布,实验显示DBS渲染速度比3DGS快1.5倍,达到SO

文章图片
#AIGC#人工智能#3d
    共 99 条
  • 1
  • 2
  • 3
  • 10
  • 请选择