
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
***中文大学Xue Tianfan团队在CVPR 2025提出了一项利用偏振信息消除图像反光的新方法PolarFree,并构建了目前最大规模的偏振反射消除数据集PolaRGB。该研究通过分析偏振特性区分反射与透射光,解决了传统方法依赖小规模合成数据的局限性。PolaRGB数据集包含6,500组精准对齐的RGB-偏振图像对,覆盖多样化的真实场景。PolarFree创新性地结合扩散模型生成无反射先验

本文提出了一种基于物理引导的噪声神经代理(PNNP)框架,用于低光照图像去噪中的噪声建模。该框架创新性地从暗帧而非成对数据中学习噪声分布,解决了传统方法对高质量数据的依赖问题。通过物理引导噪声解耦(PND)将暗帧分解为帧级、带状级和像素级噪声,分别采用物理建模和神经网络处理;设计了物理引导代理模型(PPM)融入传感器先验约束噪声生成;并提出可微分布损失(DDL)提供可靠监督。实验表明,PNNP能有

VGGT:基于视觉几何的多任务3D重建Transformer 牛津大学VGG团队提出的VGGT是一种创新的前馈神经网络架构,能够直接从单张或多张图像中一次性预测场景的所有关键3D属性。该模型突破性地实现了相机参数、点图、深度图和3D点轨迹的同步预测,无需传统的光束平差法等迭代优化步骤。基于标准Transformer构建的VGGT通过交替使用逐帧和全局自注意力机制处理输入图像,在多项3D任务中达到最

从相机到屏幕,研究人员已开发出一套成熟的系统,用于捕捉和复现人眼的色彩感知体验。本研究旨在对这一流程进行升级,将传统的 RGB(红绿蓝)色彩复现转变为多光谱图像(MSI)色彩复现。尽管多光谱图像在色彩匹配方面具有显著优势,但研究发现,要充分利用更多光谱信息实现色彩恒常性并非易事。因此,我们提出了一套正则化色彩复现系统,该系统包含两个核心部分:一是基于光谱先验引导的优化策略,用于建立传感器优化的 R

本文提出UltraFusion方法,首次实现曝光差达9档的图像融合。针对传统HDR成像在大曝光差、动态场景和色调映射中的问题,将曝光融合建模为引导式修复任务:以过曝光图像为基础,欠曝光图像为软引导,结合扩散先验和定制化网络架构。方法包含预配准和引导修复两阶段,通过分解-融合控制分支和保真度控制分支提升修复质量。实验表明,在静态/动态场景和自建UltraFusion数据集上均显著优于现有方法,解决了

优化,可以说是最常见到的一类数学问题,尤其在深度学习时代,大部分的工作都是围绕着数据构建,模型设计,loss 设计来开展的,深度学习训练模型的目的是拟合训练数据,或者说让设计的 loss 最优,无论是拟合训练数据,还是让 loss 最优,这都涉及到优化问题。有些函数很复杂,比如现在的 AI 模型,AI 模型本身也是一种函数,只是这个函数的表达式过于复杂,已经不能显式地将表达式写出来了。对于这类优化

本文介绍了光学像差分析中的重要工具——泽尼克系数。光学像差是指实际成像与理想模型的偏差,可分为低阶(如离焦、散光)和高阶(如球差、彗差)像差。光学工程师常用波前相位差图表征像差,而泽尼克多项式提供了一套在单位圆域内正交的基函数,可用于系统性地分析任意波前像差。泽尼克多项式包含径向和角向参数,其正交性允许将波前像差表示为这些基函数的线性组合。文中还给出了常见像差与泽尼克项的对应关系,并指出实际应用中

在主流的序列转录模型中,主要是依赖复杂的循环网络或者卷积神经网络,这类模型都包含一个 Encoder 和 Decoder。在性能最好的模型里,通常会在编码器与解码器之间使用一个注意力机制进行连接。这篇文章提出了一个简单的架构,称为 Transformer,仅仅只依靠注意力机制,不再需要循环或者卷积。文章提出的模型,在两个机器翻译任务上取得了更好的效果,同时具备更好的并行化以及更少的训练耗时。同时模

目标检测是计算机视觉领域非常重要的一个应用,是场景理解,多目标识别的前提,
目标检测是计算机视觉领域非常重要的一个应用,是场景理解,多目标识别的前提,







