
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
随着深度学习的兴起,神经网络也似乎成了所有计算机视觉任务的标配,大家除了研究各种各样的网络结构之外,还有研究优化方法的,以及激活函数的,这篇博客就对当前各种各样的激活函数做一个总结,分析其背后的性质。到目前为止,激活函数的形式有很多种了,早期的激活函数主要是 sigmoid 以及 tanh 函数,这两种函数都能将输入限制在很小的范围内,算是一种非线性函数,后来又出现了 RELU 以及各种基于 RE
迁移学习也是最近机器学习领域很火热的一个方向,尤其是基于深度学习的迁移学习。
当前大多数任意尺度图像超分辨率(SR)方法通常依赖于由简单的合成退化模型(例如,双三次下采样)在连续的各种尺度下生成的模拟数据,因此在捕捉真实世界图像的复杂退化方面存在不足。这一局限性在将这些方法应用于真实世界图像时,会影响其视觉质量。为了解决这一问题,我们提出了连续光学变焦数据集(COZ),通过构建一个自动成像系统来收集特定范围内细粒度不同焦距下的图像,并提供严格的图像对配准。COZ 数据集可作

对更小外形尺寸相机的需求,推动了对光学复杂度降低(如减少透镜元件数量)的计算成像系统的研究。但此类简化的光学系统通常存在严重的像差问题,离轴区域尤为突出,且难以仅通过软件实现有效校正。本文提出中央凹堆叠成像系统,该系统利用新型动态光学元件 —— 可变形相位板(DPP),对图像传感器上任意位置实现局部像差校正。通过可微光学模型优化可变形相位板的形变模式,离轴像差得以局部校正,在注视点处生成清晰度提升

今天介绍一篇发表在 ACM SIGGRAPH 上的文章,是用手机的双摄系统来做人脸去模糊的工作。这也是谷歌计算摄影研究组的工作。快速运动物体的运动模糊在摄影中是一个一直以来的难题,在手机摄影中也是非常常见的问题,尤其在光照不足,需要延长曝光时间的场景。最近几年,我们也看到了图像去模糊领域的巨大进步,不过大多数的图像去模糊方法的算法开销很高,需要依赖很高的算力,同时在处理高分辨率图像时还存在局限于不

***中文大学Xue Tianfan团队在CVPR 2025提出了一项利用偏振信息消除图像反光的新方法PolarFree,并构建了目前最大规模的偏振反射消除数据集PolaRGB。该研究通过分析偏振特性区分反射与透射光,解决了传统方法依赖小规模合成数据的局限性。PolaRGB数据集包含6,500组精准对齐的RGB-偏振图像对,覆盖多样化的真实场景。PolarFree创新性地结合扩散模型生成无反射先验

本文提出了一种基于物理引导的噪声神经代理(PNNP)框架,用于低光照图像去噪中的噪声建模。该框架创新性地从暗帧而非成对数据中学习噪声分布,解决了传统方法对高质量数据的依赖问题。通过物理引导噪声解耦(PND)将暗帧分解为帧级、带状级和像素级噪声,分别采用物理建模和神经网络处理;设计了物理引导代理模型(PPM)融入传感器先验约束噪声生成;并提出可微分布损失(DDL)提供可靠监督。实验表明,PNNP能有

VGGT:基于视觉几何的多任务3D重建Transformer 牛津大学VGG团队提出的VGGT是一种创新的前馈神经网络架构,能够直接从单张或多张图像中一次性预测场景的所有关键3D属性。该模型突破性地实现了相机参数、点图、深度图和3D点轨迹的同步预测,无需传统的光束平差法等迭代优化步骤。基于标准Transformer构建的VGGT通过交替使用逐帧和全局自注意力机制处理输入图像,在多项3D任务中达到最

从相机到屏幕,研究人员已开发出一套成熟的系统,用于捕捉和复现人眼的色彩感知体验。本研究旨在对这一流程进行升级,将传统的 RGB(红绿蓝)色彩复现转变为多光谱图像(MSI)色彩复现。尽管多光谱图像在色彩匹配方面具有显著优势,但研究发现,要充分利用更多光谱信息实现色彩恒常性并非易事。因此,我们提出了一套正则化色彩复现系统,该系统包含两个核心部分:一是基于光谱先验引导的优化策略,用于建立传感器优化的 R

本文提出UltraFusion方法,首次实现曝光差达9档的图像融合。针对传统HDR成像在大曝光差、动态场景和色调映射中的问题,将曝光融合建模为引导式修复任务:以过曝光图像为基础,欠曝光图像为软引导,结合扩散先验和定制化网络架构。方法包含预配准和引导修复两阶段,通过分解-融合控制分支和保真度控制分支提升修复质量。实验表明,在静态/动态场景和自建UltraFusion数据集上均显著优于现有方法,解决了








