logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DepthDark让单目深度估计在低光环境下也能火眼金睛

本文提出DepthDark模型,用于解决低光环境下单目深度估计的挑战。通过设计低光数据集生成(LLDG)模块和低光参数高效微调(LLPEFT)策略,该模型有效克服了噪声放大和光度不一致问题。LLDG结合光晕模拟和物理噪声模型生成74,000对高质量训练数据;LLPEFT采用光照引导和多尺度特征融合技术,在几乎不增加参数的情况下显著提升性能。实验表明,DepthDark在nuScenes-Night

文章图片
#人工智能#计算机视觉
IROS 2025 | 北理工提出BoRe-Depth:仅8.7M参数,在嵌入式设备实现50.7 FPS高清深度估计

本文提出了一种面向嵌入式系统的自监督单目深度估计方法BoRe-Depth,旨在解决轻量化模型深度估计中边界模糊的问题。该方法采用创新的增强特征自适应融合模块(EFAF)和两阶段训练策略:第一阶段通过视图重建损失和边界对齐损失进行初步训练,第二阶段引入语义信息损失优化边界细节。实验表明,在NYUv2和KITTI等数据集上,BoRe-Depth仅用8.7M参数即达到SOTA性能,特别是在边界质量指标上

文章图片
#深度学习#计算机视觉
全景图单目尺度深度估计基座模型

影石Insta360联合多所高校推出全景深度估计基础模型DAP,通过构建200万张全景图数据集和渐进式三阶段训练方法,有效解决了数据稀缺和泛化难题。该模型采用DINOv3-Large作为骨干网络,结合几何感知优化策略,在多个基准测试中展现出优异的零样本性能。DAP不仅能精准处理真实拍摄的全景图像,对AIGC生成的艺术风格图像也表现出良好适应性,为全景深度估计提供了新的研究思路和实践路径。相关代码和

文章图片
#人工智能#计算机视觉
Nano Banana Pro (Gemini 3 Pro) 是低层视觉全能选手吗?

最近,文生图(Text-to-Image)模型的进化速度让人惊叹,它们在视觉内容创作领域掀起了一场革命。像Nano Banana Pro这样的商业产品(),更是吸引了无数眼球。不过,大家普遍关心的是,这个有着谷歌旗舰血统的强大模型除了能“画画”,能不能也作为一种通用的解决方案,去解决那些传统的、更基础的计算机视觉问题,比如图像去噪、超分辨率等?今天我们要解读的这篇技术报告,就深入探讨了这个关键问题

文章图片
#计算机视觉#人工智能
NVIDIA等联手打造“模糊扩散模型”:让AI学会像相机一样“思考”去模糊

本文提出BlurDM模型,通过双扩散机制改进图像去模糊效果。该模型在正向过程中模拟模糊形成的物理过程,同时添加结构化模糊和随机噪声;逆向过程则通过模糊残差估计器和噪声估计器实现双去噪与去模糊。BlurDM采用三阶段训练策略:先获取理想清晰先验,再训练扩散模型生成先验,最后联合微调整个系统。实验表明,该模型能显著提升现有去模糊网络的性能,在多个数据集上PSNR提升0.31-0.78dB,同时保持计算

文章图片
#人工智能#计算机视觉
FMA-Net++: Motion- and Exposure-Aware Real-World Joint Video Super-Resolution and Deblurring

本文介绍了一种新型视频修复方法FMA-Net++,由KAIST和Chung-Ang University团队提出。该方法创新性地将动态曝光因素纳入视频修复过程,解决了传统方法假设固定曝光导致的修复质量不稳定问题。FMA-Net++采用解耦设计,包含退化学习网络(Netᴰ)和恢复网络(Netᴿ),通过分层细化双向传播块(HRBP)实现并行长程时间建模,并结合曝光感知模块(ETM)动态调整修复策略。实

文章图片
#计算机视觉#人工智能
顶刊必备的图,原来这么简单!t-SNE降维,特征可视化,可解释性,深度学习故障识别,回归预测的必备工具!2个应用示例,直接运行!

t-SNE的目标是帮助我们在一个更低维度的空间中(通常是2D或3D)对数据进行可视化,同时保留数据点之间的相似性关系。t-SNE的目标是最小化这两个概率分布之间的差异,以确保高维空间中相似的点在低维空间中仍然保持相似。然后,在低维空间中,它再计算点与点之间的相似性,并构建另一个概率分布。t-SNE的核心思想是保持高维空间中数据点之间的相似性关系,尽量在低维空间中保持相似的关系。简而言之,t-SNE

文章图片
#深度学习#人工智能
医学图像开源数据集汇总

3D-IRCADb-01 数据库由 10 名女性和 10 名男性 75% 的肝肿瘤患者的 3D CT 扫描组成。20个文件夹对应20个不同的患者,可以单独下载也可以联合下载。下表提供了图像信息,例如肝脏大小(宽度、深度、高度)或根据 Couninaud 分割的肿瘤位置。它还表明肝脏分割软件可能遇到的主要困难是由于与邻近器官的接触、肝脏的非典型形状或密度,甚至图像中的伪影。

文章图片
#深度学习
深度学习训练过程可视化工具

地址:https://cbovar.github.io/ConvNetDraw/

文章图片
#深度学习#人工智能
顶刊必备的图,原来这么简单!t-SNE降维,特征可视化,可解释性,深度学习故障识别,回归预测的必备工具!2个应用示例,直接运行!

t-SNE的目标是帮助我们在一个更低维度的空间中(通常是2D或3D)对数据进行可视化,同时保留数据点之间的相似性关系。t-SNE的目标是最小化这两个概率分布之间的差异,以确保高维空间中相似的点在低维空间中仍然保持相似。然后,在低维空间中,它再计算点与点之间的相似性,并构建另一个概率分布。t-SNE的核心思想是保持高维空间中数据点之间的相似性关系,尽量在低维空间中保持相似的关系。简而言之,t-SNE

文章图片
#深度学习#人工智能
    共 23 条
  • 1
  • 2
  • 3
  • 请选择