logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

逆转ISP,港科大陈启峰团队提出了可逆ISP

编辑:Happy首发:AIWalkerPaper:https://arxiv.org/abs/2103.15061code:https://github.com/yzxing87/Invertible-ISP本文是港科大陈启峰老师团队在ISP方面的工作,已中CVPR2021。针对传统ISP中的信息损失且难以从sRGB进行RAW数据重建的问题,我们设计了一种可逆图像信号处理方案(InvISP),它对

BRIA.AI开源最强AI一键抠图模型RMBG,超简上手体验

本文首发:欢迎关注,近距离接触底层视觉与基础AI技术近日,团队于开源了一个基于ISNet背景移除模型,它可以有效对前景与背景进行分离。RMBG-1.4在精心构建的数据集上训练而来,该数据包含常规图像、电商、游戏以及广告内容,该方案达到了商业级性能,但仅限于非商业用途。。更详细的数据分布介绍请移步[,用户只需要上传图片即可体验。

文章图片
#人工智能
CVPR2024 | 大核卷积新高度101x101,美团提出PeLK

最近,一些大核卷积网络以吸引人的性能和效率进行了反击。然而,考虑到卷积的平方复杂度,扩大内核会带来大量的参数,而大量的参数会引发严重的优化问题。由于这些问题,当前的 CNN 妥协以条带卷积的形式扩展到 (即 + ),并随着内核大小的持续增长而开始饱和。在本文中,我们深入研究解决这些重要问题,并探讨我们是否可以继续扩展内核以获得更多性能提升。受人类视觉的启发,我们提出了一种类人外围卷积,通过参数共享

文章图片
CVPR2024 | Dropout之后又一改善图像超分泛化性能的正则方案SimpleAlign,已开源!

深度学习为图像超分辨率(SISR)带来了性能上的巨大飞跃。大多数现有工作都假设一个简单且固定的退化模型(例如双三次下采样),但Blind SR 的研究旨在提高未知退化情况下的模型泛化能力。最近,Kong等人率先研究了一种更适合使用 Dropout 的 Blind SR 训练策略RDSR。尽管这种方法确实通过减轻过度拟合带来了实质性的泛化改进,但我们认为Dropout 同时引入了不良的副作用,损害了

文章图片
CVPR2024 | 改善多模态大模型底层视觉能力,NTU与商汤联合提出Q-Instruct,已开源

以随机损坏 COCO数据集中的 1,012 张原始原始图像,其中人工扭曲率为 15 分之一。组装的子采样数据集由 18,973 张图像组成,这些图像进一步馈送到人类受试者以提供通路反馈。

文章图片
#计算机视觉
到底了