logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ICCV 2025 | 告别红外图像 “幻觉”!北理IRGPT横空出世:基于大规模真实红外文本数据集,双跨模态迁移学习登顶多任务

今天要给大家介绍的这项研究,可能会彻底改变这一现状——来自ICCV 2025的最新成果IRGPT,首个专为真实世界红外图像设计的视觉语言模型!为各位推广自己的论文搭建一个平台,让更多的人了解自己的工作,同时促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。先学和可见光长得像的红外图(比如近红外),再学差异大的(比如热红外)。先学那些图文匹配度高的样本,再挑战"说的和图的不太对得上

#迁移学习#人工智能#python +2
厦大实验室18篇论文被ICCV 2025录用

未破译甲骨字具有复杂的结构和抽象的图像,对破译构成了重大挑战。本文提出一种基于提示梯度投影的参数高效的微调方法,在有效缓解灾难性遗忘问题的同时,降低了模型训练和传输开销。该方法以visual prompts为基础,提出了“任务感知的提示梯度投影”和“双层提示回放”两个主要模块,前者有效避免对已学习知识的破坏,后者有效利用知识复盘,相辅相成,有针对性地缓解了灾难性遗忘问题。数据异质性问题,包括本地数

#目标跟踪#人工智能#计算机视觉 +1
又有实验室中了11篇ICCV 2025论文

3)蒸馏微调,进一步优化s-MLLM的知识。本文的方法在Bench2Drive数据集上实现了卓越的闭环性能,驾驶得分为77.74,成功率为54.62%,相较于最先进的(SOTA)方法,分别以14.28的驾驶得分和19.61%的成功率的巨大优势领先。该论文第一作者是博士生白健弘,指导老师:夏孟涵,胡浩基,白翔,其他合作者:付潇,王鑫涛,牟联瑞,曹晋文,刘佐珠,万鹏飞,张迪。该论文第一作者是博士生蔡雨

#人工智能
实验室12篇论文被NeurIPS 2025录用

点击上方“小白学视觉”,选择加"星标"或“置顶”来源:TsinghuaNLPNeurIPS 2025(Neural Information Processing Systems)近日发布了论文录用结果,我组共计 12 篇成果被录用。其中 10 篇被 Main Track 录用,2 篇被 Datasets and Benchmarks Track 录用。NeurIPS 是关于机器学习和计算神经科学的

再也不担心论文画图!Nano-Banana Pro 论文绘图最全教程发布

在实战中,如果你有一张目标风格的图片(甚至是你的手绘草稿),请直接上传给模型,并删除步骤二提示词中的通用 Art Style 描述,改为明确指令:“生成的 Figure 风格、布局特征和配色方案应严格参考我上传的图片”。仅仅告诉 AI 使用 "Light Blue" 或 "Red" 是远远不够的,这往往会导致生成图带有廉价的“塑料感”。的问题,最好的办法是用修图软件抹掉这些文字,然后换成符合论文格

#人工智能#计算机视觉#深度学习
论文党狂喜!alphaXiv推出Deep Research一秒搜遍arXiv,研究效率直接爆表

该平台由斯坦福大学的两位学生 Rehaan Ahmad 和 Raj Palleti 于 2023 年 5 月创立,最初是一个本科项目,目的是为学生和研究人员提供在线平台,用于讨论 arXiv 上未经同行评审的预印本论文。用户可通过将 arXiv 论文 URL 中的「arxiv.org」替换为「alphaxiv.org」,直接访问该论文的 alphaXiv 页面,并进行逐行评论与讨论。上手实测一下,

#人工智能#深度学习#计算机视觉 +1
何恺明ResNet登顶!Transformer上榜,Nature揭秘21世纪引量用最多的论文!

其他软件论文,如排名第十五的scikit-learn(Python机器学习库)和排名第十八的DESeq2(RNA测序分析),因其开源和易用性,成为科学家不可或缺的工具。此外,2017年谷歌发表的Attention is all you need排位列七,论文中提出了著名的Transformer架构,成为ChatGPT等大模型的核心。然而,令人意外的是,那些广为人知的科学发现:从mRNA疫苗和CRI

#transformer#人工智能#深度学习
全网都在吹的 Nano- banana 图像模型,全方面测评来了!

实话实说,这个模型在复杂任务处理的稳定性,尤其是多要素编辑的场景,目前来看并没有很好。这个玩法最近在社交媒体上超级火,核心思路就是:用一句 prompt,把一张真人或角色照片,变成一个完整包装的 Blender 3D 手办场景。人物角色的神态和穿搭都衔接得不错,表情也没出戏,就是背景太像 Unsplash 网图,略微掉点氛围感。但到了像素风和玩具风,完成度就明显不如前几个了,像素块太含糊,玩具风我

AI全国榜单爆冷,全网吃瓜大狂欢!这家黑马竟靠DeepSeek杀进全国TOP2

先有了一个明确的大纲式总结,网友就可以在几十秒内快速获取所需的黄金信息,随后在根据自己的情况去加深对单个信息的探索,从而避免在扑面而来的信息海洋中迷失自我、浪费时间。可以说,微博智搜不仅有商业价值,也有社会价值:不仅满足了微博用户对信息的需求,更重要的是提供了更真实、全平台的信息,某种程度上打破了「信息茧房」。根据它的总结,虽然立秋已过,但地表蓄积的夏季余热仍在释放,并且副热带高压异常强势,并且还

#人工智能
终于来了!OpenCV更新了:4.11.0和5.0预览版

点击上方“小白学视觉”,选择加"星标"或“置顶”重磅干货,第一时间送达来源:OpenCV与AI深度学习OpenCV 4.11.0 ChangeLog:OpenCV 4.x 新年更新已发布。通用的:5.x 的内部 C API 清理和反向移植。RISC-V/AArch64:禁用 CPU 功能检测#25901支持 C++20 标准#26590某些函数的 algoHint 参数可以实现更快的速度,但不..

#opencv#人工智能#计算机视觉
    共 1763 条
  • 1
  • 2
  • 3
  • 177
  • 请选择