
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
关注公众号,发现CV技术之美本文为粉丝投稿。本文将为大家介绍Change-Agent: Towards Interactive Comprehensive Change Interpretation and Analysis from Change Detection and Change Captioning(遥感变化智能体:从变化检测和变化描述迈向可交互的全面变化解译与分析),数据集和代码即将
关注公众号,发现CV技术之美第七届中国模式识别与计算机视觉大会(The 7th Chinese Conference on Pattern Recognition and Computer Vision PRCV 2024)将于2024年10月18日-20日在乌鲁木齐举办。PRCV2024由中国自动化学会(CAA)、中国图象图形学学会(CSIG)、中国人工智能学会(CAAI)和中国计算机学会(CC
关注公众号,发现CV技术之美胡枭玮博士及其团队成员邢正昊、王天宇等作者,在阴影分析领域长期耕耘,共同撰写了题为《深度揭秘阴影世界:深度学习时代图像与视频阴影的检测、去除与生成全面综述》的重要综述论文。该论文汇集了来自上海人工智能实验室、香港中文大学和Adobe研究院等顶尖机构的研究力量,深入探讨了过去十年中深度学习在阴影分析处理领域的进展。通过详尽的深度模型、数据集以及评估指标的综合性论述,该论文
关注公众号,发现CV技术之美本文转自机器之心。虽然我从来没见过你,但是我有可能「认识」你 —— 这是人们希望人工智能在「一眼初见」下达到的状态。为了达到这个目的,在传统的图像识别任务中,人们在带有不同类别标签的大量图像样本上训练算法模型,让模型获得对这些图像的识别能力。而在零样本学习(ZSL)任务中,人们希望模型能够举一反三,识别在训练阶段没有见过图像样本的类别。生成式零样本学习(GZSL)是实现
同时,研讨会还专设深度伪造检测与定位挑战赛,分设图片赛道和音视频赛道,旨在弥补现有检测算法在精准定位伪造区域与多模态音视频协同伪造识别方面的短板,提升AI时代内容安全水位。研讨会将汇聚全球顶尖学者,共同攻克多模态伪造、弱监督伪造定位、伪造可解释性、生成式AI对抗与防御等核心技术瓶颈,推动建立可验证、可追溯的生成式AI内容安全分析体系。蚂蚁数科联合新加坡科技研究局人工智能前沿研究中心,南洋理工大学,
小红书 hi lab 推出的 dots.vlm1 多模态大模型以全链条自研和开源姿态,综合性能首次对标并逼近 Gemini 2.5 Pro、Seed-VL1.5 等闭源最强大模型,不仅在视觉-文本复杂场景中展现卓越,文本编码推理能力也保持主流水平。在文本任务(AIME、GPQA、LiveCodeBench 等)上,dots.vlm1 达到了与主流 LLM 相当的水准,具备通用数学推理和代码能力,但
关注公众号,发现CV技术之美项目链接(实时更新最新论文,已获1.8K Stars):https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models近来,多模态大语言模型(Multimodal Large Language Model,MLLM)受到广泛关注,成为一个新兴的研究热点。MLLM通常以大语言模型(Large Lang
DyFo 模拟人类视觉搜索策略,基于蒙特卡洛树搜索(MCTS)在多模态大模型与视觉专家之间实现高效协作,引导模型在多轮交互中动态调整关注区域,从而更准确地理解图像中的关键细节,显著提升模型在细粒度视觉任务中的表现。DyFo 模拟人类视觉搜索行为,结合蒙特卡洛树搜索(MCTS),在多模态大模型与视觉专家模型间实现高效协作,逐步聚焦关键区域,有效过滤无关信息,提升细粒度理解能力。与视觉专家的对比实验表
通过这样一个看似简单的改动,研究者们不仅让 DiT 获得了 3D 感知与控制能力,还在新视角合成(NVS)与空间感知编辑(spatial-aware editing)等任务中展现出强大潜力。研究者将其中 16 个 head 扩展到 patch-level 以下 1/16 的细节表示,虽然未到 pixel-level,但显著提升了空间精度,同时保持了与原有架构的兼容性。这样一来,Transforme
它不仅在生成质量和效率上取得了突破,更重要的是,它通过统一的框架和对长时序视频的学习,为构建真正理解物理世界、具备因果推理能力的通用AI代理(Embodied Agent)铺平了道路。这里的“原生”是关键,意味着它从设计之初就能同时处理和生成视觉(图片/视频)和语言(文字)信息,而不是像很多现有模型那样,通过“胶水”把独立的视觉模型和语言模型粘在一起。这是整个模型的基础。:最后,通过多任务强化学习







