logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

CVPR 2025 Highlight | 在分布偏移下对目标检测器和多模态大模型进行基准测试

我们的研究发现,尽管大型模型和广泛的预训练数据在分布内(In-Distribution,IID)场景中显著提升了性能,但在OOD场景中,目标检测器和MLLMs仍然存在显著的局限性和改进空间。实验结果表明,在test集上,现有模型的性能显著低于在validation集上的表现,揭示了当前主流视觉模型在处理分布外泛化任务时存在明显的性能退化,难以有效应对OOD场景下的识别挑战。从实验结果中可以进一步观

#目标跟踪#人工智能#计算机视觉 +1
终于来了!NExT-Chat:对话、检测、分割多模态大模型。 NUS、清华联合出品!

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!随着年初ChatGPT的爆红,多模态领域也涌现出一大批可以处理多种模态输入的对话模型,如LLaVA, BLIP-2等等。为了进一步扩展多模态大模型的区域理解能力,近期新加坡国立大学和清华大学的小伙伴打造了一个可以同时进行对话和检测、分割的多模态模型NExT-Chat:题目:NExT-Chat: An LMM for Chat, Detect

#人工智能
论文解读 | ACL2024 Outstanding Paper:因果指导的主动学习方法:助力大语言模型自动识别并去除偏见...

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!点击阅读原文观看作者直播讲解回放!作者简介孙洲浩,哈尔滨工业大学SCIR实验室博士生概述 尽管大语言模型(LLMs)展现出了非常强大的能力,但它们仍然面临与各种偏见相关的挑战。传统的自动去偏见方法主要针对判别式模型,在应对生成式LLMs固有的复杂偏见方面存在困难。为了解决这些局限性,作者设计了因果指导的主动学习方法来自动自主地识别LLMs的

#学习方法#语言模型#人工智能 +2
推理模型 | 利用投机采样加速大模型推理

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!简介在大模型的应用场景中,推理速度是最为影响用户体验的要素之一。针对大模型推理速度的优化有很多工作,本文将聚焦于投机采样技术。目前的大模型通常采用自回归的方式生成文本,即每次前向传播只输出一个单词,这是限制其推理速度的重要因素。投机采样通过引入一个参数较小的模型生成多个候选词(drafting),然后利用标准模型对候选词进行批量验证,从而减

#人工智能
CVPR 2025 Highlight | 超大幅面的遥感多模态大模型评测与训练

此外,该评测集还特别设计了变化检测任务,充分体现了对遥感图像时空信息的建模能力,即通过前后两幅高分辨率影像,考察模型对时序变化的理解与判断能力。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。同时,我们也设

OCRBench v2 25年9月最新榜单发布!揭示多模态大模型文档智能真实水平

从榜单来看,Gemini系列、GPT5、Seed1.6-vision等闭源模型的整体性能更胜一筹,但Qwen-Omni、InternVL、SAIL-VL、Ovis等系列的开源模型已具备强劲竞争力,英文榜单前10的模型中有5个为开源模型,而中文榜单前10的模型中,有7个为开源模型。而开源阵营中,Qwen3-Omni-30B-A3B-Instruct分别取得英文榜第二名和中文榜第三名的好成绩,此外,I

#人工智能
热点速递|Claude Code 源码意外泄露之后,闭源 Agent 的护城河还稳吗?

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾800场活动,超1000万人次观看。AI TIME欢迎每一位AI爱好者的加入!提出观点,表达

#人工智能
热点速递|Cursor事故——仅仅是AI失控吗?

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾800场活动,超1000万人次观看。AI TIME欢迎每一位AI爱好者的加入!提出观点,表达

#人工智能
ICLR 2026|Information Gain-based Policy Optimization:用信息增益训练多轮搜索智能体

最终,IGPO 使用与 GRPO 类似的 clipped surrogate objective 更新策略,但不再把同一个 rollout-level advantage 分配给整条输出,而是把每一轮的 discounted return 分配给该轮产生的 decision tokens。在 Qwen2.5-3B-Instruct 上,outcome-only 的平均 F1 为 32.3,IG-o

#人工智能
ICLR 2026 | 旅行攻略背后的智能体难题:ChinaTravel 检验 LLM Agent 在开放世界中的可靠性

该论文把多种神经-符号变体(基于整数规划的 TTG、基于验证器反馈的LLM-modulo,以及作者新提出的 NeSy Planning)放到统一实验框架下系统比较,借此把当下语言智能体在多日开放规划上的真实瓶颈清晰地刻画出来。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩

    共 333 条
  • 1
  • 2
  • 3
  • 34
  • 请选择