logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

ICLR 2026|医疗多模态大模型的“显微镜”:开启无需标注的视觉推理新范式

二者共同构成了一个不依赖外部标注的、自我完善的学习循环,为训练可靠、可解释的医疗AI提供了全新的范式。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。因此,我们提出了一种全新的技术方案,能够在无需任何中间步

#人工智能#计算机视觉
Gemini 真的最懂你?先看这套评测:中科大×NUS 的真实场景准则

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。该论文指出,未来的 LLM 个性化研究不能仅停留在下游任务的结果对齐,而应深入到记忆治理的全生命周期中,开发更具鲁棒性的抗噪检索模型与兼顾情商的上下文利用策略

ICLR 2026|DataMind:构建通用数据分析智能体

更重要的是,本文开源了全部数据和模型(DataMind-12K、DataMind-7B/14B),并分享了在数据过滤、训练策略、RL作用等方面的宝贵经验,旨在为社区在智能体训练这一前沿领域提供可操作、可复现的实践指南。:乔硕斐(浙江大学)、赵延秋(浙江大学)、邱志松(浙江大学)、王潇斌(阿里巴巴)、张锦添(浙江大学)、赵斌(浙江大学)、张宁豫(浙江大学)、蒋勇(阿里巴巴)、谢朋峻(阿里巴巴)、黄非

#数据分析#数据挖掘
ICLR 2026 | 推理效率提升超60倍:DiDi-Instruct让扩散语言模型16步超越千步GPT

一旦积分KL散度被优化至收敛(接近0值),少步生成的“学生”模型便在概率意义上吸收了 "教师dLLM" 的知识。DiDi-Instruct 提出了一种独创的概率分布匹配的后训练策略,可以将原本需要500步以上昂贵的扩散语言“教师”(diffusion Large Language Model, dLLM)模型,蒸馏成一个仅需8-16步生成整个文本段落的“学生”模型。DiDi-Instruct 的提

#语言模型#人工智能#自然语言处理
OCRBench v2 25年9月最新榜单发布!揭示多模态大模型文档智能真实水平

从榜单来看,Gemini系列、GPT5、Seed1.6-vision等闭源模型的整体性能更胜一筹,但Qwen-Omni、InternVL、SAIL-VL、Ovis等系列的开源模型已具备强劲竞争力,英文榜单前10的模型中有5个为开源模型,而中文榜单前10的模型中,有7个为开源模型。而开源阵营中,Qwen3-Omni-30B-A3B-Instruct分别取得英文榜第二名和中文榜第三名的好成绩,此外,I

#人工智能
大模型新动向!探索动态推理、压缩蒸馏、个性化联邦学习的前沿

在减少大型语言模型(LLMs)的规模的同时保持其性能的挑战已经引起了广泛关注。在本文中,作者提出了一种新颖的方法,即个性化联邦学习与图注意力网络(pFedGAT),它捕获客户端之间的潜在图结构,并动态确定每个客户端对其他客户端的重要性,从而实现对聚合过程的细粒度控制。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链

#人工智能
ICLR 2025 杰出论文 | Learning Dynamics of LLM Finetuning

我们之前了解了SFT的情况,而DPO算法虽然看起来复杂,但通过链式法则进行导数计算后,最终的梯度仍然在这一项上,某些变种算法也如此。例如,中间部分显示的都是由GPT生成的内容,在学习这些序列时,它们之间的影响很大,但在语义上却毫无关系。的情况,指的是答非所问的序列。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接

#人工智能
CVPR 2025 Highlight | 把Contrastive Loss的Batch Size冲到100M!

但遗憾的是,对比学习的batch size 方法一直是一个比较蛋疼的问题。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。看到这里的小伙伴们可能会产生疑问,分块累加这种操作本质上是将并行计算的过程用串行合并

#batch#开发语言
CVPR 2025 | 基于建筑程序的三维结构化简模重建

上述过程建立起了建筑树与建筑程序之间的关联,从而把对建筑程序的合成转化为对建筑树的大规模合成,这一过程被建模为程序化合成。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。在推理阶段,训练后的网络以输入点云为

告别Reasoning模型的“灵光一现”,推理能力可控了

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。当前像GPT-4o、DeepSeek-R1等大模型虽然能生成复杂推理链,但它们的“高级操作”(比如自我纠正、反向验证)往往是。迄今为止,AI TIME已经邀请

    共 268 条
  • 1
  • 2
  • 3
  • 27
  • 请选择