
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
二者共同构成了一个不依赖外部标注的、自我完善的学习循环,为训练可靠、可解释的医疗AI提供了全新的范式。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。因此,我们提出了一种全新的技术方案,能够在无需任何中间步
AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。该论文指出,未来的 LLM 个性化研究不能仅停留在下游任务的结果对齐,而应深入到记忆治理的全生命周期中,开发更具鲁棒性的抗噪检索模型与兼顾情商的上下文利用策略
更重要的是,本文开源了全部数据和模型(DataMind-12K、DataMind-7B/14B),并分享了在数据过滤、训练策略、RL作用等方面的宝贵经验,旨在为社区在智能体训练这一前沿领域提供可操作、可复现的实践指南。:乔硕斐(浙江大学)、赵延秋(浙江大学)、邱志松(浙江大学)、王潇斌(阿里巴巴)、张锦添(浙江大学)、赵斌(浙江大学)、张宁豫(浙江大学)、蒋勇(阿里巴巴)、谢朋峻(阿里巴巴)、黄非
一旦积分KL散度被优化至收敛(接近0值),少步生成的“学生”模型便在概率意义上吸收了 "教师dLLM" 的知识。DiDi-Instruct 提出了一种独创的概率分布匹配的后训练策略,可以将原本需要500步以上昂贵的扩散语言“教师”(diffusion Large Language Model, dLLM)模型,蒸馏成一个仅需8-16步生成整个文本段落的“学生”模型。DiDi-Instruct 的提
从榜单来看,Gemini系列、GPT5、Seed1.6-vision等闭源模型的整体性能更胜一筹,但Qwen-Omni、InternVL、SAIL-VL、Ovis等系列的开源模型已具备强劲竞争力,英文榜单前10的模型中有5个为开源模型,而中文榜单前10的模型中,有7个为开源模型。而开源阵营中,Qwen3-Omni-30B-A3B-Instruct分别取得英文榜第二名和中文榜第三名的好成绩,此外,I
在减少大型语言模型(LLMs)的规模的同时保持其性能的挑战已经引起了广泛关注。在本文中,作者提出了一种新颖的方法,即个性化联邦学习与图注意力网络(pFedGAT),它捕获客户端之间的潜在图结构,并动态确定每个客户端对其他客户端的重要性,从而实现对聚合过程的细粒度控制。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链
我们之前了解了SFT的情况,而DPO算法虽然看起来复杂,但通过链式法则进行导数计算后,最终的梯度仍然在这一项上,某些变种算法也如此。例如,中间部分显示的都是由GPT生成的内容,在学习这些序列时,它们之间的影响很大,但在语义上却毫无关系。的情况,指的是答非所问的序列。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接
但遗憾的是,对比学习的batch size 方法一直是一个比较蛋疼的问题。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。看到这里的小伙伴们可能会产生疑问,分块累加这种操作本质上是将并行计算的过程用串行合并
上述过程建立起了建筑树与建筑程序之间的关联,从而把对建筑程序的合成转化为对建筑树的大规模合成,这一过程被建模为程序化合成。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。在推理阶段,训练后的网络以输入点云为
AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。当前像GPT-4o、DeepSeek-R1等大模型虽然能生成复杂推理链,但它们的“高级操作”(比如自我纠正、反向验证)往往是。迄今为止,AI TIME已经邀请







