logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

报名 | 世界智能产业博览会-大模型产业落地与生态构建

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!中国 · 天津2024 WIE世界智能产业博览会大模型产业落地与生态构建活动介绍 在当今人工智能迅猛发展的时代,大模型技术作为推动行业革新的关键力量,正逐步从理论研究走向产业应用。大模型以其超强的数据分析和处理能力,为各行各业带来了前所未有的智能化变革机遇。然而,大模型的产业落地和生态构建并非一帆风顺,它面临着算力资源分配、数据安全与隐私.

ACL 2025 最佳论文解读 | LLM注定是稀疏架构

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!点击 阅读原文 观看回放!论文题目: Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention作者简介袁境阳,北京大学计算机学院博士生内容简介长上下文建模是下一代语言模型的关键能力,但标准注意力机制的高计算开销带来了显著的计算挑战。稀疏

#人工智能#深度学习#机器学习 +2
季姮教授独家文字版干货 | 面向知识渊博的大语言模型

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!点击阅读原文观看季姮老师的讲座回放!随着人工智能和自然语言处理技术的迅猛发展,大语言模型(LLM)成为了众多领域研究的热点。LLM在文本生成、翻译和信息提取等任务中展示了令人瞩目的能力。然而,随着技术的深入,LLM在知识存储、控制和更新方面仍存在许多挑战。如何让模型更好地理解和处理复杂的、多样化的知识,成为当前亟待解决的关键问题之一。美..

#语言模型#人工智能#自然语言处理
ICLR'25 | 多模态角色扮演智能体的开发与评测综合框架

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!点击阅读原文观看作者讲解回放!作者简介代彦琪,中国人民大学高瓴人工智能学院三年级博士生,师从卢志武教授,2022年毕业于大连理工大学软件学院。他的研究兴趣包括通用多模态大模型、多模态角色扮演智能体、混合LoRA专家以及多任务学习。近期的研究目标是开发更强大、更通用的多任务多模态大模型,和探索多模态角色扮演在心理健康领域的潜在应用。如有任..

#人工智能
NeurIPS 2025 生成式推荐专场 | 大模型如何重塑下一代推荐系统?

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。迄今为止,AI TIME已经邀请了2000多位海内外讲者,举办了逾800场活动,超1000万人次观看。欢迎关注 AI TIME 论道 Bilibili 观看更

论文解读 | AAAI'25 CoRA:基于大型语言模型权重的协作信息感知用于推荐

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!点击阅读原文观看作者讲解回放!个人信息作者:刘禹廷,东北大学博士生内容简介将协作信息融入大型语言模型(LLMs)是一种有前景的适应推荐任务的技术。现有的方法通过将协作特征与文本标记拼接成统一的序列输入,然后进行微调以使这些特征与LLM的输入空间对齐来实现。尽管这种方法有效,但在本研究中,我们发现了在将LLM适应于推荐任务时的两个限制,这..

#语言模型#人工智能#机器学习 +2
ICLR 2025|中国科学技术大学LDS-新加坡国立大学 NExT专场

点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!AITIME01ICLR 2025预讲会团队专场AITIME02专场信息01 Opening讲者:王翔时间:3月12日15:00-15:05个人简介:中国科学技术大学特任教授、博导,入选 2021年海外优青项目,数据科学实验室LDS成员(负责人:何向南教授)。研究兴趣包括信息检索与推荐、大模型、可信可解释人工智能等,在相关领域的国际顶会(如

#人工智能
友情转发 | 2025年CIPS-SMP清智大模型基金申报倒计时7天!

CIPS-SMP清智大模型基金,致力于探索、支持并推动大模型与各领域的交叉研究和基础算法的创新。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。大模型与人文社会智能、大模型与教育变革、大模型与安全伦理治理、

#人工智能
ICLR 2025 杰出论文 | Learning Dynamics of LLM Finetuning

我们之前了解了SFT的情况,而DPO算法虽然看起来复杂,但通过链式法则进行导数计算后,最终的梯度仍然在这一项上,某些变种算法也如此。例如,中间部分显示的都是由GPT生成的内容,在学习这些序列时,它们之间的影响很大,但在语义上却毫无关系。的情况,指的是答非所问的序列。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接

#人工智能
CVPR 2025 Highlight | 可控视频生成新范式Uni3C:无需联合标注数据,一套框架统一相机与人体控制

为此,我们提出Uni3C(Unified 3D-enhanced Camera and Human Motion Control),基于3D引导的相机轨迹与人体运动统一控制的视频生成框架,在实现高精度相机轨迹控制的同时,支持复杂视角下人物与环境互动的物理空间合理性。AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接

    共 242 条
  • 1
  • 2
  • 3
  • 25
  • 请选择