智源社区个人主页

@BAAIBeijing

智源社区

2022-09-29 17:44:26 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

专访KAUST诸葛鸣晨丨2026 Agent最大突破是“递归自进化”，三年后有望实现“神经计算机”

也许你会意外的发现，2025年David Silver和Richard Sutton主推的Learning from Experience，以及2025年下半年到2026年上半年硅谷各大公司的老大比如Elon、Sam、Dario最近爱谈的Recursive Self-Improvement，三年前我以精准的terminology将其写入 MetaGPT 附录，如今它们正在逐步成为行业讨论的重点。最

上交大穆尧：数据为王，2026具身智能迎来“数据规模化元年”丨独家

人工智能与物理世界的深度融合正成为推动机器人技术革新的关键力量，上海交通大学助理教授穆尧博士，作为多模态具身智能（Embodied AI）和机器人学习领域的杰出研究者，围绕具身认知、行为生成、策略学习与统一基础模型构建等关键方向，取得了一系列具有代表性和影响力的研究成果，包括具身思维链模型 EmbodiedGPT、多模态机器人代码生成框架 RoboCodeX、可迁移视觉控制表征模型 CtrlFor

智源TALK｜NeurIPS/ACL/ICLR顶会洞察：可扩展强化学习的三条边界

强化学习正在重塑大模型能力边界——OpenAI o3、DeepSeek-R1、Gemini 3 等顶尖模型借助大规模 RL 刷新推理天花板，但核心问题始终是：RL 的 Scaling 边界究竟在哪里？欢迎大家一起讨论交流。第三，相比稀疏的结果奖励，On-Policy Distillation 提供的密集 token 级监督看似是"免费的午餐"，但这顿午餐，真的没有代价吗？研究方向为大模型对齐与强化

#人工智能 #算法 #深度学习 +1

2026智源大会议程公开丨从 Token 到世界状态预测，多模态的下一场范式革命

从2021年开始，带领团队和OpenAI团队紧密合作，对GPT系列模型进行了效率、鲁棒性和扩展性优化，推动相关服务和应用的产品化，包括以GPT-4作为主要模型的New Bing、由GPT-3.5提供后台服务的Github Copilot以及由DALL-E-2提供支持的Image Creator。2. 从2D到3D，构建空间感知基础模型：突破现有模型对物理世界三维空间理解的局限，探讨如何通过空间感知

#人工智能

智源研究院发布2025十大AI技术趋势，具身智能、Super APP、AI安全成焦点

1月8日，北京智源人工智能研究院（下称智源研究院）发布“2025十大AI技术趋势”。今年的十大AI趋势是智源研究院根据行业技术及应用热点，给出的年度AI趋势预测。从基础设施到产品应用，智源对Scaling Law、基础模型、具身智能、超级应用、AI安全等关键方向作出预测。针对每个趋势观点，报告给出其可成为2025年度趋势的论证逻辑。与此同时，在十大趋势发布会现场，来自清华等高校和企业界的领域专家，

#人工智能 #安全

FlagOS 核心算子库 FlagGems 全量支持 DeepSeek V4 算子，多芯片适配与多项首创性能优化技术同步落地

KernelGen 构建了一套基于 Agent 的自动化算子优化 pipeline：以初始 Triton kernel 和 reference 实现为起点，Agent 在每轮迭代中自主分析当前 kernel 的性能瓶颈与历史优化数据，自动实施优化策略，并完成正确性验证与性能 benchmark，全程无需人工干预，持续迭代直至达到目标性能，能够从朴素实现逐步逼近甚至超越手工调优的 TileLang

#性能优化

直播｜自动驾驶场景下的世界模型，可控驾驶场景视频生成方法研究

王啸峰，中国科学院自动化研究所五年级博士生，主要研究领域为计算机视觉，研究方向为GenAI和世界模型。在CVPR、ICCV、ECCV、ICLR、AAAI等国际顶级会议上发表相关论文14篇，谷歌学术引用600余次。基于生成模型的3D驾驶场景表示方法研究，其为实现安全、高效的自动驾驶闭环仿真提供了重要的技术支持。随着OpenAI Sora模型的发布，视频生成技术发展迈上了新的高度。如何将视频生成应用于

#自动驾驶 #人工智能 #机器学习

活动报名｜无需任何标注数据，大模型也可自我提升，腾讯R-Zero，利用大模型自我奖励的强化学习训练来实现自我演进

在这一框架中，首先从一个基础 LLM 出发，初始化两个具有不同角色的独立模型：一个是挑战者 (Challenger)，另一个是解答者 (Solver)。这两个模型分别独立优化，并通过交互共同进化：挑战者的奖励来自于提出接近解答者能力边界的任务，而解答者的奖励则来自于不断解决挑战者提出的更具挑战性的任务。然而，现有的自演进训练方法仍然严重依赖于大量人工整理的任务和标注 (human annotati

活动报名丨2024具身与世界模型专题峰会

大规模预训练模型的涌现为具身智能和世界模型等前沿方向注入新活力，同时也为产业发展开辟了新的可能。为了更好链接产业与科研融合，推动前沿学术交流，北京智源人工智能研究院精心策划，将于11月5日在智源大厦（北京市成府路150号）举办“智源论坛·2024具身与世界模型专题峰会”。清华大学自动化系教授、加速进化联合创始人赵明国，智源具身多模态大模型研究中心负责人仉尚航，北京大学助理教授、银河通用创始人、智源

自主智能体——迈向通用智能的必由之路丨智能体论坛精华集锦

在长链路调优中，团队采用后向对齐的方式，将多智能体组成的链路视为齿轮系统，通过固定后面的系统，调优前面的系统，实现多轮优化，显著提升了系统性能。智能体的认知结构由一些不同的核心内在状态组成，这些内在状态包括世界模型等用于根据当前状态预测未来的技术模块、用来存取过往经验的记忆模块、驱动智能体的目标模块、表征即时状态的情绪模块、以及综合长短期目标和当前状况来给予反馈的奖励模块等。与传统在线教育相比，该

共 236 条

请选择