logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

具身智能还有哪些适合研究生的方向?

具身智能是一个广阔且充满活力的交叉学科领域。它不仅是算法的竞技场,也是系统工程、硬件设计与认知科学的交汇点。VLA和RL/IL是两个核心切入点,前者更前沿,后者更扎实。最重要的是,具身智能的研究并非必须依赖昂贵的硬件。利用开源的仿真环境、公开数据集和代码框架,在纯软件层面同样可以开展极具深度的研究。希望这份梳理能帮助你拨开迷雾,找到属于自己的那条研究路径,共同见证这场AI与物理世界融合的浪潮。

文章图片
#人工智能#机器人
告别奖励函数:详解英伟达通用VLA×运控框架,一次搞定多模态机器人跑、跳、跪、爬

当前,虽然大语言模型和图像生成模型已经发展到万亿参数的规模,但人形机器人的控制技术却远远落后,模型规模小、行为单一,且训练过程需要大量人工设计的奖励函数,难以扩展。这种为特定任务手动设计奖励的方式,比如让机器人学会走路的奖励函数,并不能直接用于跳舞或格斗,导致每增加一个新能力,就需要重新设计一套复杂的系统,极大地阻碍了通用人形机器人控制技术的发展。为了解决这个问题,本文提出了一个。

文章图片
#机器人
真OR假:ImageNet缔造者苏昊_空降_复旦?深挖具身智能顶流的15年封神路与产业新局!

AI圈的"转会地震"比想象中更劲爆!继体育圈的转会乌龙闹剧后,学术与产业双界传来重磅消息——从定义计算机视觉的"数据基石"到开辟具身智能的"产业航道",这位手握多个"奠基级成果"的狠人,若真落地复旦,是否会重塑中国AI从实验室到产业的竞争格局?让我们深扒这位顶流学者的成长轨迹与时代布局。

文章图片
#人工智能#机器人
CoRL2025 爆火!12 篇 Oral 论文拆解具身智能突破:灵巧抓取、仿人平衡,真实机器人任务成功率飙升

CoRL 2025(Conference on Robot Learning 2025)作为聚焦机器人与机器学习交叉领域的旗舰会议,近日于 2025 年 9 月 27 日至 30 日在韩国首尔 COEX 会展中心举办CoRL与同馆联办形成 “机器人学习 + 人形机器人” 的交流场景,会议主题涵盖操作、感知、规划与安全、运动控制、人形机器人与硬件等方向,9 月 27 日为工作坊,28 日至 30 日

#机器人
宇树G1开启“打工人”模式,Humanoid Everyday数据集重磅开源!

Humanoid Everyday 项目通过提供大规模、多样化的数据集和标准化的评测平台,为通用人形机器人研究奠定了坚实的基础。实验分析不仅揭示了现有模仿学习方法在处理高维、复杂人形机器人任务时的局限性,也证明了大规模、多样化的数据预训练是提升模型泛化能力的关键路径。面对当前机器人学习数据集主要集中于固定基座机械臂,而现有人形机器人数据集在任务多样性、环境复杂性及人机交互方面存在局限的现状,南加州

文章图片
#机器人#人工智能
英伟达41页VLA框架:Alpamayo-R1凭“因果链推理”重塑端到端自动驾驶

这项研究为自动驾驶领域带来的启示是, 단순히模仿驾驶行为是不够的,赋予模型“思考”和“推理”的能力,是通向更高级别自动驾驶的关键路径。它展示了如何利用大型语言模型的推理能力来解决具身AI(如自动驾驶)中的实际问题,为后续研究提供了一个功能强大且可解释的框架。此外,如何让模型从更少的、更高质量的人类标注数据中学习到更强的因果推理能力,也是一个值得探索的方向。它利用一个强大的视觉语言模型(VLM)来理

文章图片
#自动驾驶#人工智能#机器学习
终极疑问:当前VLA SOTA模型已进化到顶了吗?自变量 + PI 开源,答案藏在这!

相比LLM用了3年才实现SOTA模型开源,VLA领域仅用不到1年就做到了——这不仅说明“具身智能是行业热点”,更反映出“开源是VLA快速落地的最佳路径”。开发者更活跃:中小团队、高校研究者能低成本参与VLA创新,比如有人会给模型加“老人护理场景的动作”,有人会优化“工业分拣的精准度”;硬件适配更快:机器人厂商不用再“自研AI”,直接用开源模型适配硬件,能加速“家庭服务机器人、工业协作机器人”的商业

文章图片
#开源#人工智能#机器人
NeurIPS 2025 具身智能 spotlight 四大金刚,从代码策略到场景建模,全方位领跑科研!

在,多篇直指当前该方向的核心落地瓶颈:大语言模型(LLM)驱动的code-as-policies策略,在动态/部分可观测场景中因环境接地不足,任务成功率难以保障;现有具身世界模型缺乏物理感知,无法精准建模3D几何与运动动力学,导致生成内容脱离实际场景约束;Transformer基具身策略处理长时任务时,视觉输入易超出上下文限制,记忆效率与泛化性不足;多模态大语言模型(MLLM)的具身智能体,还存在

文章图片
「硅谷库里」诞生!斯坦福AI机器人秀出丝滑连招:运球+急停+跳投,动作流畅如真人

斯坦福大学的“Learning to Ball”研究为解决强化学习在长时序、多阶段任务中的动作连贯性问题提供了一个强有力的框架。通过引入目标不明确的“中间策略”,并利用双向引导和同步适应机制进行训练,该方法成功让AI智能体掌握了类似人类球员的、连贯而流畅的篮球技巧。这项工作不仅在仿真环境中取得了高水平的量化指标,更重要的是,它为物理仿真角色的控制从“单一技能”向“复杂行为组合”的跨越,迈出了坚实的

文章图片
#人工智能#机器人
港大联手原力无限推出RoboTidy:用3DGS解决家务机器人难题,开源!!!

RoboTidy的发布标志着具身智能研究范式的一次重要演进:从追求算法的迭代,转向算法与环境协同发展。通过引入3DGS技术,RoboTidy构建了前所未有的高保真仿真环境,并通过严谨的Sim-to-Real实验证明了其对于提升物理机器人能力的直接价值。学术界与产业界的深度融合,正在加速将前沿算法转化为真实世界的生产力。随着RoboTidy的代码和数据集逐步开放,具身智能领域将在一个更坚实的基座上,

#3d#机器人
    共 27 条
  • 1
  • 2
  • 3
  • 请选择