
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
从斯坦福机器学习课程,到 Google Brain 的奠基,再到百度大脑的工程化实践与 Coursera 的在线教育革命,再到 Landing.ai 引领的工业 AI 现代化,吴恩达的职业轨迹几乎对应了过去二十年 AI 的几次关键跃迁。虽然论文聚焦于天然气压缩站这种特定设施,但其核心思想具有普适性——通过训练视觉模型,让 AI 从遥感图像中自动定位关键结构,弥补传统数据库的缺口,并为环境监测、资源
本文提出了 ROMAN(Robust Object Map Alignment Anywhere),这是一种新颖的全局定位框架,能够在具有挑战性的室内、城市以及非结构化自然场景中,通过配准开放集的对象地图来实现稳健定位。由所提出的方法找到的关联分段通过直线连接,并投影到图像平面上。为了提升不同视角下对象几何关系的一致性,ROMAN 特别引入了基于 IMU 或 LiDAR 自身推导的重力方向估计,将
实验结果表明,GSD-Occ在保持高质量占用预测的同时,满足自动驾驶对实时性的要求。

据综述《A Survey on Efficient Vision-Language-Action Models》所示,2023-2025 年间,在基础 VLA 模型持续迭代的同时,高效 VLA 从 2024 年底开始呈现爆发式增长,成为衔接模型能力与实际部署的关键赛道。通常则通过视觉和物理参数的域随机化、光线追踪的光照真实渲染、涵盖照明条件、相机视点、背景纹理和对象外观的系统增强,以及结合大规模仿
©️【深蓝AI】编译本文由paper一作——Zhefan Xu授权【深蓝AI】编译发布!论文题目:论文作者:近年来,强化学习(RL)在无人机控制领域展现出巨大潜力,为解决上述问题提供了新思路。强化学习允许无人机通过经验学习决策能力,提供更好的适应性和性能。然而,将强化学习应用于实际无人机导航仍面临三大挑战:1. 模拟到现实的迁移问题:强化学习需要在模拟环境中训练无人机,但模拟与现实世界之间存在感知
π0 平均成功率由 41.6% 提高到 85.7%,π0.5 从 40.1% 提升至 84.8%,证明该框架能在复杂、多样的具身环境中稳定扩展。SIMPLER 基准结果:在四项高精度操控任务(如放置勺子、胡萝卜、积木等)中,πRL 让 π0 的平均成功率从 67.2% 提升至 86.7%,π0.5 则从 59.2% 提升至 79.1%,展现出持续的自我强化效果。,将去噪方程改写为随机微分方程,在保

进一步地,他们利用梯度优化机制与可插拔的损失函数(如重建损失或 CLIP 相似度)构建了一套无需生成模型训练的图像生成流程,在图像修复与文本引导编辑任务中展现出高度的多样性与真实感。在生成建模方面,研究团队尝试从“噪声、流动、表征”的角度重新审视现有扩散模型框架,提出更具稳定性与可解释性的生成机制,使得模型能够在保持高保真度的同时实现更高的计算效率。进一步分析发现,这些模型学习到的并非简单的记忆特
以清华大学、浙江大学、上海交通大学、香港中文大学和香港科技大学为代表的高校,正在共同构筑中国具身智能研究的“技术地基”——从基础控制与软体执行器,到视觉语言模型与跨模态认知,再到手术机器人、微纳智能体与空地协同系统,中国学者的研究已不再局限于单一任务,而是向**“智能体—环境—任务”三位一体的认知闭环**不断延伸。数据,对近三年国内高校在机器人与具身智能领域的学术成果进行盘点,梳理代表性团队与研究
以清华大学、浙江大学、上海交通大学、香港中文大学和香港科技大学为代表的高校,正在共同构筑中国具身智能研究的“技术地基”——从基础控制与软体执行器,到视觉语言模型与跨模态认知,再到手术机器人、微纳智能体与空地协同系统,中国学者的研究已不再局限于单一任务,而是向**“智能体—环境—任务”三位一体的认知闭环**不断延伸。数据,对近三年国内高校在机器人与具身智能领域的学术成果进行盘点,梳理代表性团队与研究
以清华大学、浙江大学、上海交通大学、香港中文大学和香港科技大学为代表的高校,正在共同构筑中国具身智能研究的“技术地基”——从基础控制与软体执行器,到视觉语言模型与跨模态认知,再到手术机器人、微纳智能体与空地协同系统,中国学者的研究已不再局限于单一任务,而是向**“智能体—环境—任务”三位一体的认知闭环**不断延伸。数据,对近三年国内高校在机器人与具身智能领域的学术成果进行盘点,梳理代表性团队与研究







