logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

UC Berkeley、NVIDIA 及 Stanford 联合团队--机器人的“盲盒”开到头了:T-Rex 赋予机器人真实“手感”

UC伯克利、英伟达和斯坦福联合团队发布T-Rex框架,突破机器人触觉感知瓶颈。该研究通过拆解22类基础动作原语,构建包含100小时触觉同步数据的训练集,并创新设计时空触觉编码器将高频力学信号压缩为语义化特征。采用三专家异步架构实现视觉规划与触觉精调的解耦,在12项精细操作任务中成功率提升至65%,较基线模型提升近一倍。实验证明视觉预训练与触觉中期训练的协同效应,为具身智能发展指明"视觉思

#机器人
机器人需要的不是更大的模型,而是读懂物理世界的能力

斯坦福等机构研究者挑战当前具身智能主流范式,指出通用机器人发展的核心瓶颈并非模型规模不足,而是缺乏将物理经验转化为机器人可理解信号的机制。论文批判了当前三大主流方法:机器人原生监督(数据获取成本过高)、视频弱监督(无法直接转化为动作指令)和仿真世界模型(忽略关键物理变量)。作者提出四个关键突破方向:1)物理数据引擎与具身自动标注;2)跨具身任务保留重定向;3)物理扎根的世界模型;4)自我改进的部署

#机器人#人工智能#算法
拧个瓶盖就暴露了机器人的“通病”:不是手笨,是缺这种预判能力

摘要:最新研究《TacForeSight》提出突破性机器人触觉预判方案,通过力觉信号预测接触状态,显著提升精细操作能力。该系统采用"力觉先导-触觉跟进"的双阶段架构,其中轻量级世界模型(11.8M参数)利用120Hz力传感器数据预测后续触觉反馈,结合交叉注意力机制和自适应门控,使机器人在接触前就能调整动作。实验显示,在拧瓶盖等5项接触密集型任务中,其扰动场景成功率高达87%,远

文章图片
#机器人
首次提出Industry 6.0概念,构建了由生成式 AI 和异构机器人群体驱动的全自动化生产系统

摘要:IROS2025首次提出Industry6.0概念,构建生成式AI与异构机器人驱动的全自主生产系统。该系统通过LLMs实现高级推理与3D生成,四大核心环节(蓝图生成、零件生产、飞行输送、产品装配)无缝衔接。实验显示:系统设计效率提升47倍,全流程效率达人类4.4倍,GPT-4o等顶级LLMs表现最优。Industry6.0突破人机协作模式,实现从自然语言到物理产品的闭环生产,未来将向个性化制

文章图片
#人工智能#机器人#自动化
清华团队发布机器人版“GPT时刻”:UniDex让机械手看懂世界,零样本操控万物!

清华大学团队提出UniDex系统,通过从人类视频中提取操作数据并转换为机器人可学习的形式,构建了首个跨多种灵巧手的大型数据集UniDex-Dataset。该系统创新性地设计了统一动作空间FAAS,使模型能零样本适配不同机械手。实验显示,其UniDex-VLA模型在真实任务中平均成功率高达81%,远超现有方法,尤其在跨设备迁移时展现出色泛化能力。这一突破性工作通过利用海量人类视频数据,大幅降低了机器

文章图片
#机器人#人工智能
机器人学习十年进化史——从强化学习到VLA的范式变迁

发展范式演变:从强化学习到模仿学习,再到VLA,根本驱动力都是“数据”规模化。旧瓶颈被打破,新瓶颈出现,推动时代更迭。重要发展方向:Ted看好两条路径——①视频动作模型,使用生成式模型来理解物理世界;②第一人称人类数据,大规模采集并利用人类操作的一手数据。原理类比与整合操控(Manipulation)像大脑皮层,需要示例和监督;运动控制(Locomotion)像小脑/脊髓,是反射性的。如何将大脑(

文章图片
#机器人#学习#大数据
机器人实时操作真被它搞定了!这个VLA模型在芯片上跑出11.69Hz

【论文摘要】RhinoVLA通过系统性优化在机器人视觉-语言-动作(VLA)任务中实现高效部署。研究发现传统VLM模型的延迟瓶颈主要来自MLP投影算子而非注意力机制,通过采用视觉词元更高效的Qwen3-VL架构(压缩75%词元)、设计72D统一动作槽空间和InstanceLoRA适配机制,在保持多模态能力的同时显著提升推理速度。在Huixi R1芯片上实现11.69Hz实时推理(较基线提升10倍)

文章图片
#机器人
OpenClaw:具身智能的“智能中枢”,重塑未来AI Agent协作新范式

摘要:OpenClaw作为具身智能的"智能中枢",通过多Agent协作框架实现感知、决策与执行的统一调度。其核心技术包括SKILL固化、Harness抽象层、对话隔离机制及GitLab协作支持,有效提升复杂任务的执行稳定性。OpenClaw独特的动态调度机制结合定时任务策略,整合飞书等外部生态,形成高效的人机协作流程。未来,OpenClaw将与ClaudeCode、CodeX形

文章图片
#人工智能
Nature正刊:用神经网络替代有限元仿真,热电设计提速四个数量级

日本NIMS和筑波大学团队在《Nature》发表研究,开发出TEGNet神经网络,能在0.25秒内完成传统有限元仿真2237秒的热电器件性能预测,精度超99%。该技术突破热电设计瓶颈,通过模块化组合快速优化器件结构,成功研制出效率达9.3%和8.7%的领先器件,将AI应用从材料筛选推进到器件设计层面,实现"慢仿真"到"快推理"的范式转变,为复杂系统设计提供新

#神经网络#人工智能#深度学习
ICRA 2026 北邮本科生一作提出TransTac传感器-透明触觉+视觉融合!

北京邮电大学DeepTouch课题组在ICRA2026发表的研究提出了一种革命性的视触觉传感器TransTac,通过紫外编码透明弹性体技术,首次实现了机器人近接触区域的视觉观测与触觉感知同步。该传感器采用双目立体匹配和RGB-D融合技术,在物体距离小于9cm时仍能保持2.44mm的深度测量精度,有效填补了传统RGB-D相机的感知盲区。实验显示,TransTac采集的触觉图像能被视觉语言模型以83.

文章图片
#机器人
    共 290 条
  • 1
  • 2
  • 3
  • 29
  • 请选择