
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
UC伯克利、英伟达和斯坦福联合团队发布T-Rex框架,突破机器人触觉感知瓶颈。该研究通过拆解22类基础动作原语,构建包含100小时触觉同步数据的训练集,并创新设计时空触觉编码器将高频力学信号压缩为语义化特征。采用三专家异步架构实现视觉规划与触觉精调的解耦,在12项精细操作任务中成功率提升至65%,较基线模型提升近一倍。实验证明视觉预训练与触觉中期训练的协同效应,为具身智能发展指明"视觉思
斯坦福等机构研究者挑战当前具身智能主流范式,指出通用机器人发展的核心瓶颈并非模型规模不足,而是缺乏将物理经验转化为机器人可理解信号的机制。论文批判了当前三大主流方法:机器人原生监督(数据获取成本过高)、视频弱监督(无法直接转化为动作指令)和仿真世界模型(忽略关键物理变量)。作者提出四个关键突破方向:1)物理数据引擎与具身自动标注;2)跨具身任务保留重定向;3)物理扎根的世界模型;4)自我改进的部署
摘要:最新研究《TacForeSight》提出突破性机器人触觉预判方案,通过力觉信号预测接触状态,显著提升精细操作能力。该系统采用"力觉先导-触觉跟进"的双阶段架构,其中轻量级世界模型(11.8M参数)利用120Hz力传感器数据预测后续触觉反馈,结合交叉注意力机制和自适应门控,使机器人在接触前就能调整动作。实验显示,在拧瓶盖等5项接触密集型任务中,其扰动场景成功率高达87%,远

摘要:IROS2025首次提出Industry6.0概念,构建生成式AI与异构机器人驱动的全自主生产系统。该系统通过LLMs实现高级推理与3D生成,四大核心环节(蓝图生成、零件生产、飞行输送、产品装配)无缝衔接。实验显示:系统设计效率提升47倍,全流程效率达人类4.4倍,GPT-4o等顶级LLMs表现最优。Industry6.0突破人机协作模式,实现从自然语言到物理产品的闭环生产,未来将向个性化制

清华大学团队提出UniDex系统,通过从人类视频中提取操作数据并转换为机器人可学习的形式,构建了首个跨多种灵巧手的大型数据集UniDex-Dataset。该系统创新性地设计了统一动作空间FAAS,使模型能零样本适配不同机械手。实验显示,其UniDex-VLA模型在真实任务中平均成功率高达81%,远超现有方法,尤其在跨设备迁移时展现出色泛化能力。这一突破性工作通过利用海量人类视频数据,大幅降低了机器

发展范式演变:从强化学习到模仿学习,再到VLA,根本驱动力都是“数据”规模化。旧瓶颈被打破,新瓶颈出现,推动时代更迭。重要发展方向:Ted看好两条路径——①视频动作模型,使用生成式模型来理解物理世界;②第一人称人类数据,大规模采集并利用人类操作的一手数据。原理类比与整合操控(Manipulation)像大脑皮层,需要示例和监督;运动控制(Locomotion)像小脑/脊髓,是反射性的。如何将大脑(

【论文摘要】RhinoVLA通过系统性优化在机器人视觉-语言-动作(VLA)任务中实现高效部署。研究发现传统VLM模型的延迟瓶颈主要来自MLP投影算子而非注意力机制,通过采用视觉词元更高效的Qwen3-VL架构(压缩75%词元)、设计72D统一动作槽空间和InstanceLoRA适配机制,在保持多模态能力的同时显著提升推理速度。在Huixi R1芯片上实现11.69Hz实时推理(较基线提升10倍)

摘要:OpenClaw作为具身智能的"智能中枢",通过多Agent协作框架实现感知、决策与执行的统一调度。其核心技术包括SKILL固化、Harness抽象层、对话隔离机制及GitLab协作支持,有效提升复杂任务的执行稳定性。OpenClaw独特的动态调度机制结合定时任务策略,整合飞书等外部生态,形成高效的人机协作流程。未来,OpenClaw将与ClaudeCode、CodeX形

日本NIMS和筑波大学团队在《Nature》发表研究,开发出TEGNet神经网络,能在0.25秒内完成传统有限元仿真2237秒的热电器件性能预测,精度超99%。该技术突破热电设计瓶颈,通过模块化组合快速优化器件结构,成功研制出效率达9.3%和8.7%的领先器件,将AI应用从材料筛选推进到器件设计层面,实现"慢仿真"到"快推理"的范式转变,为复杂系统设计提供新
北京邮电大学DeepTouch课题组在ICRA2026发表的研究提出了一种革命性的视触觉传感器TransTac,通过紫外编码透明弹性体技术,首次实现了机器人近接触区域的视觉观测与触觉感知同步。该传感器采用双目立体匹配和RGB-D融合技术,在物体距离小于9cm时仍能保持2.44mm的深度测量精度,有效填补了传统RGB-D相机的感知盲区。实验显示,TransTac采集的触觉图像能被视觉语言模型以83.








