爱学习的张大个人主页

@m0_56263746

爱学习的张大

2022-06-24 21:15:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

具身智能论文精读（三）：Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware（ACT）

精细操作任务依赖高精度闭环反馈，需要机器人具备极强的手眼协调能力，从而根据环境变化实时调整动作、重新规划轨迹。此类操作任务的例子包括打开调味杯盖或安装电池，这些操作涉及精细的操作，如捏合、撬开和撕裂，而非像挑选和放置这样的大动作。以图 1 中打开调料杯盖为例：杯子初始竖直放置在桌面，右侧夹爪需要先将杯子放倒，再推送至左侧张开的夹爪内；然后左侧的夹爪轻轻合上，将杯子从桌上抬起。接着，右手一根手指从下

机器人学习有望充分释放。

在构建 HDF5/Zarr 等大规模具身数据集时，我们需要定义“动作”。相比于“相对关节位移”或“末端 6DoF 位姿”，为什么 ACT 在绝大多数开源工程实践中，偏好将网络输出的 Action 定义为“绝对关节位置 (Absolute Joint Positions)”？

#人工智能

具身智能论文精读（一）：Universal Manipulation Interface: In-The-Wild Robot Teaching Without In-The-Wild Robots

该结果表明，仅使用窄域数据微调大预训练模型，不足以得到可在真实野外场景部署的机器人策略。因此，采集多样化的开放式真实场景数据，对于模型适配全新环境与未知物体、实现有效泛化依然至关重要。

#人工智能

具身智能论文精度（八）：Pi0.6

算法 1 给出了完整方法的流程概览。数据收集：通过模型自主交互（可选择性加入专家修正干预）采集数据；价值函数训练：按式 (1) 训练分布式价值函数；策略训练：按式 (3) 训练优势条件化 VLA 策略。预训练阶段使用全部历史示范数据；针对每个下游技能 \(l(i)\) 的专项微调阶段，会额外加入自主交互采集的数据。在实际实现中，专项技能模型（specialists）由预训练模型微调得到，而最终的通

#人工智能 #深度学习

深度学习中稀疏专家模型研究综述 A REVIEW OF SPARSE EXPERT MODELS IN DEEP LEARNING

稀疏模型的构建通常以稠密模型为基础，然后按。

#深度学习 #人工智能

具身智能数据Pipeline

1.目的：写一个脚本去自动化的执行整套具身智能数据处理管线输入为几百 GB 的原始 HDF5 格式机器人轨迹数据（含视觉图像、机械臂关节状态、动作指令、文本标签），输出为。2.交付物：不是虚假的成功率，而是清洗速度（如处理100GB数据仅需XX分钟），以及清洗前后数据质量的可视化对比图。vLLM。

#人工智能

具身智能论文精读（七）：Pi0.5

若要让机器人真正具备实用价值，就必须走出实验室，在真实物理世界中完成各类实际应用任务。尽管视觉 - 语言 - 动作（VLA）模型在机器人端到端控制上已取得亮眼效果，但这类模型在真实野外场景中的泛化能力上限，仍是一个尚未解决的开放性问题。本文提出。

#人工智能 #算法

大话机器学习-1.神经网络

神经网络是一层一层组织起来的一个层状结构。简单来说，就是由输入层，隐藏层，输出层组成。用于接受数据，节点数等于输入特征的维度。也就是神经网络进行思考的地方。就是产生预测结果。神经网络最重要的一个步骤就是学习，那么他是如何学习呢？实质上就是重复“进行前向传播计算损失函数进行反向传播进行更新权重”，从而重复“反向传播”从而的得到最优参数。

#机器学习 #神经网络 #人工智能

具身智能数据集格式

HDF5 是一种层次化的数据格式，可以像文件夹一样将图像、本体感受（Proprioception）、深度信息和机械臂动作序列打包在同一个文件中。适用模型/框架：ACT。

#人工智能

共 40 条

请选择