
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
我在有一些C语言、git、linux、ROS的基本使用基础,SLAM方面的理论基础,了解部分传感器使用的情况下,大概花了300小时左右完成了对下列内容的学习来入门具身智能VLA领域。赵世钰老师的《强化学习中的数学原理》课程,再去学习PPO, GRPO, SAC等常见算法,学习方法同上,先通过AI定性了解,再回到原论文学习即可。比较古早的开源模型,适合快速上手复现微调来了解VLA到底在干嘛,不过不建
标题:发布/更新时间: 2024.05首发,2025.08 最新版 (v5)为什么推荐:这是目前该领域引用率极高的一篇基础综述。它清晰地定义了 VLA 的概念,并把研究方向分为了三类:基于大型语言模型(LLM-based)、基于视觉语言模型(VLM-based)和从头训练的模型。它可以帮你理清 “VLA vs 传统控制” 的区别。你可以用它的分类逻辑来解释为什么现在的机器人比以前的更“聪明”(以前
核心工作: 开发一套 Python 工具包。输入是几百 GB 脏乱差的 HDF5 原始数据,你的脚本能自动并行化地:筛出机械臂受力异常的无效帧。做相机图像与动作的时间戳对齐。调用 VLM(如免费的 API)给数据自动打高质量的文本标签(这叫 Data Relabeling,现在极其吃香)。交付物: 不是虚假的成功率,而是清洗速度(如处理100GB数据仅需XX分钟),以及清洗前后数据质量的可视化对比
3.安装核心计算库PyTorch避开 NGC 系统源干扰,强制安装兼容 Flash Attention 的 CUDA 12.1 版本 PyTorch。我们现在的状态是:Conda 环境 (openvla) 已激活,PyTorch 已就位。请依次执行以下步骤,完成 OpenVLA 和 LIBERO 的最终部署。第一步:安装仿真环境与 OpenVLA 源码第二步:安装 Flash Attention
由于Dexbotic最好使用容器进行开发或部署,我们首先需要解决租赁云服务器时实例本身就是Docker容器无法嵌套的问题。对此我们需要创建自定义镜像。以我自己的操作过程为例,我本身在无问芯穹的云服务器进行开发,先根据下图提示打开使用命令行上传镜像的地方:去到控制台,点击算力租赁点击左侧镜像选项,再点击自定义镜像,点击上传镜像,选择命令行上传,他会给出相应操作流程:保持在这个界面,作为我们后续将镜像
标题:发布/更新时间: 2024.05首发,2025.08 最新版 (v5)为什么推荐:这是目前该领域引用率极高的一篇基础综述。它清晰地定义了 VLA 的概念,并把研究方向分为了三类:基于大型语言模型(LLM-based)、基于视觉语言模型(VLM-based)和从头训练的模型。它可以帮你理清 “VLA vs 传统控制” 的区别。你可以用它的分类逻辑来解释为什么现在的机器人比以前的更“聪明”(以前
标题:发布/更新时间: 2024.05首发,2025.08 最新版 (v5)为什么推荐:这是目前该领域引用率极高的一篇基础综述。它清晰地定义了 VLA 的概念,并把研究方向分为了三类:基于大型语言模型(LLM-based)、基于视觉语言模型(VLM-based)和从头训练的模型。它可以帮你理清 “VLA vs 传统控制” 的区别。你可以用它的分类逻辑来解释为什么现在的机器人比以前的更“聪明”(以前
标题:发布/更新时间: 2024.05首发,2025.08 最新版 (v5)为什么推荐:这是目前该领域引用率极高的一篇基础综述。它清晰地定义了 VLA 的概念,并把研究方向分为了三类:基于大型语言模型(LLM-based)、基于视觉语言模型(VLM-based)和从头训练的模型。它可以帮你理清 “VLA vs 传统控制” 的区别。你可以用它的分类逻辑来解释为什么现在的机器人比以前的更“聪明”(以前
云租赁支持按小时、按天计费,可根据训练需求灵活选择租期,用完即还,无需承担硬件折旧、维护成本,贴合学生预算。灵活性强:可根据模型大小(如小规模实验、大规模数据集训练)切换不同规格显卡,按需调整算力、带宽,避免硬件性能过剩或不足的问题,适配AI训练的不同阶段需求。便捷高效:云服务器无需本地搭建硬件环境,无需担心散热、供电、空间等问题,通过远程连接即可启动训练,随时随地可查看进度,适配学生宿舍、实验室







