2303_77547168 个人主页

@2303_77547168

2303_77547168

2024-11-28 11:48:52 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

小鸡毛的具身智能VLA入门自学路线

我在有一些C语言、git、linux、ROS的基本使用基础，SLAM方面的理论基础，了解部分传感器使用的情况下，大概花了300小时左右完成了对下列内容的学习来入门具身智能VLA领域。赵世钰老师的《强化学习中的数学原理》课程，再去学习PPO, GRPO, SAC等常见算法，学习方法同上，先通过AI定性了解，再回到原论文学习即可。比较古早的开源模型，适合快速上手复现微调来了解VLA到底在干嘛，不过不建

#人工智能 #学习

具身智能VLA论文系列解读（更新中）

标题：发布/更新时间： 2024.05首发，2025.08 最新版 (v5)为什么推荐：这是目前该领域引用率极高的一篇基础综述。它清晰地定义了 VLA 的概念，并把研究方向分为了三类：基于大型语言模型（LLM-based）、基于视觉语言模型（VLM-based）和从头训练的模型。它可以帮你理清 “VLA vs 传统控制” 的区别。你可以用它的分类逻辑来解释为什么现在的机器人比以前的更“聪明”（以前

#人工智能 #学习

面向具身智能的大规模轨迹自动化清洗与数据重打标Pipeline

核心工作：开发一套 Python 工具包。输入是几百 GB 脏乱差的 HDF5 原始数据，你的脚本能自动并行化地：筛出机械臂受力异常的无效帧。做相机图像与动作的时间戳对齐。调用 VLM（如免费的 API）给数据自动打高质量的文本标签（这叫 Data Relabeling，现在极其吃香）。交付物：不是虚假的成功率，而是清洗速度（如处理100GB数据仅需XX分钟），以及清洗前后数据质量的可视化对比

#github #人工智能

OpenVLA学习记录（论文解读与复现微调）

3.安装核心计算库PyTorch避开 NGC 系统源干扰，强制安装兼容 Flash Attention 的 CUDA 12.1 版本 PyTorch。我们现在的状态是：Conda 环境 (openvla) 已激活，PyTorch 已就位。请依次执行以下步骤，完成 OpenVLA 和 LIBERO 的最终部署。第一步：安装仿真环境与 OpenVLA 源码第二步：安装 Flash Attention

#github

Dexbotic对比评估部分主流VLA模型性能

由于Dexbotic最好使用容器进行开发或部署，我们首先需要解决租赁云服务器时实例本身就是Docker容器无法嵌套的问题。对此我们需要创建自定义镜像。以我自己的操作过程为例，我本身在无问芯穹的云服务器进行开发，先根据下图提示打开使用命令行上传镜像的地方：去到控制台，点击算力租赁点击左侧镜像选项，再点击自定义镜像，点击上传镜像，选择命令行上传，他会给出相应操作流程：保持在这个界面，作为我们后续将镜像

云租赁支持按小时、按天计费，可根据训练需求灵活选择租期，用完即还，无需承担硬件折旧、维护成本，贴合学生预算。灵活性强：可根据模型大小（如小规模实验、大规模数据集训练）切换不同规格显卡，按需调整算力、带宽，避免硬件性能过剩或不足的问题，适配AI训练的不同阶段需求。便捷高效：云服务器无需本地搭建硬件环境，无需担心散热、供电、空间等问题，通过远程连接即可启动训练，随时随地可查看进度，适配学生宿舍、实验室

#学习

到底了