logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【机器人】复现 Embodied-Reasoner 具身推理 | 具身任务 深度推理模型 多模态场景 长远决策 多轮互动

文章摘要 Embodied-Reasoner是一个多模态具身模型,扩展了深度推理能力至具身交互任务,支持AI2THOR仿真环境中的复杂操作(如物体搜索、搬运)。其核心能力包括:深度推理(分析/空间推理/规划)、多模态处理(图像-文本序列)及环境交互(自主探索)。复现流程涵盖环境配置(Conda+AI2Thor)、模型部署(通义千问权重)、任务合成(JSON模板生成)及轨迹生成(单/多步骤任务),并

文章图片
#机器人
《VLA 系列》HumDex | 人形机器人 | 全身灵巧操作 | 遥操作系统 | 数据采集

HumDex 是一个面向人形机器人 全身灵巧操作的便携式遥操作系统。

文章图片
《VLA 系列》OpenVLA-OFT | 并行解码 | 连续动作 |VLA动作解码方法对比

OpenVLA-OFT:高效并行解码的连续动作生成方案 传统OpenVLA采用自回归解码和离散动作表示,存在效率低、精度差等问题。OpenVLA-OFT通过三大改进优化性能: 并行解码:将自回归改为单次前向传播生成动作分块,显著提升推理效率; 连续动作表示:直接输出连续动作向量,避免离散化带来的精度损失; L1回归目标:替换交叉熵损失,提升训练收敛速度和动作精度。 对比其他方法(如扩散建模和流匹配

文章图片
Qwen3-VL 目标检测 | 生成训练标签 | LabelMe格式 | COCO格式

本文介绍了基于Qwen3-VL模型的物体检测方法,支持批量检测指定类别物体并输出LabelMe格式标注文件和可视化结果。该方法利用Qwen3-VL视觉语言模型实现端到端检测,无需额外训练检测器,通过自然语言提示词约束模型输出。系统提供标准化输出和可视化功能,支持将检测结果自动转换为LabelMe标注格式,并设计了强容错的结果处理机制。文章详细介绍了transformers和vLLM两种实现版本,包

文章图片
#目标检测
Hugging Face 模型缓存文件 | 复制权重 | 通用化

本文介绍了一个通用化的HuggingFace模型缓存处理工具,能够自动解析snapshot目录下的软链接,生成文件名到blobs真实文件的映射关系。该工具支持任意符合HF标准缓存结构的模型(包括多模态模型),无需硬编码文件哈希/名称。提供两种处理模式:复制文件(保留元数据并验证完整性)或创建软链接(节省磁盘空间)。通过命令行参数可灵活指定源目录和目标目录,自动处理包括模型权重、配置文件、分词器等所

文章图片
《VLA 系列》复现 Ψ₀ | Psi0 | 通用人形机器人 | 移动操作模型

本文介绍了使用开源项目Psi0训练Unitree G1人形机器人的完整流程。首先详细说明了代码下载、uv安装和环境搭建步骤,包括Python依赖管理和虚拟环境配置。然后介绍了9个真实世界操作任务的数据集,包含双臂协调、精细操作等技能,并提供了批量下载脚本。文章还展示了数据可视化方法,通过修改代码解决兼容性问题。最后详细描述了模型微调和离线推理过程,包括模拟数据和真实数据的处理方式,提供了完整的推理

文章图片
#机器人
VLM强化微调 | 多模态强化学习训练 | EasyR1

本文介绍了使用EasyR1框架对Qwen3-VL模型进行强化微调的完整流程。EasyR1是LLaMA-Factory作者开发的强化学习框架,支持多种强化学习方法。文章详细说明了从代码获取、环境配置到具体训练的操作步骤,包括创建conda环境、安装依赖库、配置训练脚本等关键环节。重点展示了数学推理强化训练示例,涉及奖励函数定义、提示词格式设置和训练脚本编写。同时提供了自定义训练的建议,包括准备奖励函

文章图片
docker 获取Nvidia 镜像 | cuda |cudnn

本文分享如何使用docker获取Nvidia 镜像,包括cuda10、cuda11等不同版本,cudnn7、cudnn8等,快速搭建深度学习环境。

文章图片
#docker#ubuntu
docker保存镜像、打包tar、加载tar镜像

前言本文记录docker保存镜像、打包tar、加载tar镜像。一、docker保存镜像作用:在现在容器镜像上保存镜像进行打包,在另一台服务上使用;或现有的容器安装了一些库,配置了开发环境,需要保存下载,下次加载后直接使用。1.1 首先查看下现有容器镜像(目的是查询需要保存镜像的ID)docker ps -a1.2 接下来用commit参数进行保存镜像(精简版)docker commit7ca736

#docker#容器#运维
搭建神经网络---可视化 网站(干货)

下面的内容适合于初学者更好地对 不同的神经网络模型 能形象的了解。官网地址:http://playground.tensorflow.org/下图是主界面:参数说明:1)Problem type 问题类型(是分类问题,还是回归问题,可以选择)classification 分类regression 回归2)Epoch 迭代次数...

    共 198 条
  • 1
  • 2
  • 3
  • 20
  • 请选择