
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了一个通用化的HuggingFace模型缓存处理工具,能够自动解析snapshot目录下的软链接,生成文件名到blobs真实文件的映射关系。该工具支持任意符合HF标准缓存结构的模型(包括多模态模型),无需硬编码文件哈希/名称。提供两种处理模式:复制文件(保留元数据并验证完整性)或创建软链接(节省磁盘空间)。通过命令行参数可灵活指定源目录和目标目录,自动处理包括模型权重、配置文件、分词器等所

本文介绍了使用开源项目Psi0训练Unitree G1人形机器人的完整流程。首先详细说明了代码下载、uv安装和环境搭建步骤,包括Python依赖管理和虚拟环境配置。然后介绍了9个真实世界操作任务的数据集,包含双臂协调、精细操作等技能,并提供了批量下载脚本。文章还展示了数据可视化方法,通过修改代码解决兼容性问题。最后详细描述了模型微调和离线推理过程,包括模拟数据和真实数据的处理方式,提供了完整的推理

本文介绍了使用EasyR1框架对Qwen3-VL模型进行强化微调的完整流程。EasyR1是LLaMA-Factory作者开发的强化学习框架,支持多种强化学习方法。文章详细说明了从代码获取、环境配置到具体训练的操作步骤,包括创建conda环境、安装依赖库、配置训练脚本等关键环节。重点展示了数学推理强化训练示例,涉及奖励函数定义、提示词格式设置和训练脚本编写。同时提供了自定义训练的建议,包括准备奖励函

本文分享如何使用docker获取Nvidia 镜像,包括cuda10、cuda11等不同版本,cudnn7、cudnn8等,快速搭建深度学习环境。

前言本文记录docker保存镜像、打包tar、加载tar镜像。一、docker保存镜像作用:在现在容器镜像上保存镜像进行打包,在另一台服务上使用;或现有的容器安装了一些库,配置了开发环境,需要保存下载,下次加载后直接使用。1.1 首先查看下现有容器镜像(目的是查询需要保存镜像的ID)docker ps -a1.2 接下来用commit参数进行保存镜像(精简版)docker commit7ca736
下面的内容适合于初学者更好地对 不同的神经网络模型 能形象的了解。官网地址:http://playground.tensorflow.org/下图是主界面:参数说明:1)Problem type 问题类型(是分类问题,还是回归问题,可以选择)classification 分类regression 回归2)Epoch 迭代次数...
Dexbotic 是一个基于 PyTorch 的开源 VLA 模型工具,专为具身智能研究设计。它提供从数据预处理到模型训练、推理的一站式解决方案,支持多机器人平台(如 UR5、Franka)和主流 VLA 模型(如 CogACT、SimpleVLA-RL)。核心功能包括统一的 Dexdata 数据格式、模块化训练框架(支持 SFT、GRPO 微调)、云/本地分布式训练(兼容 DeepSpeed),

本文分享使用 RLinf 框架对 π₀ 和π₀.₅ 进行强化学习微调。支持`PPO`和`GRPO`等强化学习算法。示例覆盖从环境输入、核心算法、训练脚本配置到评估与可视化的完整流程,并提供可复现的命令和配置片段。

本文分析SimpleVLA-RL ,它是一款端到端 在线强化学习*的VLA框架

RoboBrain2.0是一款先进的机器人具身大脑模型,具备多模态感知、推理和规划能力。该模型提供3B、7B和32B三种版本,支持视觉编码和语言处理。主要功能包括: 图文问答(支持思考模式) 目标检测与定位 轨迹预测与规划 空间位置指向 具身导航任务 安装过程包括创建conda环境、安装依赖库和PyTorch。模型支持中文交互,可输出详细推理过程,并提供可视化结果。代码和论文已开源,适用于机器人复








