ModestCoder_ 个人主页

@ModestCoder_

ModestCoder_

2024-07-26 21:17:31 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

强化学习 Policy 的 Tracking 能力全解析，以Legged_gym为例解说Policy的训练流程

Legged Gym 的强化学习 Policy 本质上是一个通用的多模态跟踪系统。🎯 Tracking = 观测 (Observation) + 目标 (Target) + 奖励 (Reward)感知当前状态理解目标计算偏差输出控制min⁡πEτ∼π∑t0T∥st−stref∥2πminEτ∼πt0∑T∥st−stref∥2π\piπ: Policy 策略sts_tst: 当前状态s

#算法 #机器人 #人工智能 +1

路径规划算法总结：从 Dijkstra 到 A* 与 Hybrid A

Dijkstra 算法是一种，用于在加权图中寻找单源最短路径。

#算法 #机器人

ROS Bag与导航数据集技术指南

ROS Bag是ROS (Robot Operating System)的二进制时序数据格式,用于记录和回放ROS话题(topic)消息流。文件结构.bag文件 (二进制格式)│ ├── 版本号 (version)│ ├── 索引位置 (index_pos)│ └── 连接数量 (conn_count)├── Chunk Records (数据块)│ ├── Chunk Header (压缩信息)

#人工智能 #自然语言处理 #开发语言 +1

强化学习 Policy 的 Tracking 能力全解析，以Legged_gym为例解说Policy的训练流程

#算法 #机器人 #人工智能 +1

以 DeepRobotics Lite3 强化学习项目为例看观测量(Observation)在足式机器人强化学习中的作用（Isaac Gym vs Isaac Lab 双版本）

在 Lite3 强化学习项目中，观测量(Observation)是 Policy 网络的输入，它编码了机器人当前的状态信息。观测量的设计直接影响到策略学习的效果和泛化能力。重要说明🔵Isaac Gym 版本: 基于 NVIDIA Isaac Gym 的 Lite3_rl_training 项目：https://github.com/DeepRoboticsLab/Lite3_rl_trainin

#机器人 #人工智能 #开发语言 +1

Waypoint 在具身智能导航中的应用研究 ——以 NoMaD 为例的连续环境导航技术分析

在 Embodied AI（具身智能）导航任务中，WayPoint（航点）是指智能体（Agent）在三维空间中可以到达的、用于辅助路径规划的离散位置点。WayPoint 是连接“高层语义规划”与“底层机器人运动”的关键桥梁。并不是抛弃离散环境的思想，而是将离散环境中的“图结构（Graph）”内化为智能体的一种感知能力。通过深度学习网络（Predictor）实时利用 RGB-D 信息预测可达点，从而

#学习 #人工智能

【学习笔记】Diffusion Policy for Robotics

本文档基于我的兴趣与关注，结合扩散模型理论，全面阐述 Diffusion Policy 在机器人领域的应用。文档涵盖理论基础、实践经验、代码实现和前沿研究。🎯 核心问题：为什么需要 Diffusion Policy？📐 Diffusion Models 理论基础🔄 策略范式演进：Explicit、Implicit 与 Diffusion Policy🎯 Diffusion Policy 核

#学习 #人工智能 #论文阅读 +1

扩散模型 (Diffusion Models) 深度研究

以 Sora 和 Stable Diffusion 3 为代表，架构正向 DiT (Diffusion Transformer) 演进。Flow Matching 是扩散模型的广义化与升级（如 Flux, SD3 均采用此技术）。扩散模型本身只是一个算法框架，它的核心是一个“预测噪声”的神经网络。只是一个“去噪器”或“指南针”，它本身不包含图像。直观：网络看一眼噪点图，猜猜看加了什么噪。逻辑：新位

#论文阅读 #机器人 #算法 +1

DeepRobotics RL Training 安装与配置指南

这是云深处四足机器狗isaaclab训练环境的安装指南。✅ 已安装 Isaac Sim 5.1.0。✅ 已安装 Isaac Lab 2.3.0。✅ 如果看到这两个环境，说明安装成功！参数，因为项目依赖子模块。✅ Conda 环境。

#机器人 #人工智能 #开发语言 +1

【论文阅读】MDM : HUMAN MOTION DIFFUSION MODEL

不是完全都是人体动作。这一部分全部介绍的都是关于人体动作的生成。例如，它提到“神经动作生成，从动作捕捉数据中学习”、“从前缀姿态预测动作”、“解决插值和超分辨率任务”、“编辑和控制动作”、“根据动作类别、音频和自然语言进行控制”等，这些都明确指向生成人体动作。这一部分首先介绍了扩散模型作为一种通用生成模型。它提到扩散模型在“图像生成应用”中取得了突破，例如“文本到图像（text-to-image）

#论文阅读 #机器人

共 16 条

请选择