
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本项目基于深度强化学习(DRL)技术,开发了一套无人车自主导航与动态避障系统。采用TD3(双延迟深度确定性策略梯度)算法构建Actor-Critic架构,通过激光雷达感知和ROS-Gazebo仿真平台,实现无人车在复杂机场环境下的端到端导航控制。系统包含状态预处理、奖励函数设计、经验回放缓冲等模块,采用双重Q网络、目标平滑噪声和延迟策略更新等技术提升训练稳定性。项目实现了从算法设计到仿真验证的完整

本文介绍了主流AI模型API的购买与接入配置指南。核心概念包括Token计费、上下文窗口、缓存机制等。详细说明了DeepSeek和智谱AI平台的注册流程、API Key获取方式及安全存储建议。定价部分对比了各模型版本的费用差异,如DeepSeek V4系列和GLM旗舰模型的阶梯式计费标准。特别强调了缓存命中可大幅降低成本,并提供了企业认证和环境变量配置的最佳实践。文章还提及了平台限时优惠活动,帮助

本文提出了一种基于混合专家(MoE)的强化学习框架,用于提高四足机器人Sim-to-Real迁移的可靠性。针对仿真训练与真实部署间的性能差距问题,研究团队开发了创新的MoE学生编码器架构,通过并行专家子网络和动态门控机制增强本体感知表征能力。该方法在Unitree Go2机器人上验证,通过精心设计的奖励函数(包括创新的髋关节对称性奖励)和动态速度跟踪调节策略,实现了复杂地形下的鲁棒运动控制。实验表

本文介绍了三种AI编程助手(VS Code、Trae CN、Claude Code)的Skill功能使用指南。主要内容包括: 通用标准:三者遵循同一套Skill开放标准,核心文件为SKILL.md(包含YAML头和Markdown正文),支持类似目录结构。 工具特性: VS Code:支持多路径存放,提供Chat自定义编辑器 Trae CN:支持AI辅助创建和ZIP包导入 Claude Code:

本文档说明如何在没有 Xbox/Switch 游戏手柄的情况下,使用键盘替代手柄控制 Unitree MuJoCo 仿真器中的机器人。(Isaac Sim训练+测试→ sim2sim → mujoco测试)

本文介绍了三种AI编程助手(VS Code、Trae CN、Claude Code)的Skill功能使用指南。主要内容包括: 通用标准:三者遵循同一套Skill开放标准,核心文件为SKILL.md(包含YAML头和Markdown正文),支持类似目录结构。 工具特性: VS Code:支持多路径存放,提供Chat自定义编辑器 Trae CN:支持AI辅助创建和ZIP包导入 Claude Code:

本文介绍了基于MuJoCo的机器人仿真学习项目,重点讲解了机器人运动学、动力学和控制的核心算法原理。项目支持Franka Emika Panda等机器人模型,包含逆运动学求解(KDL、Pinocchio、CasADi优化)、轨迹规划(TOPPRA、RRTConnect)、动力学控制(阻抗/导纳/PID控制)以及强化学习PPO算法实现。详细推导了旋转表示(矩阵/四元数/欧拉角)、变换矩阵和雅可比矩阵

Unitree RL Lab 是由宇树科技开发的强化学习机器人控制开源项目,基于NVIDIA Isaac Lab框架构建。该项目为宇树系列机器人提供完整的强化学习训练与部署流程,支持7款不同型号机器人,包含Locomotion(速度跟踪)和Mimic(动作模仿)两种核心任务。技术架构采用"训练-部署"分离设计,训练侧基于Isaac Sim仿真器和RSL-RL PPO算法,部署侧

本文深入解析宇树科技Unitree RL Gym的deploy部署模块,涵盖仿真和实物机器人部署方案。模块分为MuJoCo仿真部署(Python实现)和实物机器人部署(Python/C++双版本),支持G1/H1等机器人型号。MuJoCo部署提供轻量级策略验证,包含PD控制器、重力计算等核心功能;实物部署采用DDS通信协议,C++版本引入双缓冲架构提升性能。文章详细剖析了目录结构、部署链路、关键算

本文深度解析了宇树科技开源足式机器人强化学习训练框架legged_gym的技术实现。该框架基于NVIDIA Isaac Gym GPU并行仿真引擎,支持GO2四足机器人和G1/H1双足机器人,采用PPO算法进行端到端步态控制策略训练。核心特性包括4096环境并行仿真、非对称Actor-Critic架构、LSTM时序策略网络、域随机化和程序化地形生成等。项目采用声明式配置系统,通过递归实例化机制简化








