
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本期我们从训练日志出发,深入解析了 OnPolicyRunner中 log函数的实现,搞清楚了平均奖励、损失函数等指标的计算方式,并结合 TensorBoard对训练过程进行了可视化分析。同时,我们实现了基于手柄输入的实时控制,将训练好的策略应用到实际控制场景中,从而直观验证模型的稳定性与泛化能力,为后续奖励函数优化和策略改进打下基础。

本期我们深入探讨了legged_gym项目中的奖励函数系统,特别是如何通过对机器人动作、状态、环境的各种影响(如线速度、角速度、姿态、碰撞等)进行加权求和来计算总奖励。此外,我们还介绍了如何使用play.py来加载训练好的模型进行测试

本期主要解析了 rsl_rl`仓库中 ActorCritic与 ActorCriticRecurrent的 Python 实现,回顾了 Actor-Critic 的核心原理,重点讲解了 ActorCriticRecurrent 引入 RNN/Memory 模块以增强网络对历史信息的记忆能力,区分了训练和推理模式下隐藏状态的处理,并对网络构建、动作采样、价值评估等函数实现进行了详细剖析,为理解复杂机

本期我们梳理了 unitree_rl_gym`的训练流程,从 train.py的入口到 TaskRegistry的环境与算法创建,再到 LeggedRobotCfg的环境和训练参数配置,全面了解了并行环境、地形设置、动作观测维度、奖励设计和仿真参数,为后续解析 Go2 机器人环境及 PPO 训练闭环打下了基础。

使用JsonCpp库来辅助C++对JSON文件进行读写

本文我们将了如何使用基础的torch.hub.load进行pt/onnx模型的推理使用,并介绍了如何使用export.py进行pt->onnx模型转换,同时介绍了如何使用cv::dnn来加载YOLOV5onnx模型并进行推理和模型输出解析,并手动书写NMS进行后处理优化。

介绍高帧率摄像头往往应用在很多opencv项目中,使用多线程对摄像头进行读取

本文分别讲述了如何使用`C++`分别实现单向链表,双向链表,循环链表,跳表

通过Windows C#的桌面应用程序来做一个学生数据库查询系统,其中学生数据库的信息是存储在Access数据库的文件中,并且我们我们通过SQL实现了对数据库的增删改查

ue5.4.3+vs2022进行ue5cpp教程








