
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文基于 Nerfstudio 实现了对单目视频的三维重建流程,主要使用 nerfacto 模型实现 NeRF 场景重建,并完成 COLMAP 到训练到可视化的完整 pipeline 验证

本期介绍了如何在ROS2 Humble上进行ORB-SLAM3-ROS2的配置。

本文完成了基于 CUDA 与 Transformers 的 Qwen2.5-VL 本地部署,并结合完整代码详细分析了多模态大模型从图片输入、文本编码到最终生成回答的完整推理流程。

本文完成了基于 CUDA 与 Transformers 的 Qwen2.5-VL 本地部署,并结合完整代码详细分析了多模态大模型从图片输入、文本编码到最终生成回答的完整推理流程。

本文围绕 RDKX5 双机ROS2通信系统的搭建过程,完成了从网络层到DDS层的整体配置设计。在网络层通过对两块设备分别配置静态 IP(192.168.10.1 / 192.168.10.2)并启用 eth0 有线直连,实现稳定局域网通信。在 ROS2 层统一设置 `ROS_DOMAIN_ID=10` 并切换至 CycloneDDS 实现通信中间件统一。进一步通过 XML 配置文件对 Cyclon

本文介绍了在 RDK X5 上实现多摄像头视觉推理的方法:通过 V4L2 控制带宽解决 USB 共享问题,利用 ROS2 remapping 区分多路摄像头,并用中间调度节点实现输入源动态切换;结合 shared memory 零拷贝与 codec 转换,完成“多摄像头采集 → 统一推理入口 → DNN 推理 → Web 显示”的低延迟视觉处理流程。

本期我们分析了LeggedRobot类的环境创建逻辑,并且修改代码实现了复杂地形的生成以及对应地形机器人的初始化。

本期我们对 `rsl_rl` 仓库中 PPO 算法的 Python 实现进行了全面解析:从初始化超参数、经验回放缓存、动作采样、环境反馈处理,到优势函数计算与策略更新的完整流程。核心机制包括概率比率裁剪 (`clip`)、GAE 优势估计、价值函数裁剪、防止梯度爆炸、以及可选的自适应学习率和 KL 控制,最终通过组合策略损失、价值损失和策略熵形成完整优化目标,实现对四足机器人稳定且高效的强化学习训

* 本节主要介绍了 PPO,它是在策略梯度和 Actor-Critic 基础上提出的一种稳定强化学习方法。通过Clip Trick限制新旧策略的变化幅度、结合优势函数降低梯度方差,并加入Entropy Bonus保持探索能力,PPO 能够在离散和连续动作空间中稳定训练。

本期我们介绍了用于连续动作空间的强化学习算法 DDPG 与 TD3:其中 DDPG 可以看作 Actor-Critic + Policy Gradient + DQN 技术的结合,而 TD3 则通过 Twin Critic、Delayed Policy Update 和 Target Policy Smoothing 三个改进进一步提升训练稳定性。








