油漆哈奈个人主页

@GLevGC229

油漆哈奈

2026-06-23 15:59:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

SERL：让真机强化学习从“难用”走向“可复现”的强化学习框架 ----（5）工程篇

Frame Stacking 提供了一个微小的时间窗口，让模型具备"前瞻性"，能够补偿掉几毫秒的系统延迟。这种分层结构让高层的策略决策与底层的精确控制解耦。真正让 SERL 的 RL 训练安全可控的，是底层控制逻辑从死板的"位置控制"转向了灵动的"力反馈控制"。策略输出的 action 不再是"刚性移动到 (x, y, z)"，而是"将弹簧的平衡点移到 (x, y, z)"。如果机器人每次 res

#人工智能 #http

到底了