logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

基于模型的深度强化学习知识迁移

本文提出一种将基于模型的深度强化学习作为教师、向无模型学习器迁移知识的方法,以提升初始性能、降低样本复杂度并增强安全性。通过改进规划器,确保动作有效性,并在坑洼和半猎豹环境中验证了该方法在收敛速度、渐近性能和样本效率上的优势。

增量式PID在无人机高度控制中的应用构想

本文深入探讨增量式PID控制器在无人机高度控制中的应用,分析其相较于传统PID在抗积分饱和、输出平滑和系统稳定性方面的优势,并结合传感器融合、参数调优与嵌入式实现,展示如何构建高效可靠的飞行控制系统。

基于模型的深度强化学习知识迁移

本文提出一种将基于模型的深度强化学习作为教师、向无模型学习器迁移知识的方法,以提升初始性能、降低样本复杂度并增强安全性。通过改进规划器,确保动作有效性,并在坑洼和半猎豹环境中验证了该方法在收敛速度、渐近性能和样本效率上的优势。

到底了