
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
基于模型的深度强化学习知识迁移
本文提出一种将基于模型的深度强化学习作为教师、向无模型学习器迁移知识的方法,以提升初始性能、降低样本复杂度并增强安全性。通过改进规划器,确保动作有效性,并在坑洼和半猎豹环境中验证了该方法在收敛速度、渐近性能和样本效率上的优势。
增量式PID在无人机高度控制中的应用构想
本文深入探讨增量式PID控制器在无人机高度控制中的应用,分析其相较于传统PID在抗积分饱和、输出平滑和系统稳定性方面的优势,并结合传感器融合、参数调优与嵌入式实现,展示如何构建高效可靠的飞行控制系统。
基于模型的深度强化学习知识迁移
本文提出一种将基于模型的深度强化学习作为教师、向无模型学习器迁移知识的方法,以提升初始性能、降低样本复杂度并增强安全性。通过改进规划器,确保动作有效性,并在坑洼和半猎豹环境中验证了该方法在收敛速度、渐近性能和样本效率上的优势。
到底了







