酒饮微醉- 个人主页

@hzlalb

酒饮微醉-

2023-03-10 09:46:42 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

进化强化学习

进化强化学习（Evolutionary Reinforcement Learning，简称EvoRL）是一种将进化算法（Evolutionary Algorithms，EAs）与强化学习（Reinforcement Learning，RL）相结合的混合优化方法。它通过融合两种方法的优势，旨在解决传统强化学习和进化算法在复杂优化问题中面临的局限性。核心概念进化强化学习的核心在于利用进化算法的全局搜索

#python #机器学习 #开发语言 +2

学习笔记--离线强化学习（2）

离线强化学习（Offline Reinforcement Learning，简称Offline RL）是深度强化学习的一个子领域，离线强化学习最初英文名为：Batch Reinforcement Learning , 后来Sergey Levine等人在其2020年的综述中使用了Offline Reinforcement Learning（Offline RL）, 现在普遍使用后者表示。

#学习

论文阅读DIFFUSION POLICIES AS AN EXPRESSIVE POLICY CLASS FOR OFFLINE REINFORCEMENT LEARNING

Diffusion-QL有两个主要组成部分:使用扩散模型作为策略：通过将策略建立在条件扩散模型的逆向链上，扩散模型允许构建高度表达的策略类，同时其学习本身作为一种强大的策略正则化方法。Q-学习引导：通过联合学习的Q值函数，将Q-学习引导注入扩散策略的学习中。这使得在探索区域内的去噪采样向最优区域进行导向。

#论文阅读 #机器学习 #学习

进化强化学习

#python #机器学习 #开发语言 +2

论文阅读DIFFUSION POLICIES AS AN EXPRESSIVE POLICY CLASS FOR OFFLINE REINFORCEMENT LEARNING

#论文阅读 #机器学习 #学习

到底了