喝凉白开都长肉的大胖子个人主页

@qq_43585760

喝凉白开都长肉的大胖子

2022-10-05 09:09:31 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

常见的几种多智能体强化学习算法

多智能体强化学习（Multi-Agent Reinforcement Learning, MARL，旨在解决多个智能体在共享环境中通过与环境和其他智能体交互来学习最优策略的问题。

分解多目标进化算法评价MOEAD

基于分解的多目标进化算法。该方法将一个多目标优化问题分解为一组单目标优化问题或多个多目标子问题，利用子问题之间的邻域关系，通过协作方式同时优化所有子问题，从而找到整个Pareto面的逼近。通常子问题的定义由权重向量确定，子问题间的邻域关系是通过计算权重向量之间的欧氏距离来确定的。1 MOEA/D提供了一个简单但是有效的方法，那就是将分解的方法引入到多目标进化计算中。

#算法

运筹优化问题-离散优化算法

（heuristic algorithm)是相对于最优化算法提出的。一个问题的最优算法求得该问题每个实例的最优解。也就是说，在允许运行时长足够长的情况下，确保得到一个最优方案。但是大量重要的ILP和INLP问题，并不存在时间的解法，因此，启发式算法可以这样定义：一个基于直观或经验构造的算法，在可接受的花费（指计算时间和空间）下给出待解决组合优化问题每一个实例的一个可行解，该可行解与最优解的偏离程

#算法 #数据库 #前端

自适应大领域搜索算法

概念理解干货 | 自适应大邻域搜索(Adaptive Large Neighborhood Search)入门到精通超详细解析-概念篇优点、步骤和python示例代码自适应大邻域搜索算法参考文献及算法应用[1]王新. 车辆和无人机联合配送路径问题研究[D].大连海事大学,2020.[2]李婷玉. 多商户多车程同城物流配送车辆调度问题研究[D].大连理工大学,2018.[3]张梦颖. 不确定因素下路

#人工智能 #python

强化学习-天授平台

看了文档的评测，tianshou速度快过所有的强化学习库，但是功能上还不够完全，多智能体等算法未实现，可能要考虑转向ray了，ray作为一个分布式框架，就不禁让我想起了spark和mllib令我奔溃的日子。本人因为一些比赛的原因，有使用到强化学习，但是因为过于紧张与没有尝试快速复现强化学习的代码，并没有获得很好的成绩，故尝试用库进行快速复现。上面都是脚本式的运作，将参数定义在args里面相对的方便

#深度学习 #python #机器学习 +1

强化学习是一种什么样的方法，通常可以用来解决什么特点的问题

强化学习（Reinforcement Learning，简称RL）是机器学习的一个分支，其主要关注如何使智能体（Agent）通过与环境的交互学习，以在面临不同情境时做出最优决策。在强化学习中，智能体通过试错过程，通过观察环境的反馈（奖励或惩罚）来调整其行为，从而最大化累积奖励。1.序贯决策问题：强化学习适用于需要按照一系列动作来达到某个目标的问题，这些问题通常是序列型的，每个动作的影响可能取决于

#机器学习 #人工智能

关于总结github上的强化学习代码库（建议收藏，有需要时翻开）

游戏：DRL 在电子游戏领域取得了巨大成功，例如 AlphaGo 和 AlphaZero 在围棋、国际象棋和将棋等棋类游戏中的胜利，以及深度Q网络（Deep Q-Network，DQN）在 Atari 游戏上的表现。这只是深度强化学习应用领域的一部分示例，随着研究的进展和技术的发展，DRL 在更多领域将继续发挥重要作用。

#python

深度强化学习调参技巧

综上所述，深度强化学习调参是一个非常复杂的任务，需要结合具体的任务需求和算法特点来进行调整。通过不断地尝试和实验，结合以上的调参技巧，可以提高模型的性能和训练效果。调整神经网络的结构，包括隐藏层的数量、每层的神经元数量、激活函数的选择等。通常来说，增加网络的深度和宽度有助于提高模型的表现，但也可能增加训练时间和计算成本。不同的环境和任务对算法的表现有着不同的要求，因此需要根据具体情况选择合适的环境

#人工智能 #python #机器学习 +2

在用强化学习解决实时调度问题时，是否可以采用性能较好的工作站训练，然后将结果copy到性能一般的电脑上去实现‘实时调度？

要注意的是，性能较差的电脑可能在模型推理和决策过程中的速度上有一定的限制。在性能一般的电脑上，你可以**加载之前训练好的模型，并根据需要进行实时调度。**由于实时调度通常需要对模型进行推理和决策，而不需要进行大规模的训练，因此性能较差的电脑在这种情况下可能仍然能够满足要求。这可能需要进一步的技术调研和定制化的开发方案，以确保在目标设备上能够成功部署和运行实时调度系统。这种方法可以有效地利用较强的计

#学习 #机器学习 #深度学习 +2

python安装.whl文件

在命令运行窗口（重进一次）先进入python所在的盘,(以我的D盘为例)，直接输入D：，会看到D:>（1）win+R进入命令运行窗口，输入cmd打开命令提示符，接着输入python即可；格式为pip +install+DD.whl，我的就是。（2）pycharm中可以通过所在的环境进行查看；(cd后面的空格不能省)！将你刚刚存的地址输入进去。

#python #开发语言

共 44 条

请选择