logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【文献阅读】用迁移学习促进竞争影响最大化中的强化学习

本文提出了一种基于TV-CLT模型的迁移学习强化学习方法来解决TC-CIM问题。具体来说,我们将源网络和目标网络的状态表示归一化,以便有效地利用源网络上获得的知识。进一步,我们在RL域扩展了TL的起点方法,提出了NSQ-TL算法来解决源目标网络和代理设置之间的异构性。

文章图片
#机器学习#贪心算法#人工智能 +2
【ClaudeCode】——使用技巧

【ClaudeCode使用技巧摘要】 ClaudeCode是一款智能开发辅助工具,主要提供以下使用技巧: 通过创建CLAUDE.md文件自定义设置,记录常用命令、代码风格和项目规范等关键信息,支持多级目录放置。 调优CLAUDE.md文件内容,可通过#键快速记录指令,并定期优化以提高遵循效果。 灵活管理工具权限,支持通过命令、配置文件或CLI标志控制Claude的访问权限。 扩展工具集:与bash

文章图片
#编辑器#bash#python +2
【ClaudeCode】——使用技巧

【ClaudeCode使用技巧摘要】 ClaudeCode是一款智能开发辅助工具,主要提供以下使用技巧: 通过创建CLAUDE.md文件自定义设置,记录常用命令、代码风格和项目规范等关键信息,支持多级目录放置。 调优CLAUDE.md文件内容,可通过#键快速记录指令,并定期优化以提高遵循效果。 灵活管理工具权限,支持通过命令、配置文件或CLI标志控制Claude的访问权限。 扩展工具集:与bash

文章图片
#编辑器#bash#python +2
【强化学习】—— Q-learning算法

Q-learning 是一种无模型的强化学习算法,用于寻找最优策略以最大化累积奖励。它通过学习一个状态-动作值函数Qsa,该函数表示在状态 ( s ) 下执行动作 ( a ) 的预期收益。

文章图片
#算法#深度学习#神经网络
到底了