logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

linux添加用户后,登录出现错误/usr/bin/xauth: file /home/usr/.Xauthority does not exist

错误原因是添加用户时没有授权对应的目录,仅仅执行了useradd user而没有授权对应的家目录直接将用户目录的用户和组设为该用户chown username:username -R /home/user_dir下次可以通过useradd -m username避免 (-m 自动建立用户的登入目录)...

python label 与 one-hot 之间的互相转换

有时候需要label,比如强化学习的离散动作空间,输出动作索引;有时候需要one-hot,比如训练数据或者输入上一个状态的动作,简单的互相转换还是重要的。通过快速生成:one-hot 转labelnumpy可以通过实现,pytorch 可以通过实现:...

#python#深度学习#人工智能
pip install tensorflow 2 的一些问题

文章目录前言正文前言装tensorflow 2.3的时候遇到了一些问题,记录一下正文问题:DECODER_ERROR_CLASSES += (brotli.error,) AttributeError: module 'brotli' has no attribute 'error'解决:首先将 Anaconda3\envs\xxx\Lib\site-packages\urllib3\respon

anaconda安装环境出现safetyerror

我在安装tensorflow-gpu=1.12时出现了下面的错误:SafetyError: The package for tensorflow-base located at /home/lkf/lkf_u/anaconda3/pkgs/tensorflow-base-1.12.0-gpu_py36had579c0_0appears to be corrupted. The path 'li..

python list与numpy数组效率比较

文章目录前言索引效率比较前言因为经常一训练就是很多次迭代,所以找到效率比较高的操作能大大缩短运行时间,但这方面资料不足,所以自己记录总结一下,有需要再补充索引效率比较有时候我需要一个数组,然后可能会频繁从中索引数据,那么我选择list还是numpy array呢,这里做了一个简单的实验进行比较,环境python 3.6import randomimport numpy as npimport ti

pytorch报错 RuntimeError: 一个被用作梯度计算的变量被inplace操作修改了

文章目录前言正文解决前言改代码的时候遇到这个问题RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation,应该是个小细节。正文所谓inplace操作就是直接修改地址上的值。首先是torch中所有加 _ 的函数,x.squeeze_(),x.

pycharm 远程同步文件与远程运行

文章目录前言准备配置deployment远程运行前言当你厌倦了xftp传文件然后xshell运行服务器上的文件,我觉得可以试试专业版pycharm的远程调试和文件同步功能,主要是两部分,文件同步的 deployment 和远程运行的 ssh interpreter。准备首先你需要在本地创建一个与服务器上项目同名的文件夹,这是你的本地版本,你可以在这修改完,通过deployment上传后再运行即可,

python报错“IndentationError: unexpected indent“的两三解决方法

这个是缩进错误,我们可以通过下面几步解决他:首先检查代码是不是有错误的索引如果没有,全都正确,可以看看是不是使用'''进行了整段的注释,如果是,一定要保证其与上下相邻代码缩进一致,而#就无所谓如果还有错,使用notepad++打开文件,选择视图->显示符号->显示空格和制表符,然后查看是不是有空格与制表符混用的情况点代表空格,箭头是制表符。但如果在vscode中,不论你使用...

Game Theory and Multi-agent Reinforcement Learning 笔记2

文章目录Sequential GamesMarkov Games马尔科夫博弈中的强化学习值迭代Sequential Games多智能体强化学习在有状态转移的环境中进行序列决策。马尔科夫博弈可以看做是MDP在多智能体条件下的扩展,和repeated games到多状态条件下的扩展。如果只有一个agent,马尔科夫博弈变成MDP,如果只有一个状态,马尔科夫博弈变成repeated normal g..

Game Theory and Multi-agent Reinforcement Learning 笔记1

文章目录前言介绍Repeated Games博弈论Normal form games博弈的类型博弈的解决概念强化学习在repeated games学习目标博弈中的Q-learning梯度上升方法前言这是一篇综述性质的文章,里面有个别错字。强化学习最初是针对马尔科夫决策过程(MDP)开发出来的,能使单agent在随机平稳环境(stochastic stationary environment)中..

    共 13 条
  • 1
  • 2
  • 请选择