logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Ubuntu20.04-查看GPU的使用情况及输出详解

查看GPU的使用情况及输出详解1. 查看GPU的使用情况1.1nvidia-smi1.2nvidia-smi -l1.3watch -n 1 nvidia-smi2. 输出详解2.1 标题部分2.2 GPU 信息部分2.3 性能和功耗部分2.4 内存和利用率部分2.5 进程部分

#linux#ubuntu
Python-封装

python_封装案例

#python#linux#centos +2
强化学习-深度Q网络(第3章)

强化学习-深度Q网络(第3章)深度 Q 网络 革新了强化学习领域。1.在连续控制问题中,不能用表格式的Q数组表示。2.DQN的一个有趣的特性是在训练过程中利用第二个网络,成为目标网络。第二个网络用于生成 target-Q值, 该 target-Q 值用于在训练过程中计算损失函数。3.DQNs 中的一个问题是使用 (𝑠,𝑎, 𝑟,𝑠′, done) 元组的连续样本, 它们是相关的, 因此训练

#深度学习#人工智能
Python-代码阅读-epsilon-greedy策略函数(3)

Python-代码阅读-epsilon-greedy策略函数np.ones(num_actions, dtype=float) / float(num_actions)np.expand_dims(observation, 0)max_Q_action = np.argmax(q_values)A[max_Q_action] = 1.0np.zeros(num_actions, dtype=flo

#python#pycharm#深度学习
Unity-ML-Agents-Soccer Twos环境(1)-SoccerEnvController.cs

1.SoccerEnvController.cs1.1 导入命名空间1.2SoccerEnvController 类1.3 PlayerInfo类1.4XML 注释标签1.5 定义字段1.6Start() 方法1.7FixedUpdate()方法1.8ResetBall()方法1.9GoalTouched()方法1.10ResetScene() 方法

#unity#人工智能
强化学习(2)

强化学习(2)多智能体深度强化学习重要性采样;深度强化学习中的Fingerprints;VPG is an on-policy algorithm;The Spinning Up implementation of VPG supports parallelization with MPI.;幂长度表示所有训练智能体在环境中的每个幂的平均长度;策略损失表示损失函数的平均幅度,与策略(决定操作的过程

#人工智能#机器学习
书生·浦语大模型第二期实战营第六节-Lagent & AgentLego 智能体应用搭建 笔记和作业

书生·浦语大模型第二期实战营第六节-Lagent & AgentLego 智能体应用搭建 笔记和作业

论文解析-基于 Unity3D 游戏人工智能的研究与应用

论文解析-基于 Unity3D 游戏人工智能的研究与应用1.重写AgentAction 方法2.重写CollectObservations 方法3.重写CollectObservations 方法

#unity#深度学习
Python-pop()和popleft()方法

Python-pop()和popleft()函数字典和集合中的 pop() 方法删除元素是无序的,并且在删除时返回被删除的值。列表中的 pop() 方法删除元素是有序的,并且在删除时返回被删除的元素。在使用时,需要根据具体的数据类型和需求选择合适的 pop() 方法。

#python#深度学习#人工智能
Word-首行缩进2字符设置只缩进一个汉字的问题

Word-首行缩进2字符只缩进一个汉字的问题

    共 17 条
  • 1
  • 2
  • 请选择