槑紫奇奇个人主页

@weixin_43336108

槑紫奇奇

2023-07-25 16:25:31 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

深度强化学习算法PPO训练Pendulum

returnadv = 0print('状态空间维度：', state_n)print('动作空间维度：', action_n)steps = []if done:breakif done:breakelse:steps = []if done:break。

#算法 #人工智能 #python +1

深度强化学习gym和pytorch安装最全教程

#pytorch #人工智能 #python +1

深度强化学习算法PPO训练CartPole

return# 蒙特卡洛求优势函数，方差大，时序差分求优势函数，偏差大，一般都采用GAE（蒙特卡洛和时序差分的结合）# 磨菇书采用的是蒙特卡洛if done:print('状态空间维度：', state_n)print('动作空间维度：', action_n)steps = []if done:breakif done:breakelse:steps = []if done:break。

#算法 #人工智能 #python +2

jupyter python 绘图中文设置

【代码】jupyter python 绘图中文设置。

#python #jupyter #ide

一文读懂似然、概率、极大似然法

比如现在创业了1000次，结果成功90次，失败910次，我们可依据这个结果来判断创业失败率91%，成功率9%，这个过程就是根据结果去判断环境参数。来预测某件事情发生的可能性，比如创业成功率10%，失败率90%（这是自定义的哈），在创业前我们并不知道会成功还是失败，只能说成功的可能性有10%。比如现在有一个参数未知的概率模型和该概率模型产生的一些点，那极大似然法就是在根据这些点去求解该概率模型的参数

#数据挖掘 #人工智能

机器学习算法（一）模型评估

划分训练集与测试集（训练集约占2/3~4/5）（1）保证训练集测试集类别比例相似；：（1）划分数据集为k个子集，每次训练k-1个子集，测试剩下的子集（极端情况是留一法）（2）p次划分，重复实验取平均值。训练误差小，测试误差（泛化误差的近似，即在新样本上的误差）小。ROC面积是AUC，越接近于（0，1），模型越好。

#机器学习 #算法 #人工智能

大模型chagpt原理（持续更新）

根据李宏毅课程可知，大模型chatgpt基本原理分为三步（每一步都是在做文字接龙，但训练资料不同）对资料进行去重，劣质优质划分，过滤等操作，将资料划分为一笔笔训练样本基于模型生成的几个答案进行打分，若打分较高，则微调模型参数，使得模型生成打分高的答案概率较高

#人工智能

Python与Matlab/Simulink交互（三）

python与simulink交互完整版代码。

#python #matlab #开发语言

ubuntu系统服务器离线安装python包

查看服务器属于x_86架构还是arm架构、cpython还是pypy。

#服务器 #运维

pytorch（gpu版本安装）

#pytorch #人工智能 #python

共 18 条

请选择