logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【强化学习入门】n-步Sarsa

算法核心目标 (Target)特点适用场景RγQs′a′RγQs′a′简单,在线更新,方差略大入门首选,快速验证RγEQs′⋅RγEQs′⋅)]消除动作随机性,更稳定想要减少震荡,算力充足时R⋯γnQstn⋅R⋯γnQstn​⋅平衡偏差与方差,视野更广追求极致性能,处理复杂回报延迟GtG_tGt​(累计总回报)无偏差,方差极大,离线只有回合制任务,且对准确性要求高。

文章图片
#机器学习#numpy#人工智能
1.FreeRTOS编程风格——值得学习

学习并遵循这套风格,有利于在自己的项目中编写出更专业、更健壮、更易于团队协作的嵌入式代码。这不仅仅是写代码,更是一种工程素养的体现。FreeRTOS采通过变量名的前缀来明确其数据类型,可以增加代码的可读性。,其他FreeRTOS核心代码和应用代码完全不需要改动。FreeRTOS没有直接使用C语言的标准数据类型(如。:FreeRTOS内部使用的私有函数,其前缀为。)编写的FreeRTOS项目,移植到

文章图片
#c语言#单片机#操作系统
【强化学习】值函数近似——曲线拟合

如果状态空间(State Space)非常大(例如围棋的状态数),或者是连续的(例如机器人关节的角度、速度),表格无法列举所有可能的状态。注:也可以使用非线性函数(如神经网络)来拟合,这属于 Deep RL 的范畴,但基本原理相同:调整。即使使用离散化(网格法),网格太密会导致计算量爆炸(维数灾难),太疏又会丢失精度。为了解决上述问题,我们不再用表格记录每个点的具体数值,而是用一个函数来拟合这些值

文章图片
#算法#机器学习#人工智能
C语言高频面试题——strcpy与memcpy区别

【代码】C语言高频面试题——strcpy与memcpy区别。

文章图片
#c语言#开发语言
C语言高频面试题——strcpy与memcpy区别

【代码】C语言高频面试题——strcpy与memcpy区别。

文章图片
#c语言#开发语言
Matlab绘图(三)——设置图例的位置

1.legend 函数里的 'Location' 参数调整位置2.手动调整位置

文章图片
#matlab#开发语言
MATLAB突然打不开,窗口闪退,一实测可行的方法

上面的文章都提到删除或者重命名**C:\Users\\AppData\Roaming\MathWorks\MATLAB**中当前所装MATLAB版本的文件夹。但是操作下来发现我的电脑中找不到路径,(已经显示了隐藏文件),载后面发现**C:\Users\这里要添加用户名\\AppData\Roaming\MathWorks\MATLAB--

文章图片
#matlab#开发语言
Win11电脑微信打不开公众号文章,显示白屏的解决方法

​电脑一直打不开公众号的文章,下面是我解决问题的过程。

文章图片
#微信#windows#微信公众平台
到底了