logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【读邹伟等著强化学习】第1章~第7章

在阅读邹伟老师的书的时候的思考和疑问

文章图片
python3.10‘, ‘-m‘, ‘ensurepip‘, ‘--upgrade‘, ‘--default-pip‘]‘ returned non-zero exit status 1 怎么办

我在win10的wsl(ubuntu18)下发现如题的问题。经过发现和wsl关系不大。python3 -m venv whatever 了。

文章图片
#pip#ubuntu#linux
邱锡鹏神经网络与深度学习习题第三章解答byMahomet

pdf的版本式30September2019的3-1:决策平面的法向量不就是权重向量\omega嘛3-2:略3-3每次更新\omega的时候都有样本特征向量出现;3-6:我觉得是可以的,因为|sigma的取值范围是0~1,而在这个平方损失函数里正好是单调的3-7:见p64(虽然我没有很明白,如果仅仅从数学上为何要去考虑数值增益的事情,而且要是这样的话,哪怕分两类也要类似考虑):...

邱锡鹏神经网络与深度学习习题第三章解答byMahomet

pdf的版本式30September2019的3-1:决策平面的法向量不就是权重向量\omega嘛3-2:略3-3每次更新\omega的时候都有样本特征向量出现;3-6:我觉得是可以的,因为|sigma的取值范围是0~1,而在这个平方损失函数里正好是单调的3-7:见p64(虽然我没有很明白,如果仅仅从数学上为何要去考虑数值增益的事情,而且要是这样的话,哪怕分两类也要类似考虑):...

邱锡鹏神经网络与深度学习习题2-6和2-7解答byMahomet

(pdf版本:30September2019)2-6:(1)根据定义,极大似然估计应有:因此,对其关于\mu求导并取0,可得(2)根据定义,最大后验分布应有:所以,而对乘积第二项,根据题目给的条件,因此相比\mu^{ML},\mu^{MAP}多了一项\mu-\mu_0。2-7:我的理解是,当N足够多时,人们预先指定的先验分...

邱锡鹏神经网络与深度学习习题2-6和2-7解答byMahomet

(pdf版本:30September2019)2-6:(1)根据定义,极大似然估计应有:因此,对其关于\mu求导并取0,可得(2)根据定义,最大后验分布应有:所以,而对乘积第二项,根据题目给的条件,因此相比\mu^{ML},\mu^{MAP}多了一项\mu-\mu_0。2-7:我的理解是,当N足够多时,人们预先指定的先验分...

邱锡鹏神经网络与深度学习习题2-5解答byMahomet

pdf的版本式30September2019的然后根据对数似然函数,上式加对数并代入正态分布具体表达式:把不含\omega的项提出来视作常系数(注意这里的\sigma也与\omega无关):然后参看式2.36后面处理完全相同。得证。...

邱锡鹏神经网络与深度学习习题2-1、2-2、2-3和2-4解答byMahomet

(pdf版本:30September2019)2-1:参考第75页2-2:参考式2.36,可以将并入和,并形成新的和。可见肯定会影响回归结果。直观上,这种权重还是为的式放大和缩小不同语境下的重要性;2-3:秩只能取行数或列数中较小的那个;2-4:代入即可得证,顺便可以复习矩阵微积分。...

邱锡鹏神经网络与深度学习习题5-1和5-2解答byMahomet

习题5-1:宽卷积的交换性,我看连续性卷积积分的时候随便缓缓就行了,因此这里也差不多。现有(我这里没有用互相关)图中红的为矩阵x,绿的为卷积核根据宽卷积定义而我们的目标图景则是这样的:为了让x的下标形式和w的进行对换,进行变量替换令,故.则已知因此对于由于宽卷积的条件,s和t的变动范围是可行的。习题5-2:...

秋叶Lora训练器遇到NaN detected

需要在保存格式上,不要选fp16,而是选择bf16.

文章图片
    共 11 条
  • 1
  • 2
  • 请选择