logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

(深入理解)强化学习中on policy和off policy的区别

前言这两个东西区别我个人感觉还挺玄学的。看到有很多说法,但是却感觉说的不是一个东西。就比如有人总是喜欢把off policy分为行为策略和目标策略,说什么行为策略用来探索,目标策略用来学习。但是这个明显是DQN的特征(没学过DQN的有点吃亏哈)所以,甚至官方描述也是用这样的:On-policy: The agent learned and the agent interacting with th

#深度学习#人工智能
(深入理解)强化学习中Model-based和Model-free的区别是什么

强化学习方法分为Model-free和Model-based方法,那么这两种方法的区别在哪:首先我们定义强化学习中的马尔可夫决策过程MDP,用四元组表示<script type="math/tex" id="MathJax-Element-8"></scrip...

#深度学习#人工智能
Pytorch+LSTM+英文语言模型

文章目录1.数据集2.数据读取和预处理3.定义网络4.训练模型5.测试模型6.可视化1.数据集由于计算资源的限制,本文选取的是英文小说《小王子》来进行训练。而且只选取了其5/25章来训练,模型可谓相当小,但是麻雀虽小五脏俱全。数据集下载(已经设置了不需要积分):https://download.csdn.net/download/qq_43391414/20186570。本文语言模型效果:2.数据

#深度学习
语言模型常用的激活函数(Sigmoid ,GeLU ,SwiGLU,GLU,SiLU,Swish)

函数表达式特性应用场景Sigmoid11e−x1e−x1​平滑,梯度消失,单调二分类输出层GeLUx⋅Φxx⋅Φx概率性软开关,平滑,非单调Transformer 模型GLUW1x⊗σW2xW1​x⊗σW2​x门控机制,非线性SwiGLUSiLUW1x⊗W2xSiLUW1​x⊗W2​x结合 SiLU 和 GLU,更灵活大型语言模型(如 T5、Mistral)SiLU/Swishx⋅。

#语言模型#人工智能#自然语言处理
office的word如何书写数学公式(插入符号和latex转换)

以前一直以为word用来书写数学公式是噩梦,所以一直用latex,现在一用,发现真香。office的确很强!、可以按上下左右键,结合鼠标点击,完成数学公式的输入。我感觉挺漂亮的,最重要的是不用记命令。...

python安装Pyro报错:SyntaxError: Missing parentheses in call to ‘exec‘

开门见山,报错的原因就是因为:python2和3的exec方法调用格式不同。起因如下:我要下载一个python库pyro,这个是一个概率编程的库。所以第一想法当然是:pip install pyro结果报上述错误:解决办法:把你的python版本由3版本换成2版本。其实这个相当于没说,因为我们都不会这样做,2版本早就过时了。安装pyro的新版本,我们想啊,只要pyro是一个有价值的库,其一定有人维

#python
自然语言处理基础面试

​ bert的Embedding层由3个子层求和得到,分别是词向量层Token Embedings,句子层Segment Embeddings以及位置编码层Position Embeddings,特别注意的是,bert中的位置编码层是采用随机初始化训练学习得到,和transformer的正弦函数编码不同。原始bert是静态mask,也就是每个epoch训练的内容mask部分都是一致的,这样没法学习

文章图片
#自然语言处理#人工智能
(统计用词)Identifiability可识别性

比如我现在有一个正态分布,只有我知道他的均值和方差,然后我根据这个正态分布采样无数个点,让另外一个人根据这些采样的点来推断正态分布背后的均值和方差。在无数个点的情况下,这个人应该得到。也就是说不能有另外一个均值和方差竟然可以和我们这一个均值和方差采样到一模一样的无数的点。这里的model你可理解为就是一个分布,比如正态分布,其有两个参数。且正确的均值和方差。正态分布是可识别的。

文章图片
#数学
问题1:U盘可以识别但无法打开;问题2:U盘成为启动盘之后如何恢复成普通U盘。

这两个一般都可以通过下述解决:确定我们的U盘的编号是1:然后在命令行中依次输入如下命令:还是在图1那里,对着U盘那里,右键:然后一路下一步即可成功。

#windows
如何使用gensim来加载和使用词向量模型word2vec

0.导入包from gensim.models import keyedvectors1.加载模型w2v=keyedvectors.load_word2vec_format(os.path.join(root_path,"wiki_word2vec_50.bin"),binary=True)2.查看可以对哪些词进行word2vec。w2v.key_to_index3.对一个词进行word2vecw

#python
    共 220 条
  • 1
  • 2
  • 3
  • 22
  • 请选择