2301_77127818 个人主页

@2301_77127818

2301_77127818

2023-06-01 17:18:21 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

[人工智能学习]从Word2Vec入手学习神经网络相关知识

RNNLM克服了前馈 NNLM 的某些局限性，例如需要指定上下文长度（模型 N 的阶数）。这段讲的是NNLM首先接受N个词项的输入，每个词项都是one-hot编码，在投影层通过N×D的投影矩阵，然后在隐藏层接着运算，最后输出层回到V，也就是词典的大小，输出表示概率，是进行了归一化操作的，就是概率都在0-1之间，和为1，这里分析了由于投影层数据的稠密性，在投影层和隐藏层计算的复杂度很高，虽然可以在最

#人工智能 #学习 #word2vec

LLAMA-Factory微调大模型（非webui）

本文用来记录利用llama-factory对qwen大模型的微调过程。

到底了