logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【学习笔记】图解大模型

词嵌入使我们能够衡量两个词的语义相似度。使用各种距离度量方法, 可以判断一个词与另一个词的接近程度,含义相似的词往往会更接近。词嵌入可以用多种属性来表示一个词的含义。这些属性组合在一起,是将人类语言转换为计算机语言行之有效的方式。可以为不同类型的输入创建嵌入,如词嵌入和句子嵌入,它们用于表示不同层次的抽象 (词与句子)。自回归(auto-regressive),在生成下一个词时,需要使用先前生成的

#语言模型
笔试回忆-CVTE广州视源-嵌入式应用开发实习生-20180314

概要:20道不定项选择题,2道编程大题21题:(){}的匹配22题:求两个数字字符串的和           char *sum(const char *num1, const char *num2);           num1和num2长度为0-991题:频率为2000HZ,占空比为40%,问一个周期内的宽度? (200us)x题:结构体__attribute__(packed),问该结构体

【学习笔记】图解大模型

词嵌入使我们能够衡量两个词的语义相似度。使用各种距离度量方法, 可以判断一个词与另一个词的接近程度,含义相似的词往往会更接近。词嵌入可以用多种属性来表示一个词的含义。这些属性组合在一起,是将人类语言转换为计算机语言行之有效的方式。可以为不同类型的输入创建嵌入,如词嵌入和句子嵌入,它们用于表示不同层次的抽象 (词与句子)。自回归(auto-regressive),在生成下一个词时,需要使用先前生成的

#学习#人工智能
【学习笔记】大模型

多头注意力(MHA)、多查询注意力(MQA)、分组查询注意力(GQA)、多头潜在注意力(MLA)激活函数(例如 SwiGLU),以提高模型的非线性拟合能力,捕捉更复杂的模式。缓解深层网络中的梯度消失问题,提升模型训练效率。建模序列中不同词元之间的语义关系。提升训练稳定性并加速模型收敛。提升模型的容量和计算效率。进一步提取特征和语义。

#深度学习
网易游戏策划笔试-20190404

1-7题为文案题(答题时请勿参考其他作品),8-23题为数值系统题, 两个方向分别计算分数,最终选择分数更高的方向作为最终成绩,建议优先选择自己擅长或感兴趣的方向进行答题。8、(无需过程)行列式的值是。(共3分)【参考答案:-9】9、(无需过程)已知状态集合{晴天,多云,下雨}T,状态转移矩阵为A,已知今天是晴天,请问后天下雨的概率是。(共3分)【参...

com.fasterxml.jackson.databind.JsonMappingException: No suitable constructor

com.fasterxml.jackson.databind.JsonMappingException: No suitable constructor

#java
到底了