m0_73426548 个人主页

@m0_73426548

m0_73426548

2023-03-09 09:46:28 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

一口气看完从零到一构建transformer架构代码一：多头注意力机制

的形状兼容，通常在 Transformer 的自注意力或多头注意力机制中使用。这是 Transformer 自注意力机制的核心实现，适用于编码器、解码器或跨注意力场景。，负责将输入向量线性变换并拆分为多个头的表示。的注意力分数矩阵，每个位置的值是。对应位置向量的点积。

#transformer #深度学习 #人工智能

机器学习项目一：虚假新闻检测

PassiveAggressiveClassifier：适合文本分类的在线学习算法。WordNetLemmatizer：比词干提取更高级的词汇归一化方法。sublinear_tf=True：使用1+log(tf)平滑词频。ngram_range=(1,2)：同时考虑单词和双词组合。先将数据中的text文本每一条都经过上面的文本预处理阶段。TfidfVectorizer：将文本转换为数值特征。3.删

#机器学习 #人工智能

如何在多个GPU中训练非常大的模型？

中小模型：优先使用数据并行+混合精度超大模型：采用混合并行结合激活冲计算。

#人工智能

机器学习-基于KNN算法手动实现kd树

上一章我们将了，这一章我们加上kd树对它进行优化，下面先来讲讲kd树。KD 树（K-Dimensional Tree）是一种高效的K 维空间数据索引结构，主要用于最近邻搜索和范围搜索。