logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

图解LSTM:NLP时代的旧王

LSTM我们主要把握好它的输入输出,以及门控机制的几个公式,就可以迅速掌握啦。如果之前了解过RNN的小伙伴就会知道,RNN天然有着许多不足,比如梯度爆炸和梯度消失的问题,不能解决长距离依赖。LSTM针对以上几点,通过门控机制对其作出了改进,使得LSTM大放异彩,同时有了很多变种,在NLP领域表现非常出色。

文章图片
#lstm#自然语言处理#人工智能 +4
二十张图带彻底弄懂RNN!

介绍了RNN(循环神经网络)的基础知识和应用场景。RNN作为NLP领域的重要模型,RNN通过循环连接的网络结构处理序列数据,解决了CNN难以处理变长序列的问题。文章详细解析了RNN的四种典型结构(1to1、NtoN、Nto1、1toN)及其工作原理,重点说明了隐状态h的信息传递机制。同时探讨了RNN在机器翻译、情感分析等任务中的应用,以及其存在的梯度爆炸和长距离依赖等缺陷。

文章图片
#人工智能#神经网络#深度学习 +3
彻底搞懂Transformer01:文本到底是怎么转化为数据的?

文章重点讲解了Transformer输入处理的两个关键步骤:词嵌入和位置编码。词嵌入通过将词语映射到高维向量空间来保留语义信息,而位置编码则通过正弦和余弦函数为模型提供位置信息。文中详细说明了词嵌入矩阵的构建方法、维度选择以及位置编码的计算公式,并解释了如何将两者相加作为Transformer的最终输入。这些处理使Transformer能够有效捕捉序列中词语的语义和位置关系,为后续的自注意力机制等

文章图片
#深度学习#自然语言处理#transformer +3
YOLO26:全新的视觉模型来了

YOLO26是新一代计算机视觉模型,专为边缘设备和低算力平台优化。其创新点包括移除DFL模块、实现端到端无NMS推理、采用ProgLoss+STAL提升小目标检测能力,以及使用MuSGDOptimizer优化训练过程,CPU推理速度提升43%。该模型支持分类、检测、分割等任务,适用于机器人、无人机、制造业和嵌入式设备等场景。用户可通过Ultralytics平台快速部署,提供本地训练和直接预测两种使

文章图片
#深度学习#目标检测#神经网络
YOLO26:全新的视觉模型来了

YOLO26是新一代计算机视觉模型,专为边缘设备和低算力平台优化。其创新点包括移除DFL模块、实现端到端无NMS推理、采用ProgLoss+STAL提升小目标检测能力,以及使用MuSGDOptimizer优化训练过程,CPU推理速度提升43%。该模型支持分类、检测、分割等任务,适用于机器人、无人机、制造业和嵌入式设备等场景。用户可通过Ultralytics平台快速部署,提供本地训练和直接预测两种使

文章图片
#深度学习#目标检测#神经网络
手把手教你用LSTM预测股票价格,还挺准。

主要包含四部分内容:1、代码目录结构2、使用方法(如何训练,如何预测)3、代码详解(模型具体的搭建过程)4、结果分析(参数如何调整)

文章图片
#lstm#机器学习#人工智能 +3
彻底搞懂Transformer05:Encoder+Decoder总结篇

本文系统总结了Transformer核心机制的原理与作用。首先回顾了Transformer的关键组件:词嵌入与位置编码解决了并行计算丢失序列位置信息的问题;点积注意力机制通过矩阵乘法高效计算相似度,并采用√dk缩放防止梯度消失;层归一化通过通道级归一化降低BatchSize影响,更适合NLP任务。特别对比了Encoder-Decoder结构的差异:Decoder采用掩码注意力处理目标序列,第二层注

文章图片
#深度学习#自然语言处理#人工智能
实战:手把手教你训练RNN预测函数值

本文介绍了一个使用RNN模型预测三角函数值的简单实现。文章详细说明了如何构建一个3层RNN网络,使用PyTorch的nn.RNN模块实现正弦值到余弦值的预测任务。关键点包括: 模型参数设置:input_size=1(单值输入)、hidden_size=32、num_layers=3 数据生成方法:在π范围内均匀采样300个点作为输入序列 训练过程:使用MSE损失函数和Adam优化器,加入学习率调整

文章图片
#rnn#深度学习#pytorch +3
到底了