logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Transformer,AI时代的基石,伟大的架构革命【NLP系列第四篇】

这是一篇关于Transformer模型的深度技术教程。文章从业界经典的“RNN+注意力”演进切入,详细拆解了Transformer如何通过纯注意力机制实现全并行计算。内容涵盖了自注意力、多头机制、位置编码、残差连接等核心组件的原理与数学公式,并对比了Encoder与Decoder的架构差异。此外,文章还提供了PyTorch的实战代码,演示了从数据准备到模型训练的完整流程,并总结了Post-LN与P

文章图片
#人工智能#transformer#自然语言处理
从零玩转 NLP:分词、文本表示与 Word2Vec 实战【NLP系列第一篇】

这是一篇从实战出发的NLP入门笔记,核心讲解了让计算机“读懂”文字的两个基础步骤:分词与文本向量表示。

文章图片
#自然语言处理#word2vec#人工智能
让神经网络拥有“记忆”:RNN、LSTM 与 GRU 的通俗图解与代码实战【NLP系列第二篇】

本文系统解析NLP核心序列模型RNN、LSTM与GRU的原理与机制,并结合PyTorch提供代码实战与避坑指南,助你轻松掌握长序列建模。

文章图片
#rnn#神经网络#lstm
PyTorch训练避坑指南:从“能跑通”到“跑得好”的完整路径

这是一篇深度解析 PyTorch 模型训练核心机制的实战进阶指南。文章承接快速入门内容,聚焦于将模型从“能跑通”提升至“能跑好”的关键环节,系统性地剖析了深度学习项目中必经的几大核心模块。

文章图片
#pytorch#人工智能#python
到底了