logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

pandas扩展:apply自定义函数、分组进阶(五大核心)、透视表

Pandas中的apply()函数和向量化操作是数据分析的核心工具。apply()允许对DataFrame/Series应用自定义函数,适用于复杂逻辑处理,如条件判断、多列计算等,提供灵活性和代码复用性。向量化操作则通过内置函数一次性处理整个数组,显著提升性能(比循环快10-100倍),适用于数学运算、统计计算和字符串处理。实际应用中应优先使用向量化方法,仅在需要复杂逻辑时使用apply()。两者

文章图片
#pandas#python#开发语言
【NLP 入门必看】文本预处理全流程详解:从分词到词向量,一篇打通任督二脉!

本文系统介绍了NLP文本预处理的六大核心模块:1)文本处理基本方法(分词、命名实体识别、词性标注);2)文本张量表示(one-hot、Word2Vec、Word Embedding);3)文本数据分析(标签分布、句子长度、词云);4)文本特征处理(n-gram、长度规范);5)数据增强方法(回译);6)实战代码与可视化。重点讲解了中文分词工具jieba的使用、词向量训练方法对比(Word2Vec

文章图片
#自然语言处理#人工智能
深度学习入门:一文搞懂循环神经网络(RNN)原理与实战

深度学习入门:循环神经网络(RNN)原理与应用 摘要:本文介绍了循环神经网络(RNN)在处理序列数据中的核心作用,包括自然语言处理(NLP)基础、词嵌入技术、RNN原理及改进方案(LSTM/GRU)。文章首先解释了RNN在文本预测、机器翻译等任务中的必要性,然后详细讲解了词嵌入层如何将文字转化为向量表示。重点剖析了RNN的记忆机制和计算过程,指出其局限性并介绍了LSTM和GRU的改进方案。最后通过

文章图片
#深度学习#rnn#人工智能
深入理解RNN及其变体:从传统RNN到LSTM、GRU(附PyTorch实战)

深入理解RNN及其变体:从传统RNN到LSTM、GRU(附PyTorch实战) 本文系统介绍了循环神经网络(RNN)及其改进模型LSTM和GRU的原理与应用。RNN通过循环结构处理序列数据,但存在梯度消失问题。LSTM引入细胞状态和三个门控机制(遗忘门、输入门、输出门)有效缓解了这一问题。GRU作为简化版LSTM,仅用更新门和重置门就实现了相近性能。文章结合PyTorch代码演示了RNN、LSTM

文章图片
#rnn#lstm#gru
深度学习入门:一文搞懂循环神经网络(RNN)原理与实战

深度学习入门:循环神经网络(RNN)原理与应用 摘要:本文介绍了循环神经网络(RNN)在处理序列数据中的核心作用,包括自然语言处理(NLP)基础、词嵌入技术、RNN原理及改进方案(LSTM/GRU)。文章首先解释了RNN在文本预测、机器翻译等任务中的必要性,然后详细讲解了词嵌入层如何将文字转化为向量表示。重点剖析了RNN的记忆机制和计算过程,指出其局限性并介绍了LSTM和GRU的改进方案。最后通过

文章图片
#深度学习#rnn#人工智能
深度学习入门:一文搞懂卷积神经网络(CNN)原理与实战

深度学习入门:卷积神经网络(CNN)原理与实战 本文系统介绍了卷积神经网络(CNN)的核心原理与应用。主要内容包括: 图像基础:解析图像在计算机中的三维数组表示(高度×宽度×通道) CNN结构:详述卷积层(特征提取)、池化层(降维)和全连接层的工作原理 关键计算:提供特征图尺寸计算公式,说明padding和stride的作用 PyTorch实现:演示如何用代码构建CNN模型进行图像处理 应用场景:

文章图片
#深度学习#cnn#人工智能
到底了