2501_93400112 个人主页

@2501_93400112

2501_93400112

2025-12-20 21:52:54 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

从词嵌入到RNN（其一）

本文探讨了神经网络如何处理时序数据（如语言）的核心问题。首先指出图像与语言的根本差异：图像是空间艺术，语言是时间艺术。为解决这一问题，文章介绍了词嵌入技术——用稠密向量表示词语语义特征，通过上下文关系自动学习词义（如Word2Vec模型）。重点阐述了分布式假设：语义相似的词会出现在相似上下文中，模型通过"完形填空"式训练自动捕捉这种模式。这种表示方法使机器能够量化词语间的语义关

#rnn #人工智能 #深度学习

从过拟合到泛化能力

神经网络训练中常见的过拟合问题就像"死记硬背标准答案"，会导致模型在新数据上表现差。文章介绍了五种解决方法：1）提前终止训练；2）降低模型复杂度（奥卡姆剃刀原理）；3）增加训练数据或数据增强；4）正则化（L1/L2）；5）Dropout技术（随机禁用神经元）。这些方法的核心思想是防止模型过度依赖训练数据细节，鼓励学习通用规律。Dropout尤其独特，通过随机让神经元"

#人工智能

计算神经网络参数

本文介绍了机器学习中模型优化的核心概念。通过残差分析解释了"拟合得好"的含义，即最小化真实值与预测值之间的误差。针对绝对值函数在优化中的不足，提出了使用平方误差的解决方案，并引出均方误差这一常用损失函数。重点阐述了梯度下降法的原理：通过计算损失函数对各参数的偏导数（梯度），沿负梯度方向逐步调整参数以最小化损失。最后说明了神经网络中反向传播算法的本质是运用链式法则计算复合函数的导

#神经网络 #人工智能 #算法

到底了