enndne 个人主页

@m0_74462934

enndne

2024-08-21 14:37:43 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

计算图与反向传播｜Computational Graph and Backpropagation

本文介绍了深度学习中的计算图概念及其在反向传播中的应用。计算图通过节点和边将数学运算可视化，其中前向传播计算输出结果，反向传播则通过局部梯度和链式法则传递梯度。文章通过具体数值案例展示了梯度计算过程，并强调统一反向传播的高效性。最后指出现代深度学习框架通过自动微分简化了开发，同时建议使用数值梯度检查验证自定义算子实现。更多计算机知识可访问博客网站rn.berlinlian.cn。

#人工智能 #数据挖掘 #python +4

依存句法分析｜Dependency Parsing

本文介绍了自然语言处理中两种主流句法分析方法：成分句法分析和依存句法分析。成分句法分析通过嵌套结构组织词语，而依存句法分析则直接描述词间二元关系。文章详细阐述了依存句法的形式化定义、约束条件和关系类型标注，并探讨了如何利用依存结构消除句法歧义（如介词短语附件歧义和协调范围歧义）以及提取语义信息。最后介绍了从传统转移算法到神经网络解析器的技术演进，以及评价解析器的UAS和LAS指标。文章来自作者博客

#word2vec #人工智能 #自然语言处理 +4

解构语义：从词向量到神经分类｜Decoding Semantics: Word Vectors and Neural Classification

本文探讨了NLP分类任务的核心挑战与解决方案。文章首先分析语言的离散符号特性与连续语义之间的矛盾，介绍了从独热编码到分布式表示的演进过程。针对多义词处理难题，提出了线性叠加假说和多原型模型两种解决方案。随后详细阐述了从逻辑回归到深层感知器的分类器演进，包括神经单元、多层架构和目标函数的设计原理。最后以命名实体识别(NER)任务为例，展示了深度神经网络如何通过上下文窗口和特征拼接解决多义性问题。文章

#分类 #数据挖掘 #人工智能 +3

双向循环神经网络｜Bi-RNN（Bidirectional Recurrent Neural Networks）

本文介绍了双向循环神经网络(Bi-RNN)在自然语言处理中的应用。文章通过情感分析案例展示了单向RNN的局限性，即无法利用右侧上下文信息准确理解词义。Bi-RNN通过前向和后向两个独立的RNN层，分别捕获历史信息和未来信息，并通过拼接隐状态实现上下文感知。这种架构显著提升了模型对长难句和复杂语义的理解能力，但不适用于需要预测未来的任务如语言模型。文章还指出Bi-RNN的思想为后来的BERT等模型奠

#rnn #深度学习 #自然语言处理 +4

Bellman Equation｜贝尔曼方程

本文介绍了强化学习中的核心概念——贝尔曼方程（Bellman Equation），它通过递归方式将当前状态的价值表示为即时奖励与未来折扣回报之和。文章首先阐述了从回报到价值的思考过程，引出状态值函数V(s)和状态-动作值函数Q(s,a)，进而详细解释了贝尔曼方程的数学形式及其含义。通过火星探测车的具体实例，展示了如何利用折扣因子γ计算Q值，验证了贝尔曼方程的递归本质。文章强调贝尔曼方程是强化学习的

#人工智能 #python #机器学习 +2

Minkowski Distance｜闵可夫斯基距离

本文介绍了机器学习中常用的距离度量方法，重点阐述了闵可夫斯基距离(Minkowski Distance)作为广义距离度量的普适性。通过调整参数r，它可以退化为多种常见距离：r=1时为曼哈顿距离（适用于离散数据），r=2时为欧氏距离（适合连续空间），r→∞时为切比雪夫距离（强调最大偏差）。文章通过具体计算示例展示了不同r值下的距离差异，并分析了它们在聚类、分类等任务中的应用场景。欢迎访问博客网站rn

#机器学习 #人工智能 #深度学习 +2

循环神经网络RNN｜Recurrent Neural Networks, RNN

本文介绍了循环神经网络(RNN)的核心架构及其在自然语言处理中的应用。首先分析了传统神经网络在处理序列数据时的局限性，然后详细阐述了RNN的权值共享机制和隐藏状态的核心计算公式。文章重点讲解了如何构建RNN语言模型，包括词嵌入、隐藏状态更新和预测输出分布等关键环节。同时介绍了训练RNN时使用的交叉熵损失函数和Teacher Forcing策略，以及随时间反向传播(BPTT)算法的实现原理和优化技巧

#rnn #深度学习 #自然语言处理 +4

Classification: Basic Concepts and Techniques｜分类：基本概念与技术

本文系统介绍了分类任务的基本概念与方法。首先区分了有监督学习和无监督学习，阐述了分类的定义与常见应用场景。然后详细讲解了分类模型构建的完整流程，包括数据收集、预处理、模型选择、训练评估和部署等关键步骤。重点介绍了决策树算法，涵盖Hunt算法、测试条件设计（针对名义、有序和连续属性）、最优划分确定（基尼指数、信息熵等指标）等内容。文章还对比了基础分类器和集成分类器的特点，通过具体示例展示了决策树从训

#分类 #人工智能 #数据挖掘 +4

双向循环神经网络｜Bi-RNN（Bidirectional Recurrent Neural Networks）

#rnn #深度学习 #自然语言处理 +4

RNN的多样化用途｜The diverse applications of RNN

本文介绍了RNN在NLP中的三种典型应用模式：等长序列标注（如词性标注、NER）、句子编码器（如情感分析）和条件语言模型（如机器翻译）。作者通过CS224N课程内容，解析了RNN处理序列数据的核心机制，包括隐藏状态的作用和不同任务下的架构选择。文章强调理解这些基础模式对处理序列问题的重要性，并指出虽然Transformer兴起，但RNN的基本逻辑仍是关键。欢迎访问作者博客rn.berlinlian

#自然语言处理 #人工智能 #机器学习 +3

共 30 条

请选择