logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

自动文摘(Automatic document summarization)方法综述(四)——基于神经网络的(neural summarization)方法

前三篇博客(一)、(二)、(三)总结了抽取式自动文摘的一些经典方法,传统抽取式自动文摘方法将文档简单地看作是一组文本单元(短语、句子等)的集合,忽略了文档所表达的全局语义,难免“断章取义”。随着算力的提升,深度学习在很多应用中非常的火热也取得了state-of-the-art的性能,因此,将神经网络模型引入自动文摘任务是理所当然的,将文档用神经网络模型进行表示被称为神经文档模型(neural do

不依靠第三方库(除了numpy)实现一个神经网络

现在各种机器学习、深度学习第三方库都有非常成熟高效的神经网络实现,借助这些第三方库,短短几行代码就能实现一个神经网络。但是对于一个机器学习/深度学习的入门者来说,这些代码封装得太过彻底,往往一行代码就能实现BP算法或者梯度下降算法,这导致很多初学者即使掌握了繁复的数学推导后,依旧对神经网络的工作流程没有一个直观的认知。在我看来,自己动手实现一个神经网络,包括BP算法,梯度下降算法等,是将理论应用于

计算图(Computational Graph)的角度理解反向传播算法(Backpropagation)

最近在回看反向传播算法(Backpropagation,BP算法)时,注意到目前各大深度学习框架如Tensorflow,Theano,CNTK等都以计算图(Computational Graph)作为描述反向传播算法的基础。计算图计算图是用来描述计算的语言,是一种将计算形式化的方法。在计算图中,计算被表示成有向图,图中的每一个节点表示一个变量(variable),变量可以是标量(sca...

使神经网络具有记忆力——RNN及LSTM

我们在进行判断决策时,除了会依靠当前的情况,也会调动大脑中的记忆,协同分析。记忆分为长期记忆和短期记忆,短期记忆可以认为是对之前较短时间内发生事件的印象,这对于一些日常生活应用非常的有必要。比如以下两个句子中,“我将在9月10日到达南京”和“我将在9月10日离开南京”,两句话虽然都包含“南京”,但是第一句话中“南京”是目的地,第二句话中“南京”是出发地,做出这个判断的依据是“南京”之前的“到达”和

SenticNet情感词典介绍

在进行情感分析时,一个好的情感词典能够让我们的工作事半功倍,较为出名的情感词典有SentiWordNet,General Inquirer等,这篇博客将介绍另外一个出色情感词典,SenticNet。简介当谈论SenticNet时,我们正在谈论概念层面的情感分析,即通过语义和语言学来完成极性探测、情感识别等任务,而不是单纯的依靠词共现频率。SenticNet可以看作是以下其中一种:1...

ResNet论文阅读---《Deep Residual Learning for Image Recognition》

ResNet论文阅读—《Deep Residual Learning for Image Recognition》作者摘要\quad越深的神经网络训练越困难。我们提出了一个残差学习框架,减轻网络训练的负担,这个网络比目前的大多数网络深得多。我们明确地将每一层重新定义为参照层的输入学习残差函数,而不是学习一个未知的函数。我们提供了全方面的实验数据表明残差网络更加容易优化,并且

概率图之马尔可夫随机场(Markov Random Field,MRF)

现实生活中,许多任务涉及多个因素(变量),并且因素之间存在依赖关系。概率图模型(Probabilistic Graphical Model,PGM)为表示、学习这种依赖关系提供了一个强大的框架,概率图模型在形式上由图结构组成,一个节点(node)表示一个或一组随机变量,节点之间的边(edge)表示变量之间的关系。根据图是有向还是无向,概率图模型可以分为两类:第一类使用有向无环图表示变量之间的因果关

机器学习系列(九)之——模型参数估计(最小二乘估计、最大似然估计、最大后验估计)

给定模型与参数,我们就能对样本空间进行描述。大家很自然地会问,这个描述是不是最不好的呢?我们用什么评价标准判断这个描述的好坏呢?这篇博客将一起探讨这个问题。在统计学中,根据从总体中抽取的随机样本来估计模型未知参数的过程被称为参数估计(parameter estimation)。 常用的参数估计方法有:最小二乘估计,最大似然估计和最大后验估计,其中最小二乘估计用于函数模型的参数估计,最大似然估计和.

#机器学习
Jupyter Notebook配置多个IPython Kernel详细过程记录(IPython与Jupyter Notebook介绍、IPython、Jupyter安装配置)

Jupyter Notebook是一款非常好用的基于浏览器的交互式的代码编写、运行测试以及富媒体(rich media)输出的工具。Jupyter Notebook本质上是一个notebook,并不具备代码执行能力,需要借助其他代码执行内核才能完成代码执行,如执行Python代码的IPython。因此,我们自然而然会想能不能为Jupyter Notebook配置多个kernel呢?本篇博客将从IP

RapidMiner教程

最近接触到一款强大的数据挖掘软件平台RapidMiner,RapidMiner是世界领先的数据挖掘解决方案,通过在图像化界面拖拽建模,轻松实现了数据准备、机器学习和预测模型部署,无需编程,简单易用。下图展示了其工作流程:其具有如下优势:统一的平台。一个平台,一个用户界面,一个系统,支持从数据准备,模型部署到正在进行的模型管理的完整工作流程。可视化工作流设计。 快速易学和方便使用的拖放方...

    共 34 条
  • 1
  • 2
  • 3
  • 4
  • 请选择