logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

深度学习之循环神经网络(RNN)

本文转自《零基础入门深度学习》系列文章,阅读原文请移步这里一、语言模型RNN是在自然语言处理领域中最先被用起来的,比如,RNN可以为语言模型来建模。那么,什么是语言模型呢?我们可以和电脑玩一个游戏,我们写出一个句子前面的一些词,然后,让电脑帮我们写下接下来的一个词。比如下面这句:我昨天上学迟到了,老师批评了____。我们给电脑展示了这句话前面这些词,然后,让电脑写下接下来的一个词。在这个例子中,接

#神经网络#人工智能
TensorFlow构建模型二

概要本文利用tensorflow构建文本分类模型,数据集使用的是IMDB电影评论文本【数据集地址】,模型主要有四层:模型构建导入所需要的库,以及下载数据集。import matplotlib.pyplot as pltimport osimport reimport shutilimport stringimport tensorflow as tffrom tensorflow.keras im

TensorFlow构建模型(图片数据加载)六

本文内容来源于TensorFlow教程本文主要介绍了三种图片数据的加载和预处理方法:使用高级的Keras预处理工具(如tf.keras.utils.image_dataset_from_directory)和预处理层(如tf.keras.layers.Rescaling)从磁盘的图片目录中加载数据。使用tf.data的框架写你自己的输入通道。在TensorFlow Datasets中从可用的类别加

模型训练中的过拟合\欠拟合

过拟合的如何产生的?过拟合的解决办法欠拟合如何产生的?欠拟合的解决办法

#机器学习
如何处理标签不平衡问题

训练集标签类别不平衡是机器学习模型训练非常常见的一个问题。它是指训练集中标签A和标签B样本数比例差别很大,当要预测小类标签,即使模型的效果特别差,模型预测的准确率也能达到很高的数值。因此,我们需要处理不平衡的数据集,避免这种情况出现。一般情况下,我们需要处理的是极不平衡的问题(比如类别比例在1:100)。在类别不平衡的情况下,关于混淆矩阵评估指标(准确率:accuracy;精确率:precisio

#机器学习
Spark数据分析

在互联网如此发达的今天,每天都有海量的数据产生。通过对这些的数据进行分析,我们可以挖掘出数据中的很多信息,从而获取商业价值。面对如此海量的数据,一般的统计分析技术是无法胜任的,需要使用专门的大数据分析技术。今天我们介绍目前最为流行的数据处理技术—Apache Spark。Spark是一款支持多语言的,为大规模分布式数据处理而设计的一站式引擎,它整合了各种上层库,比如用于机器学习的MLlib、提供交

#数据分析#spark#big data
深度学习模型中的过拟合良方【Dropout】

Dropout是什么?Dropout是深度神经网络优化训练过程的一个算法。是由“AI教父”Geoff Hinton在其论文《Improving neural networks by preventing co-adaptation of feature detectors》中提出并在论文《Dropout: A Simple Way to Prevent Neural Networks from O

#深度学习
机器学习之集成算法

本文介绍的集成学习算法主要的基于决策的集成学习算法:Bagging、Boosting、Stacking。他们的思想都是基于Bootstraping(自助法),是一种有放回的抽样法,是一种非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。根据《机器学习》中的描述,自助法的思路为:给定包含mmm个样本的数据集DDD ,我们对它进行采样产生数据集 D′D'D′:每次随机从DDD中挑选一个样

#机器学习#算法#集成学习
深度学习模型中的过拟合良方【Dropout】

Dropout是什么?Dropout是深度神经网络优化训练过程的一个算法。是由“AI教父”Geoff Hinton在其论文《Improving neural networks by preventing co-adaptation of feature detectors》中提出并在论文《Dropout: A Simple Way to Prevent Neural Networks from O

#深度学习
机器学习之理解模型评估

一、模型评估概述通常机器学习模型训练都分为训练集和测试集,训练集用来训练模型,而测试集用来评估模型效果。例如对于分类模型来说,我们使用准确率来衡量模型的好坏。准确率的定义为在预测中分类正确的样本占样本总数的比例。一般地我们也把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”,在训练集上的误差称为“训练误差”或“经验误差”。在新样本上的误差称为“泛化误差”。而我们最终的目标则是要得到“泛化

#机器学习
    共 30 条
  • 1
  • 2
  • 3
  • 请选择