
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
聚类我们前面说过,聚类(clustering)是将数据集划分成组的任务,这些组叫作簇(cluster)。其目标是划分数据,使得一个簇内的数据点非常相似且不同簇内的数据点非常不同。与分类算法类似,聚类算法为每个数据点分配(或预测)一个数字,表示这个点属于哪个簇。1、K 均值聚类k 均值聚类是最简单也最常用的聚类算法之一。它试图找到代表数据特定区域的簇中心(cluster center)。算法交替执行
分类器的不确定度估计我们还没有谈到 scikit-learn 接口的另一个有用之处,就是分类器能够给出预测的不确定度估计。一般来说,你感兴趣的不仅是分类器会预测一个测试点属于哪个类别,还包括它对这个预测的置信程度。在实践中,不同类型的错误会在现实应用中导致非常不同的结果。想象一个用于测试癌症的医疗应用。假阳性预测可能只会让患者接受额外的测试,但假阴性预测却可能导致重病没有得到治疗。scikit-l
神经网络上一章我们学习了感知机。关于感知机,既有好消息,也有坏消息。好消息是,即便对于复杂的函数,感知机也隐含着能够表示它的可能性。上一章已经介绍过,即便是计算机进行的复杂处理,感知机(理论上)也可以将其表示出来。坏消息是,设定权重的工作,即确定合适的、能符合预期的输入与输出的权重,现在还是由人工进行的。上一章中,我们结合与门、或门的真值表人工决定了合适的权重。神经网络的出现就是为了解决刚才的坏消
神经网络(深度学习)虽然深度学习在许多特定的使用场景应用中都有巨大的潜力,但深度学习算法往往经过精确调整,只适用于特定的使用场景。这里讨论一些相对简单的方法,即用于分类和回归的多层感知机(MLP),它可以作为研究更复杂的深度学习方法的起点。MLP 也被称为(普通)前缀神经网络,有时也简称为神经网络。1、神经网络MLP 可以被视为广义的线性模型,执行多层处理后得到结论。还记得线性回归的预测公式为:y
神经网络入门文章目录神经网络入门1、神经网络剖析2、Keras3、电影评论分类:二分类问题总结神经网络的核心组件,即层、网络、目标函数和优化器。1、神经网络剖析训练神经网络主要围绕以下四个方面:层,多个层组合成网络(或模型);输入数据和相应的目标;损失函数,即用于学习的反馈信号;优化器,决定学习过程如何进行。层:深度学习的基础组件神经网络的基本数据结构是层。层是一个数据处理模块,将一个或多个输入张
文章目录1、适配器模式介绍实现步骤 1步骤 2步骤 3步骤 4步骤 52、组合模型介绍实现步骤 1步骤 23、装饰器模式介绍实现步骤 1步骤 2步骤 3步骤 4步骤 54、代理模式介绍实现步骤 1步骤 2步骤 35、享元模式介绍实现步骤 1步骤 2步骤 3步骤 46、外观模式介绍实现步骤 1步骤 2步骤 3步骤 47、桥接模式介绍实现步骤 1步骤 2步骤 3步骤 4步骤 51、适配器模式适配器模式
神经网络入门文章目录神经网络入门1、神经网络剖析2、Keras3、电影评论分类:二分类问题总结神经网络的核心组件,即层、网络、目标函数和优化器。1、神经网络剖析训练神经网络主要围绕以下四个方面:层,多个层组合成网络(或模型);输入数据和相应的目标;损失函数,即用于学习的反馈信号;优化器,决定学习过程如何进行。层:深度学习的基础组件神经网络的基本数据结构是层。层是一个数据处理模块,将一个或多个输入张
处理文本数据我们讨论过表示数据属性的两种类型的特征:连续特征与分类特征,前者用于描述数量,后者是固定列表中的元素。在许多应用中还可以见到第三种类型的特征:文本。举个例子,如果我们想要判断一封电子邮件是合法邮件还是垃圾邮件,那么邮件内容一定会包含对这个分类任务非常重要的信息。或者,我们可能想要了解一位政治家对移民 问题的看法。这个人的演讲或推文可能会提供有用的信息。在客户服务中,我们通常想知 道一条
数据表示与特征工程到目前为止,我们一直假设数据是由浮点数组成的二维数组,其中每一列是描述点的连续特征(continuous feature)。对于许多应用而言,数据的收集方式并不是这样的。一种特别常见的特征类型就是分类特征(categorical feature),也叫离散特征(discrete feature)。这种特征通常并不是数值。分类特征与连续特征之间的区别类似于分类和回归之间的区别,只是
交叉验证与网格搜索前面讨论了监督学习和无监督学习的基本原理,并探索了多种机器学习算法,本章我们深入学习模型评估与参数选择。我们将重点介绍监督方法,包括回归与分类,因为在无监督学习中,模型评估与选择通常是一个非常定性的过程。到目前为止,为了评估我们的监督模型,我们使用 train_test_split 函数将数据集划分为训练集和测试集,在训练集上调用 fit 方法来构建模型,并且在测试集上用 sco