logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

BP神经网络

神经网络(无监督)神经网络主要用来做分类,可以实现无监督的学习。 神经网络由很多神经网络层构成,而每一层又由许多单元组成,第一层叫输入层,中间的叫隐藏层,最后一层叫输出层。最后一层的输出是用来描述测试集的类别,最后预测结果选择最大的那个神经元。每一个神经单元都有一定的能量,作为它的输出。在BP神经网络中,只有相邻神经层的单元之间才有联系,它们的连接有一个权重,其值在[-

#神经网络#机器学习
基于MapReduce编程模型的数据挖掘算法

Mapreduce是一个分布式计算模型,用来解决海量数据的计算问题。首先打个比方,我们要做菜,你切牛肉,我切土豆,这就是“Map”。我们人越多,切得就越快。然后我们把切好的牛肉和土豆放到一起,这就是“Reduce”。(1)  Map阶段将一个大任务分解成小任务,并分发给每个节点,每个节点并行处理这些任务,处理速度很快。实现:读取文件内容的时候对每一行解析成key-value的形

#mapreduce#数据挖掘
分类算法(2) ---- 朴素贝叶斯算法(NB)

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯分类器假设样本每个特征与其他特征都不相关。一. 基于离散变量     下面以一个简单的数据集为例,阐述基于NB的回归/预测模型:           上述三篇文本的词列表如下:         首先可以将上述两篇训练文本(train1和train2),以及一篇测试文本(test1

#机器学习
基于MapReduce编程模型的数据挖掘算法

Mapreduce是一个分布式计算模型,用来解决海量数据的计算问题。首先打个比方,我们要做菜,你切牛肉,我切土豆,这就是“Map”。我们人越多,切得就越快。然后我们把切好的牛肉和土豆放到一起,这就是“Reduce”。(1)  Map阶段将一个大任务分解成小任务,并分发给每个节点,每个节点并行处理这些任务,处理速度很快。实现:读取文件内容的时候对每一行解析成key-value的形

#mapreduce#数据挖掘
数据挖掘之 时间序列分析

时间序列是指按时间顺序排列的一组数据,这些数据有两个特点:趋势和季节性趋势:总体情况        季节性:周期性波动时间序列挖掘的基本思路:根据之前已有的序列数据,发现隐含的规则,来预测后面的发展趋势实现方法:首先对序列进行分割,根据某些特征进行聚类,得到少数几个模式,                将模式进行符号替换,将时间序列转换为符号序列,然后采用序列模式发现算法进行关联挖

#数据挖掘
到底了