susht 个人主页

@susht

susht

2023-12-25 11:01:23 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

BP神经网络

神经网络（无监督）神经网络主要用来做分类，可以实现无监督的学习。神经网络由很多神经网络层构成，而每一层又由许多单元组成，第一层叫输入层，中间的叫隐藏层，最后一层叫输出层。最后一层的输出是用来描述测试集的类别，最后预测结果选择最大的那个神经元。每一个神经单元都有一定的能量，作为它的输出。在BP神经网络中，只有相邻神经层的单元之间才有联系，它们的连接有一个权重，其值在[-

#神经网络 #机器学习

基于MapReduce编程模型的数据挖掘算法

Mapreduce是一个分布式计算模型，用来解决海量数据的计算问题。首先打个比方，我们要做菜，你切牛肉，我切土豆，这就是“Map”。我们人越多，切得就越快。然后我们把切好的牛肉和土豆放到一起，这就是“Reduce”。(1) Map阶段将一个大任务分解成小任务，并分发给每个节点，每个节点并行处理这些任务，处理速度很快。实现：读取文件内容的时候对每一行解析成key-value的形

#mapreduce #数据挖掘

分类算法（2） ---- 朴素贝叶斯算法（NB）

朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。朴素贝叶斯分类器假设样本每个特征与其他特征都不相关。一. 基于离散变量下面以一个简单的数据集为例，阐述基于NB的回归/预测模型：上述三篇文本的词列表如下：首先可以将上述两篇训练文本（train1和train2），以及一篇测试文本（test1

#机器学习

基于MapReduce编程模型的数据挖掘算法

#mapreduce #数据挖掘

数据挖掘之时间序列分析

时间序列是指按时间顺序排列的一组数据，这些数据有两个特点：趋势和季节性趋势：总体情况季节性：周期性波动时间序列挖掘的基本思路：根据之前已有的序列数据，发现隐含的规则，来预测后面的发展趋势实现方法：首先对序列进行分割，根据某些特征进行聚类，得到少数几个模式，将模式进行符号替换，将时间序列转换为符号序列，然后采用序列模式发现算法进行关联挖

#数据挖掘

到底了